首页 > 代码库 > java 对于url地址的实体符号的处理
java 对于url地址的实体符号的处理
<!-- https://mvnrepository.com/artifact/org.apache.commons/commons-lang3 <dependency> <groupId>org.apache.commons</groupId> <artifactId>commons-lang3</artifactId> <version>3.4</version> </dependency> --> public static String getNextPage(String web) throws Exception { HttpComponentsClientHttpRequestFactory factory=new HttpComponentsClientHttpRequestFactory(); // factory.setConnectTimeout(60000); // factory.set String regx="上一页</a>)(<a.*?href=http://www.mamicode.com/[///"‘]?(((http|https)?://)?/?[^\\\"‘]+)[\\\"‘]?.*?>(.+)</a>"; RestTemplate template=new RestTemplate(); URI uri=new URI(URLDecoder.decode(web,"utf-8")); String stri = template.getForObject(uri, String.class); Pattern pattern=Pattern.compile(regx); Matcher matcher = pattern.matcher(stri); matcher.find(); String group = matcher.group(); group = group.substring(group.indexOf("href=http://www.mamicode.com/"/") + 7, group.indexOf("\" title=\"")); group="http://www.youbianku.com/"+group; group= StringEscapeUtils.unescapeHtml4(group); return group; }
java 对于url地址的实体符号的处理
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。