首页 > 代码库 > jericho解析html
jericho解析html
1.导入jar包
2.实现源代码
package com.zhishang.lucene; import net.htmlparser.jericho.Element; import net.htmlparser.jericho.HTMLElementName; import net.htmlparser.jericho.Source; import org.junit.Test; import java.io.File; import java.io.IOException; /** * Created by Administrator on 2017/7/8. */ public class HtmlBeanUtil { @Test public void parseHtml(){ String path = "G:\\data\\index.html"; try { Source sc = new Source(new File(path)); Element element = sc.getFirstElement(HTMLElementName.TITLE); System.out.println(element.getTextExtractor().toString()); System.out.println(sc.getTextExtractor().toString()); } catch (IOException e) { e.printStackTrace(); } } }
本文出自 “素颜” 博客,请务必保留此出处http://suyanzhu.blog.51cto.com/8050189/1945451
jericho解析html
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。