用jericho jar包来解析HTML页面示例

xiaoxiao2021-02-28 98

import net.htmlparser.jericho.Element; import net.htmlparser.jericho.HTMLElementName; import net.htmlparser.jericho.Source; import java.io.File; import java.io.IOException; public class HtmlBeanUtil { public void parseHtml() { String path = "G:\\data\\index.html"; try { Source sc = new Source(new File(path)); sc.getFirstElement(HTMLElementName.TITLE); System.out.println(firstElement.getTextExtractor().toString()); System.out.println(sc.getTextExtractor().toString()); } catch (IOException e) { e.printStackTrace(); } } }

转载请注明原文地址: https://www.6miu.com/read-62388.html

技术

最新回复(0)