用jericho jar包来解析HTML页面示例

xiaoxiao2021-02-28  89

import net.htmlparser.jericho.Element; import net.htmlparser.jericho.HTMLElementName; import net.htmlparser.jericho.Source; import java.io.File; import java.io.IOException; public class HtmlBeanUtil {      public void parseHtml() {          String path = "G:\\data\\index.html";          try {              Source sc = new Source(new File(path));              sc.getFirstElement(HTMLElementName.TITLE);              System.out.println(firstElement.getTextExtractor().toString());              System.out.println(sc.getTextExtractor().toString());          } catch (IOException e) {              e.printStackTrace();          }     } }
转载请注明原文地址: https://www.6miu.com/read-62388.html

最新回复(0)