`
kaidi0314
  • 浏览: 83159 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

java解析html工具

阅读更多
1、jsoup 比较好用
Java 程序在解析 HTML 文档时,相信大家都接触过 htmlparser 这个开源项目,我曾经在 IBM DW 上发表过两篇关于 htmlparser 的文章,分别是:从 HTML 中攫取你所需的信息和 扩展 HTMLParser 对自定义标签的处理能力。但现在我已经不再使用 htmlparser 了,原因是 htmlparser 很少更新,但最重要的是有了 jsoup 。
jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据
参考教程:http://www.ibm.com/developerworks/cn/java/j-lo-jsouphtml/index.html?ca=drs-#

2、 dom4j
使用Tidy 把html转成xml,然后用dom4j 解析xml;

3、 xalan

4、NekoHTML+HttpClient
分享到:
评论

相关推荐

    java解析html工具htmlparser的jar包及api文档

    用于解析html的java开源工具,很有用

    java 解析 html

    java解析网页,可以根据标签的路径获取网页的内容 比如html/body/div/div/

    html解析工具

    java实现对html解析,实现通过id,class等tag进行解析。

    java 解析 chm 文件

    java 解析 chm 文件 生成 html 解析 chm 文件

    java html解析 工具jsoup和一个简单例子

    Java解析html的实用工具jsoup和它一个简单的例子,方便使用jsoup进行html的解析

    Java HTML解析类

    纯Java写的html解析类,解析为自上而下顺序解析。解析效率一般,不支持js,可以满足日常使用。

    java html解析

    java的 html解析工具,使用时直接将包添加到工程即可

    HTML解析框架 Jsoup

    jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

    Java正则表达式详解+基于HTMLParser解析HTML网页

    如何在Java程序中利用正则表达式实现对字符串的解析.另外,HTMLParser是一款很强大的对HTML网页进行解析的工具,其中大量地用到正则表达式.

    java解析html

    NULL 博文链接:https://wangtianhui.iteye.com/blog/2023988

    jsoup Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容

    jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

    JAVA工具包大全

    提供CSV文件解析、EXCEL文件解析、XML解析、JSON解析、HTML解析的相关功能。 phrase(词语包): 提供关键词过滤、汉语拼音解析的相关功能。 queue(队列包): 提供Kafka队列操作的相关功能。 other(其它)...

    java解析XML

    为了解析HTML,然后学习解析XML,这个是以前写的工具类,附带XML

    Java解析HTML之NekoHTML

    NULL 博文链接:https://rensanning.iteye.com/blog/1551831

    jsoup.jar 优秀的文档解析工具

    清晰的html文档解析框架,包括DOM tree的生成,以及优秀简介的选择器引擎设计

    OFD转换PDF、IMG、SVG、HTML工具JAR包

    OFD文档转换支持 ...HTML转换: 使用上述SVG矢量图形转换作为显示效果层A,再将OFD文档中的文字(仅)解析为SVG作为文字复制层B,B置于A层之上,文字颜色transparent,无需关心字体,在移动端同样正常显示。

    Java代码检查工具PMD

    PMD是一款采用BSD协议发布的Java程序代码检查工具。该工具可以做到检查Java代码中是否含有未使用的变量、是否含有空的抓取块、是否含有不必要的对象等。该软件功能强大,扫描效率高,是Java程序员debug的好帮手。  ...

    java将markdown文档转换成html,生成左侧目录

    借鉴了网上各位大牛分享的md转html,有前端小伙伴的帮忙,共同研发出了一个小工具,将markdown文档转换成html,左右结构,左侧目录,右侧文档 请先阅读readme

    Cobra (HTML工具包源码)

    Cobra是一个HTML工具包。它包含一个纯Java HTML DOM 分析器和一个页面表现引擎。Cobra支持HTML4,Javascript 和CSS2。

    Java实现HTML页面转PDF解决方案

    首先,当然是找到能够解析PDF的完美组件,百度和谷歌不约而同的告诉我们。IText是王道。...那我要做的是能完美解析HTML+CSS的PDF生成工具。这时候flying-saucer进入了我的选择范围中。  http://cod

Global site tag (gtag.js) - Google Analytics