虎窝

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 7163|回复: 0
收起左侧

[交流] Java开源Web爬虫 ItSucks 介绍

[复制链接]

1254

帖子

441

广播

9

日志

钻石会员

程序猿

Rank: 6Rank: 6

积分
19880

灌水之王

QQ
发表于 2018-4-25 19:11:16 | 显示全部楼层 |阅读模式

加入虎窝,互动交流,结交好友,体验更多功能,一起玩转虎窝社区。

您需要 登录 才可以下载或查看,没有帐号?快速注册

x


ItSucks

ItSucks是一个java web spider(web机器人,爬虫)开源项目。支持通过下载模板和正则表达式来定义下载规则。提供一个swing GUI操作界面。



这个项目是一个java网络蜘蛛(Web Crawler)与下载功能(恢复)文件。它是高度可定制的正则表达式和下载模板。

该应用程序还提供了一个Swing GUI和控制台界面。所有的后台功能是在一个单独的图书馆也可以,他们可以很容易地用于其他项目。


API文档

  1. http://itsucks.sourceforge.net/apidocs/0.4.1/
复制代码



官网

  1. http://itsucks.sourceforge.net/
复制代码




加入虎窝吧,我们一起交流!

QQ|手机版|小黑屋|虎窝 ( ICP安备 闽ICP备12002928号 | 公网安备 闽公网安备 35042502000103号 | 互联网举报中心 互联网举报中心 )

GMT+8, 2019-8-26 11:52 , Processed in 0.032374 second(s), 16 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2018 Comsenz Inc.

快速回复 返回顶部 返回列表