精品推荐
火车采集器

火车采集器是一款专业的网络数据采集/信息挖掘处理软件。火车采集器通过灵活的配置,可以很轻松迅速地从网 页上抓取结构化的文本、图片、文件等资源信息,可编辑筛选处理后选择发布到网站后台,各类文件或其他数据库系统中。被广泛应用于数据采集挖掘、垂直搜索、 信息汇聚和门户、企业网信息汇聚、商业情报、论坛或博客迁移、智能信息代理、个人信息检索等领域,适用于各类对数据有采集挖掘需求的群体。

 

火车采集器特色介绍:

1、分布式高速采集:任务分配至多个客户端,同时运行采集,效率倍增。

2、多识别系统:配备正文识别、中文分词识别、任意编码识别等多种识别系统,智能识别操作更轻松。

3、可选验证方式:可选择是否使用加密狗,随时保障数据安全。

4、全自动运行:无需人工值守操作,任务完成后自动关机。

5、替换功能:同义,近义词替换、参数替换,伪原创必备技能。

6、任意文件格式下载:图片、压缩文件、视频等任意格式的文件都能轻松下载。

7、采集监控系统:实时监控采集,确保数据的准确性。

8、支持多数据库:支持Access/MySQL/MsSQL/Sqlite/Oracle多种类型的数据库保存及发布。

9、无限级多页采集:支持包含ajax请求数据在内的多个页面信息的无限级采集。

10、支持扩展:支持接口和插件扩展,满足各种采发需求。

 

火车采集器 v9.3.161221 更新日志:

1、修复一个当使用火车浏览器采集cookie时,与采集器处理冲突导致程序退出的问题。

2、修复任务编辑框,当未进行任何编辑时,仍然弹出保存对话框的问题。

3、标签组合时,支持对于循环获取新纪录的支持。

4、修复列表页标签,在重新开始任务后,未能加载“探测下载”的问题。

5、在任务编辑中,编辑Web,数据库发布模块时,增加对于任务标签的支持。

6、修复边采集边发布时,对于Id标签,未能正确发布的问题。

7、修复一个任务完成之后,下载列表显示为空白的问题。

8、对于网址库增加压缩方案,修复在网址库数据过大时,任务加载很慢的问题。

9、数据库的发布模块中,现在可以支持(insert ignore)语句

10、其他一些bug修复。

更多
相关推荐
H5游戏在线玩
共有0位网友发表了评论 网友评论
(请文明发言!)
猜你喜欢
猜你喜欢
猜你喜欢