精品推荐
火车采集器V7版

火车采集器2013 V7版是官方免费的专业网站数据采集/信息挖掘处理软件,通过灵活的配置,可以很轻松迅速地从网页上抓取结构化的文本、图片、文件等资源信息,可编辑筛选处理后选择发布到网站后台,各类文件或其他数据库系统中。被广泛应用于数据采集挖掘、垂直搜索、信息汇聚和门户、企业网信息汇聚、商业情报、论坛或博客迁移、智能信息代理、个人信息检索等领域,适用于各类对数据有采集挖掘需求的群体。

火车采集器V7版软件功能特性:
1、无限级多页采集,可以实现无限深度的采集
2、任务队列运行管理,支持Cron表达式
3、无限级分组任务管理,任务回收站功能
4、RSS地址采集功能
5、列表页分页采集获取功能
6、列表页附加参数获取功能
7、列表页及标签XPath可视化提取功能
8、标签纯正则替换功能
9、Http接口查看运行情况
10、导出记录为单个或多个Txt、html 文件
11、标签间自由组合功能
12、针对标签内容继续发送Http请求功能
13、无限级列表网址采集
14、从Http头信息中获取数据
15、标题内容正文提取功能
16、Aspx列表分页自识别
17、多网站站群式web发布
18、导出记录为Word格式
19、导出所有记录为Excel格式
20、使用随机二级代理服务器(支持Socket代理)
21、多扩展间数据交换功能
22、下载的图片自动加增强型水印功能
23、Ocr识别(图片转化为文字)
24、Http接口管理采集器运行
25、Mongodb数据库保存数据
26、主从服务器分布式采集
 
火车采集器V7.7 官方更新说明:
1.修复使用一边采一边发时不执行采集完成后操作的bug.
2.增加了使用mssql做本地数据库时给id加了索引
3.批量处理中添加了“当所有的发布方式中所有配置都发布成功才标记数据为已发”
4.生成txt或html文件时,处理了个别情况下在记事本中显示小黑块的问题
5.修复探测文件下载时,单条地址的必须包含选项没有生效的BUG
6.修复补全网址时,遇到thunder://这种情况的处理不正确的问题
7.增加多页提取的限时。

更多
相关推荐
H5游戏在线玩
共有0位网友发表了评论 网友评论
(请文明发言!)
猜你喜欢
猜你喜欢
猜你喜欢