您的位置: 首页 > 网络软件 > 网络辅助
  • 火车采集器 v7.6 Build 1210
软件大小:29.68MB软件类别:国产软件
软件语言:简体中文 运行环境:/Win9X/2000/XP/2003/Vista/WIN7
软件评级:更新时间:2012-12-10 16:18:24
软件授权:免费软件插件情况:
相关链接:Home Page 演示地址:Demo Url
  • 软件介绍
火车采集器(软著登字0144474号,2009SR017475)是一款专业的网络数据采集/信息挖掘处理软件,通过灵活的配置,可以很轻松迅速地从网页上抓取结构化的文本、图片、文件等资源信息,可编辑筛选处理后选择发布到网站后台,各类文件或其他数据库系统中。被广泛应用于数据采集挖掘、垂直搜索、信息汇聚和门户、企业网信息汇聚、商业情报、论坛或博客迁移、智能信息代理、个人信息检索等领域,适用于各类对数据有采集挖掘需求的群体。



火车采集器专注于数据采集领域,致力于帮助各类互联网企业,站长,网站编辑等提供数据采集解决方案及消除采集技术难题。积累了十万余免费客户及近万名商业客户,产品及解决方案被华为软件、阿里巴巴、网易、酷六网、中国科学技术信息研究所、总装备部宣传部等使用并认可,并长期为国内知名互联网企业提供数据采集方案。自2005年11月21日发布第一版以来,经过六年多数十次的更新换代升级,新发布的基于火车头数据采集平台的火车采集器V7版已形成具有非常完善及强大的功能特性,以通用好用和良好的口碑著称。



火车采集器程序功能上支持采集需要登录查看的内容,支持探测文件真实地址并下载远程文件,支持二级随机代理,支持采集数据直接入库和模仿手工发布等许多功能特点。同时又具有无限级网址采集、无限级多页和分页规则采集、POST采集、图片文件添加水印、XPath可视化提取、正文识别、OCR图形图像识别,同义词转换翻译伪原创等高级采集发布功能,可以完成您在浏览器内能看到的各类信息的提取。强大的php和c#插件接口支持,让您可以通过二次开发实现您对数据的萃取要求、定时任务及分布式采集客户端又能保证您对数据的及时性及数据量的要求。



火车采集器V7.0经过一年的开发,终于和大家见面了。新版本对程序进行了完全的重构,升级为全新的采集平台。软件也更名为 火车头数据采集平台 。火车采集器是火车头数据采集平台的默认扩展。以后大家可以在该平台上运行论坛采集器,微博采集器,站群客户端,XX采集器。企业用户还可以使用我们提供 的API,开发有自己特色的采集器在平台上使用。



火车采集器 v7.6 build 20120912 的修改有:

1.修复UBB处理中部分空白字符显示为问号的BUG
2.探测文件并下载时部分图片地址探测问题的修复。
3.包含和不得包含增加了全部包含和全部不包含功能,用↑做分隔符
4.修复部分特殊情况下无法抓取cookie的一个问题。
5.修复多页分隔符错误的bug
6.修复导入错误代理地址后程序退出的bug
7.修复文件探测时部分不规范下载地址添加下载失败的问题
8.修复旧版规则中有文本网址时导入失败的bug
9.HttpPostGet工具的一些问题的修改,支持有参数的多次提交。
10.修复出现colum 字段名 is not uniqueInt32 的bug.已出现此问题的用户请先在该字段上加不得重复,然后保存后再去除不得重复并保存即可。
11.http服务器增加了ocr调用和正文识别调用。

关于我们 - 媒体报道 - 版权声明 - 帮助(?) - 广告服务 - 联系我们 - 友情链接 - logo设计
Copyright © 2007-2009 www.55.la 我拉网 版权所有