我们知道采集就是把别人网站上的信息直接照搬到我们自己的网站上,这样可为我们刚开起来的网站丰富下内容,看起来网站才像个网站。如何采集别人的内容呢?这是初学者都难操作,有的更难理解的一个问题。
火车采集器是一款专业的网络数据采集/信息挖掘处理软件,通过灵活的配置,可以很轻松迅速地从网 页上抓取结构化的文本、图片、文件等资源信息,可编辑筛选处理后选择发布到网站后台,各类文件或其他数据库系统中。被广泛应用于数据采集挖掘、垂直搜索、 信息汇聚和门户、企业网信息汇聚、商业情报、论坛或博客迁移、智能信息代理、个人信息检索等领域,适用于各类对数据有采集挖掘需求的群体。
企业版 和 免费版 功能对比:软件功能区别
免费版
个人版
标准版
旗舰版
企业版
V8版本新增项自定义语法生成网址下载ftp中的文件发布扩展更新远程采集规则POST采网址文本搜索网盘上传二级代理页面缓存增加EXCEL数据导入标签处理运行C#代码V7版本新增项无限级多页采集任务队列运行管理功能无限级分组任务管理,任务回收站功能RSS地址采集功能列表页分页采集获取功能列表页附加参数获取功能列表页及标签XPath可视化提取功能标签纯正则替换功能Http接口查看运行情况[注2]导出记录为单个或多个Txt、html 文件[注1]标签间自由组合功能针对标签内容继续发送Http请求功能无限级列表网址采集最多两级从Http头信息中获取数据标题内容正文提取功能Aspx列表分页自识别多网站站群式web发布导出记录为Word格式导出所有记录为Excel格式随机二级Http代理服务器下载的图片自动加增强型水印功能Ocr识别(图片转化为文字)Http接口管理采集器运行[注2]Mongodb数据库保存数据主从服务器分布式采集[注2]V2010版功能项多任务,多线程运行多页采集,内容分页采集功能标签循环采集下载图片文件列表缩略图及列表页标签采集自动提取内容缩略图正则使用,自定义规则获取网址支持网站登录采集网页及地址编码自动识别网页压缩,跳转采集自定义User-Agent,模仿蜘蛛采集支持使用代理服务器采集数据自动摘要,自动拼音html标签排除采集记录筛选任务运行日志自动提取内容第一张图WEB在线发布模块编辑修改使用post方法获得采集网址随机文件夹保存下载文件文件下载续传 *数据库发布模块编辑器 *ACCESS数据库保存数据迅雷和FlashGet的地址解密增强型定时自动运行采集功能[注1]命令行启动程序本地任务数据编辑再发布功能任意格式文件下载功能使用FTP自动上传文件到网站简体繁体互转功能Sqlite数据库保存数据MySql数据库保存数据SqlServer数据库保存数据文件自动上传到网站自动获取tag,生成中文关键词全局敏感词替换近义词替换PHP编程插件C#外部编程插件采集数据后直接发布或导入数据库技术服务列表
免费版
个人版
标准版
旗舰版
企业版
商业用户QQ群支持电话,E-mail支持企业QQ/MSN支持免费定制采集任务规则
1个
8个[注4]
免费定制Web或数据库发布模块
1个
2个
免费网络培训基本的采集、发布功能
1次
免费定制免登录发布接口免费定制编程插件软件功能小幅修改软件厂商OEM定制国内主要大中型城市上门培训(一次)专属技术客服7*24小时响应全自动采集代维护服务全自动发布代维护服务绑定电脑
一台
可免费更换一次
一台
可免费更换一次
一台
可选机器码授权(可免费更换1次)
或加密狗授权
或旗舰自助授权(一天更换一次)
十台 可免费更换五次
附赠旗舰版加密狗一只
升级服务年限
不限
两年[注3]
两年
两年
两年
价格(不带发票)
¥0
¥260
¥660
¥800(机器码)
¥990(加密狗)
¥1190(旗舰自助授权版)
¥4800(10授权+1加密狗)
价格(含税价)
¥0
¥290
¥722
¥874(机器码)
¥1080(加密狗)
¥1295(旗舰自助授权版)
¥5184
备注说明:相关阅读:
Discuz X3.1门户文章、论坛在线发布模块-网站建设内容采集利器(火车头采集教程)
相关文件下载地址:
官网:访问
软件性质:免费
官方下载 | 千脑网盘 | 华为网盘 | 微盘