版本:v9.5
【软件简介】
火车收集器(LocoySpider)是一款专业的功能强大年夜的搜集数据/信息发掘软件,经过过程灵活的设备,您可以很轻松的从网页上抓取文字、图片、文件等任何资本。
法式榜样支撑长途下载图片文件,支撑网站上岸后的信息收集,支撑探测文件真实地址,支撑代理,支撑防盗链的收集,支撑收集数据直接入库和模仿人手工发布等很多功能特点。
火车收集器支撑从任何类型的网站收集获得您所须要的信息,如各类消息类网站、服装论坛t.vhao.net、电子商务网站、求职雇用网站等。
同时具有强大年夜的网站登录收集、多页和分页的收集、网站跨层收集、POST收集、脚本页面收集、静态页面收集等高等收集功能。
强大年夜的php和c#插件支撑,让您可以经过过程二次开辟完成您所想要的任何更强大年夜的功能。
【软件特点】
1、通用性强
不管消息、服装论坛t.vhao.net、视频、黄页、图片、下载类网站,只需经过过程浏览器能看到的构造化的内容,经过过程指订婚配规矩,都能收集到您所须要的内容。
2、稳定、高效
五年磨一剑,软件赓续更新进步,收集速度快,性能稳定,占用资本少。
3、扩大性强、实用范围广
自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用。
根本功能
1、规矩自定义 - 经过过程收集规矩的定义,可以搜刮一切网站收集简直任何类型的信息。
2、多义务,多线程 - 可以同时停止多个信息收集义务,每个义务可以应用多个线程。
3、所见即所得 - 义务收集过程所见即所得,过程当中遍历的链接信息、收集信息、缺点信息等都邑及时的反应在软件界面中。
4、数据保存 - 数据边收集边主动保存到关系数据库中,并且数据构造可以或许主动适应,软件可以根据收集规矩主动创建数据库,和个中的表和字段,也能够经过过程导库方法灵活的将数据保存到客户已有的数据库构造中。
5、断点续采 - 信息收集义务可以在停止后从断点开端持续收集,从此你用不再担心你的收集义务不测中断了。
6、网站登录 - 支撑网站Cookie,支撑网站可视化登录,即使登录时须要验证码的网站也能收集。
7、筹划义务 - 经过过程这个功能可让你的收集义务准时、定量或许一向轮回履行。
8、收集范围限制 - 可以根据收集的深度和网址的标识来限制收集的范围。
9、文件下载 - 可以将收集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或许收集成果数据库中。
10、成果调换 - 可以将收集的成果根据规矩调换成你定义的内容。
11、条件保存 - 可以根据某个条件来决定那些信息保存,那些信息过滤。
12、过滤反复内容 - 软件可根据用户设置和实际情况对反复内容和反复网址主动删除反复内容。
13、特别链接辨认 - 应用此功能可以将用JavaScript静态生成的链接或其他更古怪的连接辨认出来。
14、数据发布 - 可以经过过程自定义接口,将已收集的成果数据发布到随便任性的内容管理体系和指定命据库中。如今已支撑的目标发布媒体包含:数据库(access, sql server,my sql,oracle) ,静态htm文件。
15、预留编程接口 - 定义多个编程接口,用户可以在事宜中应用PHP,C#说话停止编程,扩大收集功能。
【软件功能】
1、支撑一切网站编码:完美支撑收集一切编码格局的网页,法式榜样还可以主动辨认网页编码。
2、多种发布方法:支撑今朝一切主流和非主流的CMS,BBS等网站法式榜样,经过过程体系的发布模块能完成收集器和网站法式榜样间的完美结合。
3、全主动:无人值守任务,设备好法式榜样后,法式榜样将根据您的设置主动运转,完全无需人工干涉。
4、本地编辑:本地可视化编辑已收集的数据。
5、收集测试:这是其它任何同类收集软件所不克不及比的,法式榜样支撑直接检查收集成果并测试发布。
6、管理便利:应用站点+义务方法管理收集节点,义务支撑批量操作,再多的数据管理也很轻松。
【更新日记】
1,批量网址更新,日期可以支撑大年夜于明天的数据。标签可以采取多参数同步变更
2,标签组合,增长关于轮回组合的支撑。
3,优化网址库排重逻辑,大年夜大年夜加快大年夜网址库下的义务加载速度,优化网址库排重内存占用。
4,数据库发布模块,增长“insert ignore”形式的支撑
5, 新增义务的云端备份、同步功能
6,http长途办事器,增长关于单条数据修改的API支撑。
7,水印增长指定大年夜小的紧缩功能
8,修复FTP,SFTP链接未能精确断开的成绩
9,修复Word2007没法保存图片的成绩
10,修复标签超长时辰的显示缺点成绩。
11,修复标签数据调换中的调换缺点成绩。
12,修复了数据倒序发布的成绩。
13,优化了几个会招致收集器长时间运转后内存没法释放的成绩。
【软件截图】
火车收集器(LocoySpider)v9.4下载