(LocoySpider)是一款專業的功能強大的網絡數據/信息挖掘軟件,通過靈活的配置,您可以很輕鬆的從網頁上抓取文字、圖片、文件等任何資源。
程序支持遠程下載圖片文件,支持網站登陸後的信息采集,支持探測文件真實地址,支持代理,支持防盜鏈的采集,支持采集數據直接入庫和模仿人手工發布等許多功能特點。
火車采集器支持從任何類型的網站采集獲取您所需要的信息,如各種新聞類網站、論壇、電子商務網站、求職招聘網站等。
同時具有強大的網站登錄采集、多頁和分頁的采集、網站跨層采集、POST采集、腳本頁麵采集、動態頁麵采集等高級采集功能。
強大的php和c#插件支持,讓您可以通過二次開發實現您所想要的任何更強大的功能。
1、通用性強
無論新聞、論壇、視頻、黃頁、圖片、下載類網站,隻要通過瀏覽器能看到的結構化的內容,通過指定匹配規則,都能采集到您所需要的內容。
2、穩定、高效
五年磨一劍,軟件不斷更新進步,采集速度快,性能穩定,占用資源少。
3、擴展性強、適用範圍廣
自定義web發布,自定義主流的數據庫的保存和發布,自定義本地php及.net外部編程接口處理數據,讓數據都能為你所用。
1、規則自定義 - 通過采集規則的定義,可以搜索所有網站采集幾乎任何類型的信息。
2、多任務,多線程 - 可以同時進行多個信息采集任務,每個任務可以使用多個線程。
3、所見即所得 - 任務采集過程所見即所得,過程中遍曆的鏈接信息、采集信息、錯誤信息等都會及時的反映在軟件界麵中。
4、數據保存 - 數據邊采集邊自動保存到關係數據庫中,並且數據結構能夠自動適應,軟件可以根據采集規則自動創建數據庫,以及其中的表和字段,也可以通過導庫方式靈活的將數據保存到客戶已有的數據庫結構中。
5、斷點續采 - 信息采集任務可以在停止後從斷點開始繼續采集,從此你用不再擔心你的采集任務意外中斷了。
6、網站登錄 - 支持網站Cookie,支持網站可視化登錄,即使登錄時需要驗證碼的網站也能采集。
7、計劃任務 - 通過這個功能可以讓你的采集任務定時、定量或者一直循環執行。
8、采集範圍限製 - 可以根據采集的深度和網址的標識來限製采集的範圍。
9、文件下載 - 可以將采集到的二進製文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結果數據庫中。
10、結果替換 - 可以將采集的結果根據規則替換成你定義的內容。
11、條件保存 - 可以根據某個條件來決定那些信息保存,那些信息過濾。
12、過濾重複內容 - 軟件可根據用戶設置和實際情況對重複內容和重複網址自動刪除重複內容。
13、特殊鏈接識別 - 運用此功能可以將用JavaScript動態生成的鏈接或其他更古怪的連接識別出來。
14、數據發布 - 可以通過自定義接口,將已采集的結果數據發布到任意的內容管理係統和指定數據庫中。現在已支持的目標發布媒體包括:數據庫(access, sql server,my sql,oracle) ,靜態htm文件。
15、預留編程接口 - 定義多個編程接口,用戶可以在事件中利用PHP,C#語言進行編程,擴充采集功能。
1、支持所有網站編碼:完美支持采集所有編碼格式的網頁,程序還可以自動識別網頁編碼。
2、多種發布方式:支持目前所有主流和非主流的CMS,BBS等網站程序,通過係統的發布模塊能實現采集器和網站程序間的完美結合。
3、全自動:無人值守工作,配置好程序後,程序將依據您的設置自動運行,完全無需人工幹預。
4、本地編輯:本地可視化編輯已采集的數據。
5、采集測試:這是其它任何同類采集軟件所不能比的,程序支持直接查看采集結果並測試發布。
6、管理方便:使用站點+任務方式管理采集節點,任務支持批量操作,再多的數據管理也很輕鬆。
火車采集器V9.2版
1.修複默認模板無法保存的問題
2.修複生成word文檔時出錯的Bug
3.修複最大采集量無效的bug
4.數據處理增加自動分類功能
5.添加python插件功能,支持2.7和3.x版本
6.更改任務批量編輯排除重複和網址庫分開
7.修複任務批量設置中發布和入庫為增加的bug
8.修複api中job的list方法不顯示的bug
9.修複內置瀏覽器版本過低問題
10.修複任務完成進度條顯示bug
11.修複瀏覽器Cookie不能隨時生效bug
234KB/01-09
聊天工具
下載321KB/01-09
聊天工具
下載231KB/01-09
聊天工具
下載76.4M / 03-25
55M / 06-05
237.9M / 04-13
140.5M / 03-06
900.9M / 03-02
96.2M / 07-06
311.2M / 07-06
335M / 07-06
200M / 07-06
413.8M / 07-06
353.9M / 06-05
131.8M / 04-13
230.8M / 03-03
195.6M / 03-03
165.4M / 03-03
45.6M / 09-08
665.2M / 07-06
2.84G / 07-06
93M / 07-06
338.3M / 07-06
1.38G / 07-26
488.3M / 07-16
109.8M / 06-03
142M / 01-08
1.2M / 11-23
548.8M / 04-13
1.6M / 04-13
1.48G / 03-18
646.6M / 03-03
133.7M / 03-03
325.8M / 06-07
60M / 04-29
254M / 04-25
659M / 04-23
1M / 12-26
253.4M / 12-08
253M / 12-08
1.19G / 11-16
110.5M / 04-23
26.7M / 03-16
488.3M / 07-16
248.9M / 12-08
248.9M / 12-08
201.2M / 04-13
100.6M / 03-06
148.9M / 03-06
1.12G / 07-06
1.25G / 07-06
9.48G / 07-06
50KB / 07-06
116.2M / 04-10
1.92G / 04-17
201.5M / 04-13
7.31G / 07-01
94.3M / 07-06
2.48G / 07-06
7.63G / 07-06
1M / 07-06
778.1M / 07-06
509.7M / 07-06
561.8M / 07-11
1.32G / 01-19
72M / 07-06
548.7M / 07-06
1.00G / 07-06
9.13G / 07-06
126.2M / 07-06
72M / 07-06
105.1M / 07-06
132M / 07-06