適用范圍: 1、采集目標不限,無所謂HTML、PHP、ASP、JAVA頁面; 2、采集對象支持:文章、圖片、Flash; 3、完美的內容入庫解決方案,小蜜蜂采集器提供2種入庫方式:數據庫直導和模擬提交。 1)數據庫直導完美支持任何基于Mysql數據庫存儲信息的內容管理系統,包括多表/多字段聯動系統導庫; 2)模擬提交導庫理論上支持任何目標,不受目標程序語言、數據庫類別限制;實際使用效果受目標應用程序影響。 各采集模塊功能簡介: 1、 文章采集模塊 專門采集文章/圖片,也可采集文章中附帶的flash,但是功能不如Flash采集模塊強大; 2、 BBS論壇采集模塊 專門采集BBS論壇內容; 3、 Flash采集模塊 專門采集flash小游戲,可完美采集縮略圖、游戲簡介; 采集內容導庫簡介:各模塊采集的內容均可自由導入WEB應用系統。 功能介紹: 1、支持文章內容分頁采集; 2、支持論壇采集 3、支持UTF-8轉換到GB2312,可采集內容字符格式為UTF-8的目標; 4、支持把文章內容保存到本地; 5、支持站點+欄目管理方式,使采集管理一目了然; 6、支持鏈接替換、分頁鏈接替換; 7、支持采集器設置無限過濾功能; 8、支持圖片采集保存到本地,自動替換文件名避免重復; 9、支持FLASH文件采集保存到本地,自動替換文件名避免重復; 10、支持限制PHP FOPEN、FSOCKET函數功能的虛擬主機; 11、支持采集結果人工篩選,并提供“空標題、空內容”的快速過濾刪除; 12、支持Flash專業站采集,專門采集flash小游戲,可完美采集縮略圖、游戲簡介; 13、支持全站配置規則導入、導出; 14、支持欄目配置規則導入、導出,提供規則復制功能簡化設置; 15、提供導庫規則導入、導出; 16、支持自定義采集間隔時間,避免被誤認為DDOS攻擊而拒絕響應,可采集設置了防DDOS攻擊的網站; 17、支持自定義入庫間隔時間,躲避虛擬主機并發數限制; 18、支持自定義內容寫入,用戶可設置任意內容(如自己的鏈接、廣告代碼),寫入到所采集內容的:最前面、最后面,或者隨機寫入;導庫時自動帶上需要寫入的內容,無需修改您WEB系統的模版。 19、支持采集內容替換功能,用戶可設置替換規則隨意替換; 20、支持html標簽過濾,允許采集到的內容僅保留必要的html標簽甚至無任何html標簽的純文本; 21、支持多種CMS導庫 如:PHPCMS V2/V3、DedeCms(織夢) V2/V3、PHP168 CMS、mephpcms、Mambo CMS、Joomla CMS、多訊(DuoXun) CMS、SupeSite、Cmsware、帝國ECMS、新雨動網(XYDW)CMS、動易CMS、風訊CMS系統導庫;用戶也可自行設計適合自己系統的導庫功能。 22、支持PHPWIND、Discuz論壇導庫,程序包內含2大論壇導庫規則及操作指南說明; 23、附帶數據庫優化工具,減少頻繁采集數據碎片過多降低數據庫性能。 以下特殊功能僅“小蜜蜂采集器”擁有: 1、支持采集過程斷點續采功能,不受瀏覽器意外關閉影響,重新啟動后不會重復采集; 2、支持自動對比過濾功能,對已采集的鏈接系統不會進行重復采集和入庫; 以上兩條功能可大幅度減少采集時間,降低系統負載。 3、支持系統每日自動創建圖片保存目錄,方便管理; 4、支持采集/導庫間隔時間設置,避免被目標站識別為流量攻擊而拒絕響應; 5、支持自定義內容寫入,達到簡單防采功能; 6、支持html標簽過濾,近乎完美的顯示您想要的采集效果; 7、完美的內容入庫解決方案,不受目標程序語言、數據庫類別限制。 以上眾多強勁功能給您免費使用,即刻安裝使用體驗信息采集的輕松、高效




暢玩游戲平臺
啟明星工作日志軟件worklog
熊貓關鍵詞工具
arpkiller
MD5修改工具
百度關鍵詞工具