關(guān)于bt蜘蛛網(wǎng)站,蜘蛛bt搜索引擎這個(gè)問(wèn)題很多朋友還不知道,今天小六來(lái)為大家解答以上的問(wèn)題,現(xiàn)在讓我們一起來(lái)看看吧!
1、搜索引擎“蜘蛛”指的是網(wǎng)絡(luò)爬蟲(chóng)(又被稱為網(wǎng)頁(yè)蜘蛛,網(wǎng)絡(luò)機(jī)器人,在FOAF社區(qū)中間,更經(jīng)常的稱為網(wǎng)頁(yè)追逐者),是一種按照一定的規(guī)則,自動(dòng)地抓取信息的程序或者腳本。
2、基于目標(biāo)網(wǎng)頁(yè)特征的爬蟲(chóng)所抓取、存儲(chǔ)并索引的對(duì)象一般為網(wǎng)站或網(wǎng)頁(yè)。
3、根據(jù)種子樣本獲取方式可分為:(1) 預(yù)先給定的初始抓取種子樣本;(2) 預(yù)先給定的網(wǎng)頁(yè)分類(lèi)目錄和與分類(lèi)目錄對(duì)應(yīng)的種子樣本,如Yahoo!分類(lèi)結(jié)構(gòu)等;(3) 通過(guò)用戶行為確定的抓取目標(biāo)樣例,分為:(a) 用戶瀏覽過(guò)程中顯示標(biāo)注的抓取樣本;(b) 通過(guò)用戶日志挖掘得到訪問(wèn)模式及相關(guān)樣本。
4、其中,網(wǎng)頁(yè)特征可以是網(wǎng)頁(yè)的內(nèi)容特征,也可以是網(wǎng)頁(yè)的鏈接結(jié)構(gòu)特征等等。
本文分享完畢,希望對(duì)大家有所幫助。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!