×

什么是搜索引擎的Spider(蜘蛛)

  • 作者:新網(wǎng)
  • 來源:新網(wǎng)
  • 瀏覽:100
  • 2018-02-07 16:24:52

什么是搜索引擎的Spider(蜘蛛)?現(xiàn)在做網(wǎng)站優(yōu)化的管理員都知道我們得到了百度權重就是根據(jù)搜索引擎的Spider(蜘蛛)給我們網(wǎng)站做出的評分,這里新網(wǎng)小編就為大家具體分析一下什么是搜索引擎的Spider(蜘蛛)。

 什么是搜索引擎的Spider(蜘蛛)?現(xiàn)在網(wǎng)站優(yōu)化的管理員都知道我們得到了百度權重就是根據(jù)搜索引擎的Spider(蜘蛛)給我們網(wǎng)站做出的評分,這里新網(wǎng)小編就為大家具體分析一下什么是搜索引擎的Spider(蜘蛛)。

5895d477-f76e-4df0-9ab4-6cfe1bce80ce.jpg
Spider也就是大家常說的爬蟲、蜘蛛或機器人,是處于整個搜索引擎最上游的一個模塊,只有Spider抓回的頁面或URL才會被索引和參與排名。需要注意的是,只要是Spider抓到的URL, 都可能會參與排名,但參與排名的網(wǎng)頁并不一定就被Spider抓取到了內(nèi)容,比如有些網(wǎng)站屏蔽搜索引擎Spider后,雖然Spider不能抓取網(wǎng)頁內(nèi)容,但是也會有一些域名級別的URL在搜索引 擎中參與了排名(例如天貓上的很多獨立域名的店鋪)。根據(jù)搜索引擎的類型不同,Spider也會有不同的分類。大型搜索引擎的Spider一般都會有以下所需要解決的問題,也是和SEO密切相 關的問題
首先,Spider想要抓取網(wǎng)頁,要發(fā)現(xiàn)網(wǎng)頁抓取入口,沒有抓取入口也就沒有辦法繼續(xù)工作, 所以首先要給Spider一些網(wǎng)頁入口,然后Spider順著這些入口進行爬行抓取,這里就涉及抓取 策略的問題。抓取策略的選擇會直接影響Spider所需要的資源、Spider所抓取網(wǎng)頁占全網(wǎng)網(wǎng)頁 的比例,以及Spider的工作效率。那么Spider一般會采用什么樣的策略抓取網(wǎng)頁呢?
其次,網(wǎng)頁內(nèi)容也是有時效性的,所以Spider對不同網(wǎng)頁的抓取頻率也要有一定的策略性, 否則可能會使得索引庫中的內(nèi)容都很陳舊,或者該更新的沒更新,不該更新的卻浪費資源更新了,甚至還會出現(xiàn)網(wǎng)頁已經(jīng)被刪除了,但是該頁面還存在于搜索結果中的情況。那么Spider一 般會使用什么樣的再次抓取和更新策略呢?
什么是搜索引擎的Spider(蜘蛛)?相信大家看過了以上文章以后對于什么是搜索引擎的Spider(蜘蛛)肯定已經(jīng)完全明白了。
 
 
 

免責聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻自行上傳,本網(wǎng)站不擁有所有權,也不承認相關法律責任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請發(fā)送郵件至:operations@xinnet.com進行舉報,并提供相關證據(jù),一經(jīng)查實,本站將立刻刪除涉嫌侵權內(nèi)容。

免費咨詢獲取折扣

Loading