南通颐猩文化传播有限公司

當(dāng)前位置:首頁 >  站長(zhǎng) >  搜索優(yōu)化 >  正文

百度“蜘蛛爬蟲”如何判斷網(wǎng)站訪問速度的相關(guān)因素

 2011-11-08 19:49  來源:   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過

潘田最近在使用百度統(tǒng)計(jì)時(shí)發(fā)現(xiàn)了一個(gè)百度新推出的功能“網(wǎng)站速度診斷”,具體什么時(shí)候出來,筆者也不太清,只知道以前是沒有,最近才發(fā)現(xiàn)的。這功能很有趣,它所診斷的一個(gè)網(wǎng)站的訪問速度技術(shù)標(biāo)準(zhǔn)都是以百度來衡量的。既然如此,那么百度蜘蛛爬蟲在訪問一個(gè)網(wǎng)站的時(shí)候,所決定這個(gè)網(wǎng)站的速度快與慢的因素也相差得不太遠(yuǎn)。從這個(gè)診斷來看,我至少對(duì)百度的一些規(guī)則有更進(jìn)一步的掌握。在做SEO的時(shí)候,網(wǎng)站的訪問速度也是關(guān)鍵詞排名的重要因素,如果百度蜘蛛爬蟲訪問時(shí)間超過了一定的時(shí)間限制,那么百度很有可能就判斷為無法訪問,這是非常不利的。筆者以手下的一個(gè)網(wǎng)站診斷為例,來分析一下這個(gè)診斷的細(xì)節(jié)。

首先在網(wǎng)站的底部加入百度的統(tǒng)計(jì)代碼,然后在進(jìn)度統(tǒng)計(jì)后臺(tái)進(jìn)行“代碼安裝檢測(cè)”,如果正確,則顯示“代碼安裝正確”。這些都很簡(jiǎn)單,沒什么難度。

 

點(diǎn)擊左則的欄目“網(wǎng)站速度診斷”,進(jìn)行網(wǎng)站的訪問速度診斷。

 

下面筆者是以《5S論壇》502seo.com為例進(jìn)行分析??聪聢D

 

在診斷的時(shí)候,可以選擇線路,目前百度也只提供網(wǎng)通與電信的線路診斷,我在這兩個(gè)都選了。點(diǎn)擊分析。分析過程要一定的時(shí)間。

下面是502seo.com的診斷結(jié)果分?jǐn)?shù),電信線路得到84分,網(wǎng)通的是53分,這兩分?jǐn)?shù)相差很大,說明網(wǎng)站空間不是雙線(網(wǎng)通與電信)的機(jī)房,如果你的空間商是雙線路的,那么這兩個(gè)分?jǐn)?shù)也相差不大。

 

從上圖看到,從電信線路訪問時(shí)間是1.78秒,網(wǎng)通線路訪問則要60.12秒,如果百度蜘蛛爬蟲從網(wǎng)通訪問我的網(wǎng)站,那么結(jié)果是很糟糕的,甚至認(rèn)為是死網(wǎng)站。如果那位朋友是用網(wǎng)通的線路,可以訪問一下,是不是要這么時(shí)間。

從以上數(shù)據(jù)分析,大家在做網(wǎng)站的時(shí)候,盡可能的選擇雙線路或更多線路的空間。這對(duì)網(wǎng)站SEO是非常有利的。接下來,分析一下詳細(xì)的細(xì)節(jié)點(diǎn)。

從上圖的列表中,我們看到RUL這一列,它是網(wǎng)

 

站首頁所有的圖片,js,css,iframe等URL請(qǐng)求,如果這些URL過多,那么也就意味著你的網(wǎng)站速度越慢。再看看狀態(tài),301是轉(zhuǎn)向,轉(zhuǎn)向時(shí)間也算到百度的訪問時(shí)間。200則是能正常訪問,如果出現(xiàn)400或是別的,那就是這URL請(qǐng)示是不能訪問,這列表可以做為診斷頁面的一個(gè)技巧。時(shí)間線就是URL請(qǐng)求所用的時(shí)間,以毫秒為單位。

以下圖片是百度給出的診斷建議。

 

百度從三個(gè)方面來給出建議:連接網(wǎng)絡(luò),下載頁面,打開頁面。

502seo.com的這次診斷,連接網(wǎng)絡(luò)總共有6項(xiàng),共有47次請(qǐng)求,百度建議可節(jié)省25次連接,并以列表的形式列出來。這時(shí),就可以分析,那些邊接是沒必要的,可以清除掉。

 

合拼域名,502seo.com首頁中放了好幾個(gè)統(tǒng)計(jì)代碼,這都被百度認(rèn)為是多余的請(qǐng)求,相對(duì)于蜘蛛爬蟲來說,算不算是多余,沒有誰說得清楚。大家對(duì)于這一點(diǎn),盡可能少的調(diào)用域名外的請(qǐng)求。對(duì)用戶和蜘蛛爬蟲都是好的。

還有要取消重寫向,合并JS,網(wǎng)站分析JS過多,合并CSS,使用CSS sprite。其實(shí)這引起可以做進(jìn)一步的優(yōu)化。潘田在此不再詳細(xì)分析,讀者可以分析自己的網(wǎng)站。

“下載頁面”,”打開頁面”的建議也有詳細(xì)的列表,讀者可以看圖片上的說明。百度還提供了診斷報(bào)告下載,診斷報(bào)告有更詳細(xì)的說明,包括每一圖片的下載時(shí)間,都做了詳細(xì)的記錄。可以做為參考進(jìn)行做SEO優(yōu)化調(diào)整。百度蜘蛛爬蟲判斷網(wǎng)站訪問速度的相關(guān)因素就是有這些構(gòu)成,讀者可以這樣的方法分析下你自己的網(wǎng)站又得了多少分。感謝閱讀。

潘田博客原創(chuàng)www.pantian8.com 轉(zhuǎn)載請(qǐng)留說明。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 淺談百度爬蟲的HTTP狀態(tài)碼返回機(jī)制

    HTTP狀態(tài)碼我們都很熟悉,SEO工作中我們也需要迎合百度蜘蛛對(duì)常見的HTTP返回碼來做相關(guān)調(diào)整,下面我們就來淺談百度爬蟲的HTTP狀態(tài)碼返回機(jī)制

    標(biāo)簽:
    https網(wǎng)站
    百度爬蟲
  • 爬蟲有哪些分類?白話說說SEO好朋友爬蟲

    本文大綱:1、爬蟲是什么?反爬蟲又是什么?2、爬蟲有哪些分類?3、爬中流程與搜索引擎工作流程4、http/https協(xié)議與狀態(tài)碼5、robots協(xié)議爬蟲是什么?反爬蟲又是什么?這里的爬蟲不是我們生活中的爬蟲,如蜘蛛。這里的爬蟲更多指的是網(wǎng)絡(luò)爬蟲,即我們叫它網(wǎng)頁蜘蛛或網(wǎng)絡(luò)機(jī)器人。當(dāng)然,在SEO里,叫網(wǎng)

    標(biāo)簽:
    百度爬蟲
  • 百度爬蟲是什么

    百度爬蟲是一種網(wǎng)絡(luò)機(jī)器人,它可以根據(jù)一定的規(guī)則,在各個(gè)網(wǎng)站爬行,對(duì)訪問過的網(wǎng)頁、圖片、視頻等內(nèi)容進(jìn)行收集整理,分類建立數(shù)據(jù)庫,呈現(xiàn)在搜索引擎上,讓用戶通過搜索某些關(guān)鍵字,就可以看到企業(yè)網(wǎng)站的網(wǎng)頁、圖片、視頻等。

    標(biāo)簽:
    百度爬蟲
  • 百度蜘蛛爬蟲的工作原理

    百度是中國目前的第一大搜索引擎,擁有完善的一套爬蟲算法,了解百度蜘蛛的爬蟲原理,對(duì)我們SEO優(yōu)化工作有著舉足輕重的作用。我們可以從下面這張圖片來詳細(xì)了解百度蜘蛛爬取網(wǎng)頁的一整套流程和體系

  • 影響百度爬蟲對(duì)網(wǎng)站抓取量的因素

    影響百度爬蟲對(duì)網(wǎng)站抓取量的因素有哪些?

    標(biāo)簽:
    爬蟲
    百度爬蟲

熱門排行

信息推薦