南通颐猩文化传播有限公司

當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  搜索優(yōu)化 >  正文

百度爬蟲觀察

 2007-08-08 00:18  來(lái)源: 非主流中文網(wǎng)Www.Danvzi.cn   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

在這兒交流一下網(wǎng)站被搜索引擎收錄的情況,然后和大家交流交流,作為一個(gè)菜鳥,我是從菜鳥的角度觀察的,有啥幼稚可笑的地方希望大家盡管笑,博朋友們一樂足矣。

非主流大女子網(wǎng)于2007年8月5日正式上線,其實(shí)就是把初步改好的網(wǎng)站掛上去。不過(guò)注意一下,我所謂的上線并不是把非主流大女子網(wǎng)能正常訪問(wèn)開始算,而是把非主流大女子網(wǎng)和其他baidu收錄的網(wǎng)站掛好鏈接,這算是正式上線,如果沒有外鏈,搜索引擎不知道有這個(gè)非主流網(wǎng)的存在,那放一年又有什么意義,談不上上線。

由于我所掛鏈接的網(wǎng)站是一個(gè)非?;钴S的網(wǎng)站,通過(guò)對(duì)網(wǎng)站日志的觀察,幾乎是每小時(shí)百度和谷歌的爬蟲都會(huì)來(lái)訪問(wèn),所以,掛上后,應(yīng)該很快有他們的爬蟲到非主流大女子網(wǎng)的。

果然很快,在一個(gè)小時(shí)內(nèi),首先來(lái)的爬蟲是雅虎的,小弟發(fā)現(xiàn),雅虎的爬蟲最近非常的活躍,不過(guò)我對(duì)他不是很感興趣,因?yàn)檠呕?lái)的流量是非常有限的,甚至不如搜狗有時(shí)候。

在一個(gè)小時(shí)以后,谷歌的爬蟲也來(lái)了,而且我每隔一個(gè)小時(shí)就觀察,谷歌的爬蟲很活躍,幾乎每個(gè)小時(shí)都在爬啊爬的,最近對(duì)谷歌還是比較喜歡的,雖然流量帶來(lái)的不多,但是每天來(lái)兩百、三百的ip很容易的,只要做到位,半個(gè)月偶就能從谷歌搞來(lái)三百以上ip。

最盼望的百度的爬蟲這次竟然太弱了,等了3天,谷歌和雅虎收錄都體現(xiàn)出來(lái)了,百度竟然還沒有動(dòng)靜。急。

終于,在2007年8月7日,百度的爬蟲終于出現(xiàn)了,果不其然,百度的蟲子首先檢查的非主流大女子網(wǎng)目錄下的robot.txt文件,這個(gè)是不存在的,那就是說(shuō)俺的網(wǎng)站是允許百度的爬蟲來(lái)的,不過(guò)也是廢話,在國(guó)內(nèi),誰(shuí)會(huì)主動(dòng)的躲開百度呢?除非他精神有問(wèn)題吧。

2007-08-07 08:53:12 GET /robots.txt - 80 - 222.222.126.113 Baiduspider+(+) - - 404 0 64

在接下來(lái)的一個(gè)小時(shí)內(nèi),百度的爬蟲掃描了幾乎所有的頁(yè)面(本身也不多,就添加了30多篇),而且百度的爬蟲幾乎把所有的圖片,包括文章內(nèi)上傳的和網(wǎng)頁(yè)上的小圖片,它都爬了一遍。

我現(xiàn)在有個(gè)感覺,保持百度爬蟲的活躍度,要從這個(gè)時(shí)刻開始:發(fā)現(xiàn)百度的爬蟲來(lái)了以后,每次新來(lái)過(guò)以后你要添加幾篇文章,讓爬蟲每次來(lái)都有新東西可吃,這樣子他會(huì)非常勤快的。我相信,他每小時(shí)都回來(lái)的。

不知道非主流大女子網(wǎng)能否實(shí)現(xiàn)我的預(yù)期效果,我要測(cè)試,我會(huì)在站長(zhǎng)網(wǎng)隨時(shí)更新我的觀察結(jié)果。

謝謝大家。

恭喜你:今天是2007.8.08.你看到這條消息的時(shí)候,立即進(jìn)去搶寶論壇登記信息,搶屬于你的¥50.00 尋寶贊助由 中華賞金人才網(wǎng)贊助 請(qǐng)各位未搶到寶的站長(zhǎng),關(guān)注中華賞金人才網(wǎng))還有更多的獎(jiǎng)勵(lì)機(jī)會(huì)。

以下是百度的爬蟲對(duì)非主流大女子網(wǎng)掃描的記錄片段

2007-08-07 09:04:55 GET /images/banner.gif - 80 - 222.222.126.113 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1) AJSTAT_ok_pages=1;+AJSTAT_ok_times=1 304 0 0
2007-08-07 09:04:55 GET /images/bea_03.gif - 80 - 222.222.126.113 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1) AJSTAT_ok_pages=1;+AJSTAT_ok_times=1

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 百度爬蟲是什么

    百度爬蟲是一種網(wǎng)絡(luò)機(jī)器人,它可以根據(jù)一定的規(guī)則,在各個(gè)網(wǎng)站爬行,對(duì)訪問(wèn)過(guò)的網(wǎng)頁(yè)、圖片、視頻等內(nèi)容進(jìn)行收集整理,分類建立數(shù)據(jù)庫(kù),呈現(xiàn)在搜索引擎上,讓用戶通過(guò)搜索某些關(guān)鍵字,就可以看到企業(yè)網(wǎng)站的網(wǎng)頁(yè)、圖片、視頻等。

    標(biāo)簽:
    百度爬蟲
  • 百度蜘蛛爬蟲的工作原理

    百度是中國(guó)目前的第一大搜索引擎,擁有完善的一套爬蟲算法,了解百度蜘蛛的爬蟲原理,對(duì)我們SEO優(yōu)化工作有著舉足輕重的作用。我們可以從下面這張圖片來(lái)詳細(xì)了解百度蜘蛛爬取網(wǎng)頁(yè)的一整套流程和體系

  • 影響百度爬蟲對(duì)網(wǎng)站抓取量的因素

    影響百度爬蟲對(duì)網(wǎng)站抓取量的因素有哪些?

    標(biāo)簽:
    爬蟲
    百度爬蟲
  • 哪些網(wǎng)站優(yōu)化的細(xì)節(jié)會(huì)影響百度爬蟲的抓取

    大多站長(zhǎng)都知道百度爬蟲的重要性,一般你的網(wǎng)頁(yè)參與排名要分四個(gè)步驟,分別是抓取、收錄、索引、展現(xiàn),其中抓取是我們站長(zhǎng)做SEO網(wǎng)站優(yōu)化的第一步,那么問(wèn)題來(lái)了,濟(jì)南SEO培訓(xùn)告訴你站長(zhǎng)做SEO的哪些操作會(huì)影響到濟(jì)南seo網(wǎng)站優(yōu)化百度蜘蛛的抓取呢哪些網(wǎng)站優(yōu)化的細(xì)節(jié)會(huì)影響百度爬蟲的抓取看看你的IP上有沒有大站

    標(biāo)簽:
    百度爬蟲
  • 百度“蜘蛛爬蟲”如何判斷網(wǎng)站訪問(wèn)速度的相關(guān)因素

    潘田最近在使用百度統(tǒng)計(jì)時(shí)發(fā)現(xiàn)了一個(gè)百度新推出的功能“網(wǎng)站速度診斷”,具體什么時(shí)候出來(lái),筆者也不太清,只知道以前是沒有,最近才發(fā)現(xiàn)的。這功能很有趣,它所診斷的一個(gè)網(wǎng)站的訪問(wèn)速度技術(shù)標(biāo)準(zhǔn)都是以百度來(lái)衡量的。既然如此,那么百度蜘蛛爬蟲在訪問(wèn)一個(gè)網(wǎng)站的時(shí)候,

    標(biāo)簽:
    百度爬蟲

熱門排行

信息推薦