南通颐猩文化传播有限公司

當(dāng)前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

你所不知道的百度推廣審核機(jī)制,其實(shí)有三道防火墻

 2016-01-29 10:14  來源: 用戶投稿   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競價(jià),好“米”不錯(cuò)過

前不久,百度公開數(shù)據(jù)屏蔽3.8億條虛假有害鏈接,處理超過1億個(gè)違規(guī)站點(diǎn),在2014至2015年兩年時(shí)間里拒絕了5億條推廣信息,2015年拒絕438300個(gè)不良賬戶。

百度經(jīng)常被質(zhì)疑,搜索結(jié)果中存在虛假推廣信息,夸大宣傳等問題,不少人認(rèn)為只要有錢就能在百度上做推廣,誰出價(jià)高就能排在搜索結(jié)果的第一位。而百度推廣確實(shí)存在各種問題,如同阿里平臺(tái)中始終有假貨存在,在這方面百度責(zé)無旁貸。但在道德審判之外,我更為關(guān)心具體的場景細(xì)節(jié),到底百度需要面臨怎樣的“騙子橫行”?以及夾在“騙子”與“需求”之間的百度在其中究竟做了什么?每個(gè)硬幣都有一體兩面,本文希望能夠通過純粹的技術(shù)視角來重新看百度的另一面。

事件回放

此前,一位前百度高管找到李彥宏,為一家著名投資機(jī)構(gòu)旗下的P2P公司說情,希望加入到能夠在百度進(jìn)行推廣的“P2P網(wǎng)貸平臺(tái)白名單”。而說情的原因是因?yàn)檫@家P2P公司的資質(zhì)未能達(dá)到百度信譽(yù)的評定標(biāo)準(zhǔn),并被百度拒絕推廣請求,雖然這家P2P公司也獲得了正規(guī)知名機(jī)構(gòu)的風(fēng)險(xiǎn)投資,并且這位前高管在百度內(nèi)部有著很多“人脈資源”甚至有直接上達(dá)李彥宏的權(quán)力,但百度方面依然表示需要按照百度的信譽(yù)V體系來審核,并且最終仍然沒有通過審核。

除此之外,事實(shí)上百度還做了大量反詐騙的工作, “網(wǎng)民權(quán)益保障計(jì)劃”網(wǎng)站中,百度就對部分詐騙網(wǎng)站進(jìn)行了曝光。

而這些反詐騙案例得以曝光,都與“百度信譽(yù)V體系”有關(guān),如同阿里打假的“神盾局”,“百度信譽(yù)V體系”也是百度的防火墻,為什么李彥宏如此信任這道防火墻,甚至可以直接拒絕前高管的請求?

百度信譽(yù)V體系,三道防火墻

防火墻

簡單的說百度信譽(yù)V體系就是對企業(yè)信譽(yù)的評級,百度首先通過這套評級機(jī)制來決定企業(yè)是否有資格在百度進(jìn)行推廣,并且即使已經(jīng)入住的企業(yè),“百度信譽(yù)V體系”依然會(huì)對其進(jìn)行持續(xù)性的監(jiān)督,中途一旦發(fā)現(xiàn)違規(guī)就根據(jù)具體情況進(jìn)行暫停推廣、警告、永久封號、上報(bào)公安等等具體措施。

信譽(yù)V體系主要依托人工與大數(shù)據(jù)的混合監(jiān)控,在數(shù)據(jù)審查主要分為三層遞進(jìn)方式,可以看成是三道防火墻。

1)第一道防火墻,百度沒有該企業(yè)數(shù)據(jù),要求資質(zhì)信息

沒有任何一家企業(yè)可以隨意在百度投放推廣信息,根據(jù)每個(gè)行業(yè)的審核機(jī)制不同,百度會(huì)要求提供每個(gè)行業(yè)的企業(yè)背景資料和相關(guān)證件,包括公司營業(yè)執(zhí)照原件及營業(yè)執(zhí)照上登記的法定代表人的身份證原件的影印件,以及法定代表人手持自己身份證的肖像照片等等。

百度通過“實(shí)名認(rèn)證、資信認(rèn)證、商標(biāo)認(rèn)證、授權(quán)認(rèn)證、官網(wǎng)認(rèn)證、誠企專區(qū)”等六大產(chǎn)品徹底核實(shí)企業(yè)身份信息的真實(shí)性。

基本的企業(yè)信息審核,這是第一道防火墻。

2)第二道,百度擁有部分該企業(yè)數(shù)據(jù),全網(wǎng)信用建模

只是獲得企業(yè)的給到的信息是遠(yuǎn)遠(yuǎn)不夠的,這等于博弈的籌碼完全在對方手里,而百度方面也需要自己的籌碼,也就是對方的數(shù)據(jù)信息。百度主要采取了以下數(shù)據(jù)收集的方式對該企業(yè)進(jìn)行全網(wǎng)的信用建模。

接入政府方面的第三方數(shù)據(jù),通過接入工商信息數(shù)據(jù)、全國個(gè)人身份信息數(shù)據(jù)等等相關(guān)部門數(shù)據(jù),通過人工審查,實(shí)現(xiàn)100%的信息準(zhǔn)確性核實(shí),進(jìn)而規(guī)避部分地區(qū)工商網(wǎng)站建設(shè)落后導(dǎo)致的人工審核受限、無企業(yè)信息可查的問題。其次是通過政府方面的監(jiān)管記錄可以對企業(yè)進(jìn)行更嚴(yán)密的監(jiān)控,下圖以“蘇寧”為例。

監(jiān)控

百度的此類相關(guān)數(shù)據(jù)均來自政府監(jiān)管。

其次通過全網(wǎng)數(shù)據(jù)對其進(jìn)行建模,百度有著可以對“事件”建模的技術(shù),例如我們搜索“張飛”時(shí)百度可以根據(jù)全網(wǎng)的數(shù)據(jù),找出一切與張飛的關(guān)聯(lián)人物,諸如趙云、劉備等等,如圖。

張飛

因此我們繼續(xù)以“蘇寧”舉列,百度會(huì)根據(jù)“蘇寧”這個(gè)關(guān)鍵詞索引一切關(guān)聯(lián)的大數(shù)據(jù)、諸如“天貓”、"京東"、"家電"、"家電"等等關(guān)鍵詞,進(jìn)行一個(gè)大的品牌建模。其中百度會(huì)抽取大數(shù)據(jù)中的諸如“蘇寧電器質(zhì)量怎么樣?”、“蘇寧發(fā)貨速度好快”等等全網(wǎng)的相關(guān)鍵詞搜索信息、媒體網(wǎng)站輿論信息、問答網(wǎng)站信息、百度口碑信息等等多方信息,對其進(jìn)行一個(gè)信譽(yù)體系的建模,反向得出其信譽(yù)指數(shù)。

也就是說,想要在百度進(jìn)行推廣的企業(yè),在其入駐百度之前,百度就已經(jīng)有了其相關(guān)的大量數(shù)據(jù)信息,從政府方面提供的信息再到全網(wǎng)的信譽(yù)初級指數(shù),凡是能夠有該企業(yè)數(shù)據(jù)的地方百度都會(huì)不遺余力的去收集。

因此,即使一個(gè)網(wǎng)站給了百度初級的資質(zhì)信息,但只要無法與百度取的的政府信息匹配,以及有著不良的全網(wǎng)信息記錄評級,就不可能被允許投放推廣信息。在這套系統(tǒng)制約下,百度信譽(yù)認(rèn)證體系已封禁企業(yè)達(dá)20546家,共封禁194392個(gè)推廣賬戶。

3)第三道防火墻,持續(xù)監(jiān)督該企業(yè)數(shù)據(jù),全網(wǎng)追蹤跟進(jìn)+百度口碑

推廣信息動(dòng)態(tài)監(jiān)控,上面兩道防火墻都是建立在投放推廣信息之前,而讓百度最為頭疼的則是在投放推廣信息之后,大部分作惡的企業(yè)都是在百度審核之時(shí)交給了百度一個(gè)正常的網(wǎng)頁,而在百度通過審核之后便通過代碼技術(shù),偷偷換上自己的非法內(nèi)容,瞞天過海,在百度那里原來看到的“正常內(nèi)容”,到了用戶那里就變成了“作惡內(nèi)容”。

舉個(gè)例子,一些不法推廣公司會(huì)在Flash推廣信息中嵌入第三方外鏈或php腳本內(nèi)容,會(huì)根據(jù)IP、時(shí)段、設(shè)備的不同進(jìn)行不同的跳轉(zhuǎn),并且還會(huì)監(jiān)視百度蜘蛛的抓取技術(shù)躲避百度監(jiān)控,早上同一個(gè)鏈接點(diǎn)開可能是正常的鋼材推廣信息,但是到了晚上就變成了色情內(nèi)容,而百度面通過建立程序員組建立Flash信息的代碼解析模塊,24小時(shí)監(jiān)控,主動(dòng)發(fā)現(xiàn)其中“不應(yīng)出現(xiàn)”的外鏈或php腳本內(nèi)容。

經(jīng)過這么多年的“交手”,百度目前基本已經(jīng)杜絕推廣信息作弊。去年百度共封禁Flash賬戶超1.5萬個(gè),涉及Flash信息數(shù)超570萬條,其中機(jī)器拒絕違規(guī)Flash信息通過共近60萬條。

全網(wǎng)數(shù)據(jù)動(dòng)態(tài)監(jiān)控,“百度信譽(yù)V”體系并非永久不變,對于百度來說除了在企業(yè)主推廣之前對其進(jìn)行全網(wǎng)建模以外,還會(huì)持續(xù)跟進(jìn)對其信譽(yù)的評級,一旦在權(quán)威媒體網(wǎng)站或者在關(guān)鍵詞搜索中檢索到其負(fù)面內(nèi)容,或者檢測到政府方面對該企業(yè)給予了處罰內(nèi)容,那么企業(yè)信譽(yù)則會(huì)發(fā)生相應(yīng)波動(dòng),而當(dāng)波動(dòng)幅度過大時(shí),百度方面會(huì)立即進(jìn)行人工檢查,并可能立即停止其推廣行為。

百度口碑,該項(xiàng)目是百度內(nèi)部自建項(xiàng)目,通過利用百度用戶的UGC內(nèi)容對各大網(wǎng)站內(nèi)容進(jìn)行用戶評級,這也是“百度信譽(yù)V”體系中的一環(huán)。目前百度口碑中集成了評論、實(shí)名曝光、輿情觀察等內(nèi)容。用戶的海量曝光投訴,對“百度信譽(yù)V”有著較大的參考價(jià)值,以下為百度口碑的實(shí)名曝光。

張飛

一些思考

闌夕曾在《百度為什么要“賣”貼吧》一文中說過,由于國外有著極強(qiáng)的政府監(jiān)管以及優(yōu)渥的基礎(chǔ)設(shè)施,因此谷歌在投放推廣信息方面并沒有太多后顧之憂,與政府有著涇渭分明的界限。

由于國內(nèi)的監(jiān)管機(jī)制、基礎(chǔ)設(shè)施都起步較晚,導(dǎo)致原本屬于政府的壓力都轉(zhuǎn)嫁到了互聯(lián)網(wǎng)公司上,而一旦互聯(lián)網(wǎng)公司監(jiān)管不利,公眾對互聯(lián)網(wǎng)公司的憤怒反而大于對政府的憤怒,這里面或許有多少無奈。

此外,在當(dāng)前的環(huán)境下,無論百度阿里騰訊都無法徹底禁止“作惡者”,百度眼皮底下依然會(huì)有鉆空子的作惡者,阿里的平臺(tái)上也無法做到完全禁止假貨,而那些以微商之名做“傳銷”的假微商,也還是會(huì)對微信不擇手段的利用。

但值得期待的另一面則是,互聯(lián)網(wǎng)公司正在承擔(dān)起這些責(zé)任,百度成立了“百度信譽(yù)V”,拒絕了5億的推廣頻次,自掏近5000萬的理賠費(fèi),阿里成立了“神盾局”,一年花費(fèi)10億用于打假,騰訊也在通過監(jiān)測關(guān)鍵詞禁止一切非法推廣等等。

而這些公司處理的方式都有一個(gè)最大的共同點(diǎn)就是—技術(shù),而技術(shù)只對結(jié)果負(fù)責(zé),所有一切“作惡”都會(huì)被徹底放到放大鏡底下被監(jiān)視,脫離于原來的“人治監(jiān)控”手段,也就可以避免各種因人而導(dǎo)致的不確定的利益勾結(jié)。

因此對于未來,當(dāng)我們拿起放大鏡去客觀看每一個(gè)歷史進(jìn)程的細(xì)節(jié)時(shí),那個(gè)真實(shí)的世界,一直都在變得更好。

作者微信公眾號:shouxifayanzhe

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
百度推廣

相關(guān)文章

熱門排行

信息推薦