Robots協(xié)議乃是互聯(lián)網(wǎng)壟斷的潛規(guī)則
掃描二維碼
隨時(shí)隨地手機(jī)看文章
Robots背后的潛規(guī)則
最近,Robot協(xié)議又被拿來說事兒,有人說360違反Robot協(xié)議抓取搜索引擎搜索結(jié)果,還有人說著會(huì)引起行業(yè)大亂,隨后似乎又有幾個(gè)不知名的小網(wǎng)站隨聲附和。不過反駁之說,似乎只見諸文字,真對(duì)360搜索反感的網(wǎng)站倒還真沒見到。
Robots協(xié)議是什么?在百科網(wǎng)站里的定義,robot協(xié)議(也稱為爬蟲協(xié)議、爬蟲規(guī)則、機(jī)器人協(xié)議等)也就是robots.txt,網(wǎng)站通過robots協(xié)議告訴搜索引擎哪些頁面可以抓取,哪些頁面不能抓取。
當(dāng)搜索蜘蛛訪問站點(diǎn)時(shí),它會(huì)首先檢查網(wǎng)站根目錄下是否存在Robots.txt。如果存在,搜索機(jī)器人就會(huì)按照該文件中的內(nèi)容來確定訪問的范圍;如果該文件不存在,所有的搜索蜘蛛將能夠訪問網(wǎng)站上所有沒有被口令保護(hù)的頁面。
Robot協(xié)議對(duì)于小白用戶并不重要,之前也并不廣為人知。最近和Robots相關(guān)的新聞都發(fā)生在電子商務(wù)網(wǎng)站,之前有兩個(gè):一個(gè)是京東屏蔽一淘的蜘蛛,另一個(gè)是淘寶屏蔽百度的蜘蛛?,F(xiàn)在,3B大戰(zhàn)鬧得很兇,很多人把Robot協(xié)議拿出來說事兒。
而在我看來,Robot充其量是互聯(lián)網(wǎng)江湖規(guī)矩、“潛規(guī)則”而已。
Robot協(xié)議不是行業(yè)標(biāo)準(zhǔn),只是“搜索引擎的家規(guī)”。
Google是互聯(lián)網(wǎng)江湖的大佬,Robots的發(fā)展恰恰與Google的發(fā)展密不可分。
當(dāng)年,谷歌憑借搜索引擎飛速發(fā)展,可很多大型網(wǎng)站原有的商業(yè)模式遭到了嚴(yán)重的破壞。為了維護(hù)自身的利益,一些歐美大網(wǎng)站聯(lián)合起來與Google談判,要求Google必須做到“有所為有所不為”,于是就有了“Robots協(xié)議”。
對(duì)于這份所謂的Robots協(xié)議,很多企業(yè)并不買賬。畢竟,這只是谷歌自己制定的規(guī)范,并不是各大搜索廠商的共識(shí)或統(tǒng)一的協(xié)議,也從來沒有任何一家國內(nèi)搜索引擎服務(wù)商公開承諾遵守Robots協(xié)議或簽署類似協(xié)議或聲明。 所以,在很多人眼里,充其量是谷歌的“家規(guī)”。
而事實(shí)上,這個(gè)由搜索引擎制定的協(xié)議,只會(huì)規(guī)定如何與網(wǎng)址分享內(nèi)容,絕對(duì)不會(huì)對(duì)于搜索引擎不利的條款。伴隨搜索引擎的發(fā)展,Robots協(xié)議朝著相反的法相發(fā)展:
Robots協(xié)議目的是為了限制谷歌,但最終卻幫助Google和百度這樣的壟斷企業(yè)遏制了后起的競爭者。因?yàn)?,Google當(dāng)年在制定這個(gè)協(xié)議時(shí),特意留下了后門,即:協(xié)議中不僅包括是否允許搜索引擎進(jìn)行搜索的內(nèi)容,還包括允許誰和不允許誰進(jìn)行搜索內(nèi)容。Google和百度在實(shí)現(xiàn)了壟斷地位之后,就利用這些排斥性規(guī)則擋住了后來的進(jìn)入者。
這樣看來,Robots協(xié)議是互聯(lián)網(wǎng)的一份“不平等條約”“壟斷條款”。
值得一提的是,盡管Robot造成了搜索引擎的霸權(quán)與壟斷,但當(dāng)年制定條款的初衷卻非常值得我們尊重。Robot制定的兩個(gè)原則是:
1、搜索技術(shù)應(yīng)服務(wù)于人類,尊重信息提供者的意愿,并維護(hù)其隱私權(quán);
2、網(wǎng)站有義務(wù)保護(hù)其使用者的個(gè)人信息和隱私不被侵犯。
現(xiàn)在,我們由Robot最初的兩個(gè)初衷,卻得到得到兩個(gè)與眾不同的答案:
抓取搜索頁面無罪
既然,Robot協(xié)議的初衷是為了保護(hù)“信息提供的隱私”“最終信息提供者的意愿”,那么對(duì)于在搜索引擎結(jié)果中,再次抓取的行為則無罪可言:
搜索引擎的結(jié)果被抓取,實(shí)質(zhì)上是經(jīng)過了兩次Robot。那么,如果第一次Robot是完全符合協(xié)議,保護(hù)了信息者的隱私,那么在已經(jīng)保護(hù)了隱私的搜索結(jié)果里,再次檢索,又怎能破壞隱私呢?
愿意把信息提供給百度的站長們,無非是希望訪問用戶增加、網(wǎng)站流量增加。那么,增加一個(gè)新的搜索引擎,檢索其內(nèi)容,為其帶來更多流量和用戶的時(shí)候,難道不是最大程度地滿足信息提供者的意愿嗎和需求?
所以,那些擔(dān)心百度搜索結(jié)果被抓取的人們,或許你們是對(duì)百度太沒信心了,你們太過于擔(dān)心百度搜索結(jié)果中有“隱私”了!
搜索引擎有資格獨(dú)占搜索結(jié)果么?
那么,百度能否以站長自居也使用Robot協(xié)議,拒絕其他搜索引擎的檢索呢?顯然不能。
對(duì)于Robot有人打了個(gè)比方:
如果將網(wǎng)站視為酒店里的一個(gè)房間,robots.txt就是主人在房間門口懸掛的“請(qǐng)勿打擾”或“歡迎打掃”的提示牌。這個(gè)文件告訴來訪的搜索引擎哪些房間可以進(jìn)入和參觀,哪些房間因?yàn)榇娣刨F重物品,或可能涉及住戶及訪客的隱私而不對(duì)搜索引擎開放。
如果房間代表是每個(gè)站長的權(quán)利,百度所抓取的內(nèi)容就是整個(gè)酒店,事實(shí)上它并也沒這個(gè)資格,因?yàn)樗阉饕媸遣簧a(chǎn)內(nèi)容的,所以,充其量百度是小區(qū)的物業(yè)。那么,物業(yè)有沒有資格在大門口放一塊“請(qǐng)勿打擾”的牌子呢?顯然不能!因?yàn)?,它代表不了站長,就像小區(qū)物業(yè)沒法干涉你的好朋友去你家串門一樣。
而且,搜索引擎不是制造內(nèi)容和生產(chǎn)內(nèi)容的網(wǎng)站,它不是內(nèi)容的生產(chǎn)者(百度社區(qū)產(chǎn)品不在此討論范圍),就像物業(yè)一樣,它只是一個(gè)托管者而已,它無權(quán)干擾和干涉它所檢索的網(wǎng)站被更多的搜索引擎檢索,更無權(quán)干涉搜索領(lǐng)域的后起之秀為中小網(wǎng)站帶來更多的用戶和流量。
所以,那些拿Robot協(xié)議說事兒的人們,請(qǐng)想想Robots的初衷是什么?是為了保護(hù)站長、內(nèi)容的生產(chǎn)者,而不是保護(hù)搜索引擎。而現(xiàn)在,Robots已經(jīng)變成“搜索引擎家規(guī)”和行業(yè)壟斷的潛規(guī)則,這些搜索壟斷巨頭可對(duì)流量的壟斷和控制力,正讓讓中小網(wǎng)站岌岌可危。
所以,筆者認(rèn)為Robots最缺的,不是違反設(shè)立初衷去保護(hù)日益強(qiáng)悍的搜索引擎,而是對(duì)搜索引擎自身的制約。而要想最好最大程度地保護(hù)站長,只有讓更多搜索引擎充分競爭,打破搜索引擎壟斷,才能最大程度讓利給站長,也是最快和最可行互聯(lián)網(wǎng)和諧之路。