搜尋引擎是網路之窗,網路再大、資料再豐富,沒有搜尋引擎就索取不到;但同時搜尋引擎也是資訊的守門人,從天文數字的網頁裡,確實的找出搜尋人所要的資訊。1998 年 Google 崛起,開始把搜尋的結果「排序」(PageRank),排在越前面,就表示越切合搜尋人想要的內容。同時 Google 也解釋排序的邏輯,被別的網頁連結的越多,排在前面的機會越大,大家都指向你,表示大家對你這個網站的價值認同,理應排在前面。這個排序技術,除了 Google,別的搜尋引擎也已普遍應用。
搜尋的結果如果不多,排序並沒什麼問題,只是搜尋的結果往往數以萬計,甚至幾十萬、上百萬,這麼多的結果,對搜尋的人毫無意義,一般能瀏覽前二、三十個,已經是有耐性了,後面的結果僅是點綴搜尋引擎的功力而已。當然,搜尋的技術好一些、關鍵詞長一些,搜尋結果的長尾巴可以短一點,但仍以千、萬計,超出人力閱覽能力所及。
根據排序的邏輯,排在前面的搜尋結果,已經是被別的網頁連結最多、流量最高的熱門網站,現在又被搜尋到,搜尋的人可能進入瀏覽,也可能在自己撰寫的網頁裡連結,作為參考。這樣幾個來回,更讓這些排在前面網站的「排序能量」增加,下次搜尋可能排在更前面,造成網上「富者越富」的結構,新建的網站要讓人搜尋到,越來越難。幾年前有人把這種似由 Google 所統治的網路王國,稱為 Googlearchy。
搜尋引擎做為網路的窗口,沒有人反對,但作為資訊的守門人,逐漸教人質疑,因為富者越富的邏輯,不像是公平的技術。前二、三十個搜尋結果,是否真的是搜尋人想要的?真的是中性、沒有偏向?政治、文化、商業、語言、資訊來源,都是製造偏向資訊的源頭,大多的事情都有正反兩面,如果排序在前的網站內容不完整,偏向正面、或反面,就會隨著搜尋次數的增加,把偏向放大,以後搜尋的結果,就可能以偏向正面、或偏向反面的內容為主了。
有人用一個假想的例子解說這一現象。有一個高中學生寫報告,上網搜尋一種叫 Minollo 的動物(假想的、沒有這種動物),結果搜尋到 minollo-recipes.com,教人如何烹調 Minollo 的食譜。但另有一個新的網站 save-the-minollo.org,是一個保育組織,說 Minollo 是稀有的野生動物,要大家盡力保護。假設食譜排名第五、保育排名第十五,高中生急著趕報告,僅瀏覽前十個網站,就把如何烹調 Minollo 寫進他的報告,然後又連結烹調網站做為參考。這一個動作,加上以後千、萬次搜尋所增加的排序能量,烹調網站的排序就從第五升到第四,而保育網站的排序則絲毫未動。
Google 雖然披露排序的邏輯,但未公佈細節,搜尋結果到底怎麼得來,對外人仍是黑箱作業,難免教人質疑,果真全球資訊的溝通介面有欠公允,那就茲事體大了。為了證實富者越富的程度,美國印第安那大學 Filippo Menczer 教授做了一個實驗,用兩組人以不同的方式搜尋,一組用搜尋引擎,另一組完全不用搜尋引擎,從一個網站連結到另一個網站,逐步查詢所要的資料。實驗的過程,以 Alexa 網上流量計數系統,記錄每一路過網站的實際流量、以及被別的網頁連結的數目,然後比較兩組的記錄。
實驗的結果,大出意料之外,每一組所經過的所謂高知名度的熱門網站,都比預期來的少。兩組的搜尋代表兩個極端,一般人則結合兩種方式,既用搜尋引擎、也從網頁連結,從這個觀點推算,搜尋次數並沒有造成富者越富的現象,也沒有讓新興的網站永遠躲在暗處、不見天日。Menczer 教授非常驚異的說,這是他沒預料到的。
實驗得到這樣的結果,經過研究,合理的解釋是:因為有越來越多的人搜尋更具體的資訊,使得搜尋結果的數目減少,所以把流量分散到不太熱門的網站。Menczer 舉搜尋「禽流感」為例,因為是個通稱,所以搜尋結果多集中到「疾病管制中心」一類的網站,搜尋次數增加,排序能量也增加。但進一步搜尋「2005 年土耳其的禽流感」,搜尋結果的數目就大為減少,而趨向少為人知的網站。
Hitwise 是一家想辦法幫人提升搜尋結果排序的公司,說大家的搜尋行為越來越成熟,所用的關鍵詞越來越長,從這個論點看,Menczer 教授對他實驗結果的解釋是正確的,但懷疑取得資料的正確性,因為採用計量的 Alexa,是免費下載的工具,是針對市場行銷用的,對一大眾的搜尋行為,未必適合。Menczer 也知道他的實驗僅獲初步的結果,下一步要從社群網站如 Digg.com 開始搜尋,看看下一次實驗結果是縮小、還是放大這一次實驗的發現。
雖然 Menczer 教授與少數學界的人,用實驗的數據,為搜尋引擎的負面印象做一點平反,多數人還是認為富者越富的網路結構確實存在,而且這一概念還被一些網路機構納為營運策略,一時難改。搜尋引擎確實是網路之窗,沒有它就看不到外面。但窗戶到底有多透明,想看什麼就能看到什麼?還窗外擺什麼我們就看什麼?就要靠 Menczer 等專家進一步研究證實了,實驗的數據至少比揣測的好。
有興趣的讀者不妨參閱 Menczer 教授這篇 Googlearchy or Googlecrazy? 文章,對實驗有進一步的解析。
|