HOME

 

 

那福忠,知名電子出版專家、網路作家。
   
  Google Scholar
  那福忠 December 30, 2004
  請把你的想法寫信給我: Frank.Na@Gmail.com
   

    網上搜尋,除了少數專業資料庫,基本上是免費的。一般的資料,還沒開始搜尋、搜尋到的結果也不知道合不合用,先要人家付費,恐怕沒有人願意。資料到底值多少錢,要看用的人認為有多大價值,價值越高當然越值錢,由用資料的人付費,或由贊助人付費。Google 的搜尋服務,是全球使用最頻繁的網站,雖然是免費的,其營運費用,卻相當由搜尋的廣告支付。搜尋結果網頁的右側,經常有幾則方塊文字小廣告,連結到廣告主的網站,廣告內容與搜尋主題切合,對搜尋的人是另一種協助。別看不起這只有幾個字的小廣告,它卻給 Google 每年賺進 30 億美元。

    Google 當然不會滿足於這「區區」30 億美元,因為廣大群眾的搜尋是鬆散的,營收雖然集少成多,潛能畢竟有限。認真使用資料的大用戶,反而是學者、專家、研究人員,這些人與普羅眾生來比,固然是少數,但他們在資料的花費上卻毫不吝嗇,單在美國每年就有 120 億美元的市場,只是長期被幾家大出版商如 Reed Elsevier 與 Thomson 所把持,大型網路企業像 Yahoo 與 Amazon.com,特別是 Google,莫不想從這個市場分一杯羹。

    Google 在不久之前,靜悄悄的推出專門給學者們的搜尋網站,稱為 Google Scholar(學者),在專業資料的搜尋上,遠勝於原來的 Google。哈佛大學生物教授 Daniel Branton,長年利用 Google 來尋找實驗室用的設備,但對每一種市面上設備的評估,卻找不到有用的文獻,自從使用 Goole Scholar 之後,情況大為改善,僅輸入幾個關鍵字,就能在極短的時間搜尋到有用的解答,甚至比哈佛資料庫的搜尋便利有用。這位教授在興奮之餘,說他也不在乎 Google 摻一些廣告進去。教授給 Google Ssholar 的掌聲,正是 Google 需要的,目前 Scholar 裡雖然沒有把廣告,以後極可能加入,而且會收取高價的廣告費。

    搜尋網站的一大要件,是搜尋結果的順序排列,搜尋結果不管有幾千、幾萬個,仔細瀏覽的總是前幾個,第二、三十個以後也就多半就不管了,所以用什麼機制把最正確的解答排在前頭,就成了搜尋網站關鍵技術。Yahoo 用了許多人力把資料分類,有相當高的準確度,另有搜尋引擎用簡單的方式,以搜尋主題在網站內出現的次數為排序依據。但在 Google 卻採用反方向的邏輯,哪一個網站在這個主題上被別的網站連結的最多,就排列在前頭,因為被別人指向最多的網站,必然是最受歡迎的網站,既然最受歡迎,內容必定與主題最切合。

      Google 的搜尋邏輯雖然在普及搜尋上成功,卻不適用到學術與專業的搜尋上,因為學術與專業上的需要,通常不是指向最多、最受歡迎的網站,所以反指向的邏輯不管用,要用一套衡量學術專業網站的新邏輯。新邏輯有:作者,這篇論文、這本書的作者越出名,學術專業的地位越重;出版者,學術專業的著作,與出版期刊或機構有密切關連,能在國際知名期刊刊出的論文,內容的品質相對提高;別的學術論文引為參考文獻的數目,是另一指標,這與普及版 Google 的反指向類似,引用這篇論文作參考文獻的論文越多,這篇論文自然越有價值。Google Scholar 搜尋到的結果,都是根據這幾項準則來排序的。

     Branton 教授與一些學者,雖然對這個學術搜尋引擎給以好評,但認不若其餘的專業資料庫公布資料取得的來源,不知道資料從哪裡取得的,也就無從查考資料是否齊全。夏威夷大學圖書館學教授 Peter Jacob 試圖搜尋全部 PubMed 資料庫裡的醫學研究報告,結果共取得八十七萬筆資料,實際上這個資料庫有一百五十萬筆。Google 解釋說,這個搜尋引擎才上線一個月,希望大家提供意見,同時也繼續增加學術與專業資料內容,供學界便利。

    Google Scholar 對所搜尋到的資料做進一步參照,例如搜尋到的論文有參考文獻,如果參考文獻是另一本期刊上的一篇論文、而這篇論文 Google 也找得到,那參考文獻就會連結到文獻的本文,這種連結可以一直連下去。這樣自動連結參考文獻,對研究作者,確實有相當的助益。

   與 Google 搶學者專家的,還有 Amazon.com,這家網上書店去年把二十萬本書數位化,推出書內查詢 (Search Inside) 功能,讓讀者用關鍵詞查到含關鍵詞的那一頁,可以繼續閱讀兩頁,然後再查,次數不限。上月又推出 Citations 功能,介紹一本書的時候,列出這本書裡提到別的書的書名,以提到這本書的別的書的書名。Yahoo 也不例外,近來擴大搜尋領域,增加不少學術內容的能見度,否則這些內容必然會在龐大的網上搜尋邏輯中消失。     

    看樣子這些網上大亨,確實找到了一條新的路徑。

上一篇   下一篇 索 引