發展這樣的軟體,先要讓電腦人性化,知道什麼叫美麗、安靜、舒適、快樂,然後才是技術,把有這樣條件的街道納入路線。但維持最短距離仍然是條件,不能為了風景故意繞遠路,以最短距離路線為基礎,如果附近有景致宜人的地方,就換到那條街。
巴塞隆納的研人員選擇了倫敦為實驗城市,首先從 Google 的街景地圖選擇倫敦市區圖片,然後借用 UrbanGems 網站評選。這個網站同時展示兩張圖片,讓評選人選一張景致比較好、比較安靜、看了比較舒服的圖片(下圖),選後記錄下來。評選一共動用了三千多人,把倫敦的街景圖片反覆交叉讓他們選擇,最後依分數高低排名,再把分數最高的圖片位置與倫敦街道結合。
(這兩張圖片你認為哪張好?取自網路)
用這樣一個圖片庫開發的電腦程式,一旦有人要求規劃路線,程式就會把距離最短,但風景好、安靜、舒適的路線規劃出來。為了證實程式精確,特請了三十名倫敦當地人實驗,這三十名倫敦人對電腦選路的結果很滿意。
滿意的結果是因為圖片是由人評選的,但手續繁複,不能每一個城市都這麼費事建立圖片庫,研究人員就進一步試用自動建構圖片庫,而 Flickr 是現成而且公開的資料來源。研究人員從 Flickr 七百多萬張與倫敦沾邊的圖片,篩檢出至少有一個標記 (Tag) 的五百萬張,再篩檢出可用的三百多萬張,從中取得元數據 (Meta Data),也就是描述圖片的資料,包括被閱覽次數、地理位置、類別、文字描述等資料。
這些龐大資料經過整理、語言分析、刪減,取得排名,以同樣方式與街道結合,再請這三十名倫敦人來評鑑,結果是「還可以」,顯然沒有第一次用人的選擇來得好,把這三十人的評鑑量化,與最短距離的汽車路線比較,在品質上僅多25%。用同樣的技術在美國波斯頓實驗,請了五十四名當地人評鑑,得到較滿意的結果,在品質上比最短的汽車路線多35%。
人的眼睛很容易判斷美麗、安靜、舒適,電腦就要靠取得資料的內容來分析,所以三千人評鑑少量的 Google 街景圖片,品質高於幾百萬張 Flickr 圖片。電腦不會「看」圖片,只能從描述圖片的元數據來判斷,Flickr 的圖片是大家隨意放上去的,沒有一致的目的,很多圖片沒有描述的文字資料,遇到描述的資料就要分解文句,找出正面、負面的語詞,判斷圖片是否合乎需要。
順便一提,這是一個「人工智慧」的例子,讓電腦有人的智慧,也是一個「大數據」的例子,從龐大沒有完整結構的資料整理出條理。
Yahoo 的巴塞隆納實驗室專家,證實了電腦可以找出適合人走的步行街道,也許不是最近,卻讓人走得舒暢。當然,舒暢的解譯見仁見智,專家們在研究報告裡也說要進一步在品質上研究,像天氣、季節、日夜、當地特殊情況,都會讓人有不同的感受,尤其是個人的喜好更難掌握。這些都是未來發展的方,也就是要對 Flickr 一類的圖片作更細膩的分析,讓電腦有能力歸劃出我們喜好的路線。
Yahoo 專家撰寫的研究報告,對電腦程式的邏輯解釋的很清楚,淺顯、有趣、易讀,有興趣的讀者可以在這裡下載。