阿里巴巴的「菜鳥語音助手」每天為數百萬物流確認服務。圖片:VRRoom.buzz
阿里巴巴在半年前推出「菜鳥」(Cainiao) 語音助手,作為物流服務的一環,在送達前對顧客確認時間與地點,每天有數百萬件服務,大家習以為常。但在 12 月 2 日加拿大蒙特婁的「神經資訊處理系統會議」(Neural Information Processing Systems Conference),展示了一段菜鳥與顧客的對話錄音,驚動了與會的 AI 專家們。下面就是這一段對話:
菜鳥:您好,我是菜鳥語音助手,您有一個中......
顧客:你好!
菜鳥:您有一個上午送到文一西路588號的中通快遞,請問您方便簽收嗎?
顧客:你哪位?
菜鳥:我是菜鳥語音助手,在快遞員送到前確認上午送到文一西路588號,您方便嗎?
顧客:我上午不在家呢!
菜鳥:哪您方便留一個簽收地址嗎?我想告快遞員為您安排。
顧客:是什麼東西啊!
菜鳥:物流單上顯示文件。那麼您留一個方便簽收的地址,我想告快遞員安排配送。
顧客:嗯......那你幫我放物業吧。那算了,還是放到我門口吧!
菜鳥:是送到門口嗎?
(......靜寂約5秒鐘......)
菜鳥:喂,還在嗎?給您放在門口可以嗎?
顧客:可以啊!
菜鳥:好的,我會將您的要求轉達給快遞員,請您注意查收,感謝您的接聽!
顧客:啊,對了,我好像還有一個中通的包裹,今天會派件嗎?
菜鳥:請稍等
菜鳥:這裡您還有一個中通快遞的包裹,預計明天送達。
顧客:我明天要出差,直接放在菜鳥譯站就行了。
菜鳥:好的,給您放菜鳥譯站好嗎?
顧客:是的。
菜鳥:好的,請注意查收,感謝您的接聽!
顧客:謝謝,再見!
菜鳥:再見!
這一段對話如果是兩個人交談,不但稀鬆平常,而且還覺得有一點厭煩,但菜鳥不是人,只是一個
AI 電腦,姑且不論發音的字正腔圓,能聽懂顧客說話的口音,而且解讀顧客的意思、做適當的回應,這在自然語言上的技術上,是相當的突破。MIT技術評論期刊的專家,從上面這段簡短對話(翻譯成英文以後),指出三個技術特點。
第一個技術特點是可以打斷對話,然後繼續接回主題,沒有再從頭開始,或跳過一些詞句,這可從開始對話看出來。菜鳥先說您好,我是菜鳥語音助手,您有一個中....,立刻被顧客打斷說你好,但菜鳥沒有重複說是自己語音助手,而是接著說有一個快遞要送過來。
第二個特點是非線性 (Nonlinear) 對話,菜鳥說有一個快遞、問是不是方便簽收?但顧客沒有回答是否方便,卻來一句你哪位?改變了對話主題內容的連慣性。這時菜鳥沒有繼續前面的話題,反而會回答了顧客的問話,介紹了自己,然後再回到主題內容繼續。
第三個特點是隱性意圖 (Implicit Intent),當顧客說我上午不在家,菜鳥立刻要他留一個方便的地址。這其中的技巧在對「不在家」的解讀,不在家,隱喻快遞不要送到那個地址,但沒有明說,採鳥就根據前面的對話,解讀不在家的隱喻意涵,接下去繼續對話。
對人來說這樣的對話再容易不過了,對機器來說是困難的挑戰,從會場的展示,MIT 技術評論認為優於 Google 在上月正式啟用的 Duplex。Duplex 也是個人語音助理,可以打電話給餐廳訂位,口音還模仿人類說話嗯啊的喉鼻音,但與菜鳥一樣也要先介紹自己是電腦,如果接聽的人不願意跟電腦說話,就會轉到一個真人。
目前菜鳥僅用在送貨的協調上,當然只要有大數據,不難發展在另外的用途上。在蒙特婁的會場上,阿里巴巴對如何訓練菜鳥的細節透露不多,但暗示大量的顧客通話紀錄是有用的資源,阿里巴巴平均每天接到 5 萬通客服電話,在雙 11 光棍節,客服數量增加 5 倍。至於菜鳥用的語音識別,則是阿里巴巴自然語言處理引擎 AliMe。
自然語言處理是任何語音系統的基礎,藉助 AI 與大數據的學習,近年進展的很快。記得在 AI 以前,一位外國友人來信說在一個研討會上看到了驚人的一幕,一個人說了一句英文,過了一會,系統翻譯說出了中文,當場大家鼓掌稱讚。我回信說他下一次到中國演講就不用翻譯了,他也回信幽默的說,他教的研究所課程有一半是來自中國的學生。
當然現在各式各樣的語言翻譯不再稀奇,性能也都很好,手機上的 App 使用便利,而且越用越會遇到不同的狀況,使機器學習讓功能愈加改善。這樣加速循環進展的結果,製造了潛能,給各個領域進入新一世代營運的契機。目前來說,至少對如阿里巴巴的龐大電商,物流的效益,無疑的會益增其競爭優勢。
VIDEO
阿里巴巴語音助手「菜鳥」,與顧客確認送貨對話展示。影片來源:YouTube