數位 AI 碰上類比「電話科技」:Naver DUET 技術如何解決餐廳預約痛點?

LINE 在日本上線 AI 接餐廳訂位的服務「AiCall」,背後運用的是 Naver 團隊的 DUET 技術,其中到底有哪些開發眉角和理念?
評論
Photo Credit: Mia/INSIDE
Photo Credit: Mia/INSIDE
評論

在今年(2019)LINE DEV DAY 開發者大會上,來自 Naver CCAI 部門的技術主管都炅兑現身說法,分享看上「電話」領域應用的原因,以及開發過程中克服的問題和使用者觀察,還有外界常常拿來比較的 Google Dual CallJoy 電話預約服務。

都炅兑說,團隊一直在找尋一個有確切需求的領域來開發新服務,並約在兩年前觀察到電話科技很有未來「game changer」的潛力,再進一步鎖定「預約」這個大多數人會選擇電話溝通卻又耗費人力的應用,甚至還能在預約時間前打電話提醒客人,追蹤到場狀況。

延伸閱讀:智慧城市「市民優先」日本福岡與 LINE 合作,防災、丟垃圾、設施報修一站搞定

與 Google CallJoy 的差別?

也許讓 AI 幫忙講電話真的是個趨勢,不少人會將 Google 在 2018 年的 I/O 開發者大會上揭露透過 AI 技術的 DUET 拿來與 Duplex 相比。

擬真模仿人類說話語氣,作為智慧助理服務的一環當起使用者的秘書,幫忙打電話給店家訂購商品、預約服務。其口氣與真人相仿的程度不僅在發表會引起驚嘆,甚至在服務上線在美國等特定地區上線後,加入聲明讓對方瞭解來電者是機器人以免誤會。

在 2019 年 5 月 Google 進一步針對中小企業商家推出接受預約的客服型 AI 接電話語音服務,稱作「CallJoy」。

都炅允認為,關鍵在於 Duplex 技術和其延伸出來的產品 AiCall 預約服務打從一開始就鎖定「商家預約」甚至是「餐廳預約」用途,Google 就算推出了 CallJoy,但最初是由手機智慧助理的角度出發,儘管機器學習部分使用的語音模型也許大同小異,但要將應用建構到商家端會產生基礎架構與使用體驗、對話內容的優化差異。

而且 AiCall 作為產品更看重實用性與解決預約問題,因此「擬真」暫時不會是團隊優先努力的方向。

延伸閱讀:刷臉進場、電話預約!LINE DEV DAY 開發者大會秀 AI

與聊天機器人、智慧音箱的差異與挑戰

為了研究電話預約的對話內容與使用行為邏輯,研究團隊打過無數通預約電話,發現了許多特殊的洞察。首先,儘管線上訂位普及,還是有大約 65% 的客人會用電話預約,再來,人類其實大多不擅長講電話,需要經過一定訓練來應答,又容易犯錯。

近年聊天軟體機器人也常用於客服,雖然 AiCall 可以將對話內容紀錄轉換成文字,但要是直接把客服聊天機器人直接轉成有聲版,就會發現缺少文字和互動選單等視覺展示,將讓對話難以進行。

而智慧音箱通常沒有一來一往的「對話」,而是由使用者發出一句一句的指令,所以預約的對話情境相較起來要複雜得多。

再來,網路電話基本上有 24k,足以傳遞高音質語音甚至視訊,限制於電話本身大約 8k 的傳輸率,聲音品質低而不清晰,因此需要為此再另外建立聲音辨識模型。

最後,都炅兑認為要推廣 AiCall 這個產品,並且解釋技術中與智慧音箱或其他應用的不同,也是不容易的溝通工作。

延伸閱讀:開發者的同樂會!LINE DEV DAY 2019 為什麼要辦兩天?

語音數據來源

由於 LINE app 的對話內容為點對點加密,LINE 事實上並無法存取使用者的語音,自然也沒有相關數據。都炅兑說,團隊採用常用的 NLU 自然語言模型,其中不少已經有訓練好的檔案,另外也會購買現成對話語音,甚至聘請兼職人員進行情境對話來訓練機器學習模型。

另外投入應用時,店家若已經有建立好線上預約系統,會更方便串接,也會先有一些數據可以參考。另外團隊也會請餐廳提供一些常見問題,比如「有沒有嬰兒座椅」之類的選項給他們設計。

LINE Dev day

留白的訊息:「沈默」也很重要

除了對話內容以外,電話中的留白間隔也是影響消費者感受的重要因素。都炅兑分享,當雙方透過電話談話時會有幾種說話時機,造成語音重疊、互動平衡和空白靜默三種狀況。太久沒有回應會讓對話者感到緊張,如果是發生錯誤,智慧音箱還有燈號提示,但電話 AI 就必須用「喂?」「有什麼我可以協助的嗎?」等技巧對話明確要求對方再說一次。

這裡團隊也充分運用對話安排來提供與獲取所需資訊,比如 AI 提供給消費者的資訊太多或太少,因為得不到預期的答案,通常都會引發消費者再做二度詢問,系統偵測失敗 3 次就會轉接給餐廳人員;或者訂位名字會不知字形,也可以詢問客人「怎麼拼」來獲取正確的訂位名稱。

團隊也依照不同地區測試最適合的沈默時間長度,調查使用者多不多話、語速、重疊對話、音量等等指標。「日本人對語速很敏感,不僅語速快,也期待對方快速回應。」都炅兑分享,「像韓國人就是比較多話。」

未來拓展其他領域與國家

現在 AiCall 主要針對韓國與日本餐廳做最佳化開發與應用,面對未來能否應用到餐廳以外的預約甚至克服領域,都炅兑保持開放態度,不過短期看來尚未著手開發。

或者若要拓展到向台灣這樣的其他市場,就得再進行市場調查來找出實際的需求。「比如國大多用電話點外送,台灣可能就會用 app。」都炅兑舉例。

至於到底有沒有進軍其他國家的規劃?都炅兑則表示目前不方便透露。




精選熱門好工作

SEO & Content Marketing Strategist 內容行銷

Oursky Limited (Taiwan)
臺北市.台灣

獎勵 NT$15,000

(Platform)Senior Software Engineer

ShopBack 回饋網股份有限公司
臺北市.台灣

獎勵 NT$15,000

財務行政專員 Finance Associate

百睿達有限公司
臺北市.台灣

獎勵 NT$15,000