Facebook 發表新語言 AI,可實現 100 種語言間一對一翻譯!

Facebook 這組 AI 叫做「M2M-100」,使用了 100 種語言、共 75 億條詞句以及超過 150 億個參數進行訓練。
評論
Photo Credit:Shutterstock/達志影像
Photo Credit:Shutterstock/達志影像
評論

Facebook 今天發表了新的 AI 語言模型,可以在 100 種語言之間直接一對一轉譯,而無需首先翻譯成英語!

這組 AI 叫做「M2M-100」,使用了 100 種語言、共 75 億條詞句以及超過 150 億個參數進行訓練。M2M-100 的 BLEU(雙語評估互補)分數比其他 AI 的平均分數高了 10 分,而在人類評估的準確度測驗裡也有 90% 左右的表現。

M2M-100 最大的特色就如前述在於直接語言間的一對一轉譯。過去不少 AI 語意模型使用英語作為中轉語言-也就是說,想從中文翻成法語,實際上 AI 會先把中文翻成英語,然後再用英語翻成法語。

會多這麼一次工,因為過去英語是電腦與網路世界的主要語言,其資料量非常龐大、成熟,但用英語中轉也會有降低整體翻譯準確性,並讓翻譯過程變得更加複雜、繁瑣等缺點。

但現在 Facebook 的新自然語言模型克服了這項缺點,負責這個計畫的 Facebook 員工 Angela Fan 表示,他們特別針對地理位置、文化相似性以及相互翻譯頻率,將 100 種語言分為 14 組集合後再強化訓練。

例如這組 AI 從西班牙語翻成葡萄牙語的品質就特別好,這不僅是因為這兩種語言有許多相近之處,且雙方使用人口通常地理相近、轉換頻率也高,代表研究人員有大量的語言資料可以訓練 AI;另一個範例則是「英語與白俄羅斯語」,由於俄語與白俄羅斯語也有許多相似之處,這也讓研究人員使用了許多英翻俄語的資料,搭配俄語與白俄羅斯語相似、相異之處近一步強化英語翻白俄羅斯語的翻譯品質。

延伸閱讀:




精選熱門好工作

客服⼯程師

萬欣網路科技有限公司
臺北市.台灣

獎勵 NT$15,000

Senior Front End Developer

飛迅設計有限公司 Asia Fusion Technology
臺北市.台灣

獎勵 NT$15,000

資深UX 設計師

萬欣網路科技有限公司
臺北市.台灣

獎勵 NT$15,000