30.5 C
Hong Kong
城中熱話【AI翻譯】Meta口語翻譯首推閩南語 S2UT聲波系統打破語言隔閡?全球竟有3,500種常用語言沒有書寫系統!

【AI翻譯】Meta口語翻譯首推閩南語 S2UT聲波系統打破語言隔閡?全球竟有3,500種常用語言沒有書寫系統!

現時的翻譯軟件主要是針對書寫語言來進行翻譯,而許多沒有實體文字的方言則難以翻譯。科技企業 Meta 推出了名為「S2UT」 (speech-to-unit translation) 的翻譯技術,將原來沒有實體文字的語言,直接透過語音的翻譯方式轉換成另一種語言。 Meta 官方表示,以往人工智慧語音翻譯主要集中在書寫語言上,但近 3,500 種生活語言是並沒有書寫系統的口語,是次研究將集中開發口語間的轉換。 

新創技術 S2UT 的原理是將沒有實際文字的語言轉換成數位聲波資料,並讓機器與其他可轉換為文字內容的語言交叉對比學習,繼而將語言分檔保存,透過識別聲波直接將語言翻譯。若機械遇到新語言,系列則會建立另一套翻譯模組,藉由其他語言進行翻譯。例如閩南語的原意無法直接翻譯成英語的情況下,會先將閩南語翻譯成中文,系統再參考中文內容詮釋成英語。 

Meta 選擇了閩南語作為 S2UT 的第一種開發語言,閩南語的使用人口超過5,000萬人,同時亦是中文語系其中一種代表語言,但由於沒有實體文字,所以無法透過一般翻譯技術轉換成其他語言。Meta 希望藉著 S2UT,人們可以打破語言隔閡,以最自然的方式交流,讓不同文化進行深入的互動。 

更多文章