引领科技潮流的Meta公司,近期发布了革命性的语音对语音翻译技术,这一突破性进展使得闽南语的直接翻译成为现实。不久前,参与该技术核心研发的中国台湾籍工程师陈鹏仁,通过网络平台,详细解读了这项技术的孕育历程。
陈鹏仁透露,选择闽南语作为首个翻译语言的项目起点,很大程度上是因为研发团队内部有众多精通闽南语的成员,这使得他们能够迅速验证翻译的准确性和流畅性。为了打造出能够实现语音对语音翻译的系统,一支由50余人组成的研发团队不仅包括工程师,还吸纳了语言学者、社会学家乃至伦理学家等多领域专家,共同探讨目标语言的结构和文化影响。值得一提的是,即便美国和英国的英语虽同根同源,但在用字、遣词和发音上仍存在显著差异。
闽南语也面临类似挑战,不仅在台湾和福建沿海地区,即便在马来西亚、新加坡等地,闽南语的发音和用词也各有特色,七声八调的复杂性更是增加了翻译的难度。此外,闽南语缺乏标准化的文字系统,加上地区间的发音和用词差异,使得这一以口头传承为主的语言,在转换成其他语言时显得尤为艰难。
陈鹏仁坦言,在开发过程中,他们才意识到将闽南语翻译成其他语言的实际难度远超预期。Meta通过将闽南语的发音转换成数字信息,对这些数据进行分类和标注,并通过机器学习训练,让其他语言的翻译结果与之匹配。对于无法直接翻译或难以准确传达意思的部分,系统会借助相近语言进行翻译,并将结果转换为目标语言。
然而,由于算法和训练数据等方面的限制,目前这项技术还只能实现逐句翻译,尚无法支持流畅的对话。但陈鹏仁对未来的发展充满信心,他认为随着更多训练语料的积累和算法技术的不断优化,将有望实现更加实时和精准的语音互译效果。