当前位置:首页 > 科技资讯 > 正文

AI翻译的文化挑战与人类的最后一公里

在巴布亚新几内亚的原始部落中,情感的中心是肝脏而非心脏;而在纳米比亚,有一个专门的词汇形容「光脚踩在热沙上」。这些人类经验的细微差别,正成为AI翻译难以逾越的「最后且最远的一英里」。

在巴布亚新几内亚的丛林深处,阿瓦人(Awa)并不认同心脏是情感的中心。

若要对他们表达真诚,你不可说「敞开心扉」,而应该说「敞开你的肝脏」。

而在这个岛屿的另一端,拉瓦人(Rawa)坚信,人类的灵魂与情感栖息在胃里。

AI翻译的文化挑战与人类的最后一公里 AI翻译 文化差异 语言壁垒 人机协作 第1张

这些细微且复杂的文化差异,曾是翻译者数百年来难以跨越的鸿沟。

但如今,硅谷最前沿的AI正试图填平这个鸿沟。

被遗忘的语料荒漠

对于ChatGPT或Gemini这样的通用大模型来说,英语是「富人区」,中文和法语是「中产阶级」,而像阿瓦语这样的语言,则是彻底的「贫民窟」。

在AI的训练集中,英语占据了90%以上的份额。

这种数据的不平衡创造了「算法霸权」:模型倾向于用英语的逻辑去理解世界。

当你输入一个复杂的中文成语,AI往往先将其「脑补」成英文语境下的对应概念,再翻译回来,导致原意的流失。

在那些仅有数千人使用的「低资源语言」中,情况更为糟糕。

互联网上几乎不存在这些语言的文本数据,AI无书可读。

威克理夫圣 经翻译会(Wycliffe)手中的《圣 经》,往往是这些边缘语言中唯一存在的长文本。

他们要在2033年前实现「让所有语言都有译本」,实现他们愿景中的「基督再临」。

2022年,Meta开源了名为「不让任何语言掉队」的AI模型NLLB-200 (No Language Left Behind)

相关新文章(非上述旧模型):翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言

扎克伯格的本意或许更多是为了让他在非洲和亚洲的用户能更顺畅地刷Instagram,从而提升广告效率,但这个模型意外地成为了语言学家的新宠。

翻译机构迅速采用了这个本为商业互联设计的模型,将其微调用于处理那些最晦涩难懂的古老方言。

AI的幻觉

数据科学家丹尼尔·惠特纳克(Daniel Whitenack)发出警告:你不能把经文直接扔进ChatGPT然后坐等结果。

AI翻译的文化挑战与人类的最后一公里 AI翻译 文化差异 语言壁垒 人机协作 第2张

因为当AI遇到它不懂的领域时,它不会沉默,它会撒谎,也就是AI幻觉。

以《圣 经》翻译为例,这简直是AI的噩梦。

新约由一种并不规范的古希腊语写成,充满了歧义。

比如主祷文中「赐给我们今日的epiousion饮食」,至今无人确切知晓这个词的含义,学者们只能妥协地译为「日常」。

没有身体的翻译官

AI最大的强项和软肋,在于它没有肉身。

它从未感受过饥饿、寒冷或疼痛,因此它无法真正理解那些基于生理体验的隐喻。

在纳米比亚的鲁匡阿里语(Rukwangali)中,有一个词叫「Hanyauku」,特指「脚尖踩在滚烫沙子上走路」的动作。

AI翻译的文化挑战与人类的最后一公里 AI翻译 文化差异 语言壁垒 人机协作 第3张

对于生活在沙漠边缘的人来说,这是一个极具画面感的日常词汇。

但对于生活在服务器机房里的AI来说,这是一串无法解码的乱码。

翻译的最后一公里

这不仅是关于《圣 经》的故事,更是关于人类沟通终极困境的寓言。

我们在试图构建一种通用的理解工具,但语言本身却是极其私人和部落化的。

每一个「不可翻译」的词汇背后,都是一种独特的生活方式。