9月27日,谷歌推出了新的翻译系统,声称该套翻译系统基于对人类神经思考的模仿,能够与真人翻译竞相匹敌。众所周知,将汉语恰切地译介为英语是一件不易之事。输入中文,翻译系统给出的答案往往是“惨不忍睹”,简单的机械翻译对于那些谷歌翻译的依赖者来说已远远不够。
在谷歌发表的题为《规模生产中的神经网络机器翻译》的文章中,宣布将机器学习技术纳入网页和手机APP翻译中,从前汉译英的尴尬局面将大为扭转。谷歌公司称,相较之前的算法,谷歌神经机器翻译能减少80%的错误,与通过标准测试的真人翻译所差无几。
那么,谷歌中译英新版是否真的有这么神?金雯教授亲自进行了测试,她得出了这样的结论……本文经授权转载于“复旦外语(fudanwaiyu)”微信公众号,原文标题:《谷歌新版翻译有多神?英文教授亲证后告诉你...》作者:金雯(莫水田)。
谷歌中译英新版凌厉登场,“神经网络翻译”和机器学习等字眼引动了许多不彻底的欢呼和不确凿的惶惑。
我不懂机器学习技术,但我对它是友好的,况且我懂中文和英文,理解翻译这件事。所以我也就不避纷扰,来发表一些我个人对于Google Translate目前中译英水平的观感。
首先,谷歌翻译功能不需要翻墙,在国内也可以用,所以以下我说的内容,大家都可以重复验证,并提出自己的观点。 谷歌翻译的网址:translate.google.cn 可以选择中译英的设置,因为中译英功能是这次谷歌技术的突破点。
我的总体感受
谷歌中译英对写得像英文的中文句子比较能应对自如,就是那些主语谓语宾语等成分清晰的句子。尤其惊艳的是对于包含两三个短句,当中用逗号连接,逻辑关系清晰(即西化)的中文句子,谷歌翻译能够正确识别何为主句,何为表达因果、伴随状态的状语从句。当然,对许多四字成语和俗语(如“梁上君子”、“图样图森破”等)也有备而来,至少在单独出现的时候能够识别并正确翻译。
这也就是说,谷歌中译英比较适用于一板一眼的中文,比如写得干涩而又十分清晰的科学论文和人文社科类论文(即便是这类论文,也会出现机器无法处理的长难句),或许也适用于一部分新闻社论。这类中文用谷歌翻译成英文后,经人工修改把关,问题就不大了。这样的确可以节省许多初级、机械的翻译人工,对翻译生产力是一种解放。至于会不会引发大量翻译失业的问题,还不能就此作出判断。
然而,谷歌中译英对于大部分散文作品、日常电邮交流(可能有官话,可能有省略式表达)、口语化的生动表达、诗词曲艺、文字游戏等,都还只能望洋兴叹。而且,我发现,即使是谷歌认识的短句式和俗语,出现在有些复杂蜿蜒的句子中时,也会让谷歌犯迷糊。
中文与英文也有许多不兼容的地方,有自己独特而狡黠的语法。况且,自然语言是灵动的,不论中英文,写的灵动的时候都是不机械,不容易理解的。对语言的灵动,机器目前是无能为力的,不知未来如何。还是希望研究语言文学的人与科技界人士多多交流互补,虽然主力军还是人工智能人士。
有的人说,为了使用谷歌翻译,可以将自己的中文句子写成机器可以辨认的样子。这个技巧当然是没错的,为了论文能够顺利快速地翻译成英文,也不失为一个权宜之计。可是这项技术不应该是为人服务的吗? 如果让自然语言削足适履,科技就真的变成禁锢人类语言才华的枷锁了。
下面就具体地谈谈谷歌中译英功能的一些问题
由此也可以发现许多自然语言的奥秘和中英文差异。
1、主语的问题
汉语中主语的位置非常灵活,也往往会在句子中省略,这会给机器带来不少困惑。而且,如果主语比较长,本身就是一个词组(这种情况中英文实际上都有)的话,谷歌翻译就更加吃力。例证如下:
1) 原句:您预约的馆际互借图书已到馆,请尽快至闵行图书馆馆际借书处取书。
机器翻译:You have booked the interlibrary loan book has been to the Museum, as soon as possible to the Minhang Library Interlibrary borrow books from the book.
正确翻译:The interlibrary loan book you ordered has arrived at the library. Please come as soon as possible to the Minhang Library to pick it up.
“你预约的馆际互借图书”是用一个词组做主语,机器还没明白,以为“你” 才是主语。而后面的半句里主语省略了,在机器的翻译中也就发生了句子残缺不全的情况。
2) 原句:这本书只好去网上买了。
机器翻译: This book had to go online to buy.
正确翻译:I will have to order this book online.
这个句子的主语缺席,可以是“我”,也可以是“你”,要看语境,但机器以为主语是“这本书”。(另外还有一个问题,那就是机器默认的时态是过去时,而原句实际上是将来时,机器还不能辨认。)
3)你想看的电影已经上映。
机器翻译:You want to see the film has been released.
正确翻译: The film you want to see has been released.
机器又以为主语是你,而不是电影。
2、动词的问题
汉语中经常出现用形容词或形容词词组做动词的情况,对谷歌是一个挑战。 例证如下:
1) 原句: 桃红柳绿。
机器翻译:Pink willow green
机器懵了。应该说The peaches are red and the willows are green.
2) 原句:谷歌新技术面世。
机器翻译:Google s New Technology available.
谓语“is”缺少。
3) 原句:北京近日多雨。
机器翻译:Beijing recently rainy. 同上理。
4) 原句:肉熟了。
机器翻译:Meat cooked.
应该是The meat is cooked. 这里不仅动词缺少了,冠词也没了。中文里不用冠词,所以谷歌不知道这里应该加The,这个问题需要比较高水平的人工译者来纠正。
3、时态的问题
机器很难确定一个中文句子实际上表达的是什么时态。默认的是过去时,有时候也懂得用一般现在时,但总体比较机械。例证如下:
1) 原句:他不相信。
机器翻译:He did not believe it.
2) 原句:他不相信世界。
机器翻译: He does not believe in the world.
这里我要表扬谷歌翻译,它正确地判断出第一句是过去时,第二句是一般现在时,令我惊叹!
3)原句:一星期前我回家了,第二天就有小偷来摸索北房的铁丝窗。
机器翻译:A week ago I went home, the next day there is a thief to explore the north room of the wire window.
第二个短句应该也是过去时,但机器用了现在时,不明白要与前面一个短句承接的道理。
4)原句:他回想起过去的三年,不禁有些悲凉。
机器翻译:He recalled the past three years, can not help but some sad.
道理同上,第二个短句也应该是过去时。
4、灵动的散文句子
对于这些句子,机器还没有学会解读。其实在人工翻译中,这类句子也是最难翻译的,要用既符合英语语法,又精炼灵巧的方法译成英语,非常困难。以前我上高级英语课,会讲一点这类散文句子的翻译。
1)原句:周作人《苦雨》-北京近日多雨,你在长安道上不知也遇到否,想必能增你旅行的许多佳趣。
机器翻译:Beijing recently rainy, you do not know Chang'an Road, also encountered no, must be able to increase your travel a lot of good fun.
机器彻底没辙,这属于不能看的英文句子。不知所云。
2)原句:他自小受家庭影响,不爱说话。
机器翻译:He was affected by family, may not talk.
这里,谷歌翻译没弄明白后面一个短句是一个结果。如果把这句中文改成: 因为他从小受家庭影响,所以不爱说话,那么机器应该是可以理解的。当然,有人要说了,我凭什么要改的这么累赘。
3)原句:他回想起曾经为他做的事,觉得自己实在委屈,又没处申诉,便郁闷起来。
翻译:He recalled what he had done for him, feel that they really wronged, and no place to appeal, they depressed.
同理,句子各部分之间的逻辑关系谷歌翻译没有弄明白,这个句子缺乏表示逻辑关系的连词,各部分的语法关系不明确,所以对机器构成挑战。
5、古诗词
1) 原句:青鸟不传云外信,丁香空结雨中愁。
机器翻译:Bluebirds do not pass the letter of the cloud, cloves empty knot rain.
前半句语法还比较清晰,谷歌翻译还可以勉强为之,后半句的“空”不符合一般语法要求,所以机器对后半句是完全崩溃的。
2) “比较”这个词。
原句:我感到比较郁闷。
机器翻译: I feel more depressed.
中文里的 比较 不一定要和其它东西或人比,就是表示一种中间程度。而英文里一定是两相比较。这是中英文差异的一个小小侧面,是英语学习者的难点,也是机器翻译的难点。
我的测试当然不完全,但是足以说明,机器翻译的难点和人工翻译的难点有不少重合的地方,人觉得难的,机器也一样不会处理。但机器在处理简单翻译任务的时候比初级水平的人工译员要可靠,这大概就是机器的神奇之处吧。
祝谷歌翻译前程似锦,而我们人类也会不断磨砺翻译和语言能力,与机器联手,既深刻地参透语言的规律和秘密,又超脱不羁地使用真正活着的语言。
作者:金雯,华东师大教授,美国西北大学博士,2006-2013年在哥伦比亚大学教授核心课程“西方文学史”,“美国文学史”和“亚裔美国文学史”。也可关注金教授的微博或豆瓣(莫水田)获得更多的信息。本文也同步发于文汇客户端。未经许可,禁止转载。联系邮箱: 2667428845@qq.com
德迅网 » 谷歌中译英新版到底有多好
相关文章
免责声明:本文由网友提供互联网分享,不代表本网的观点和立场;如有侵权请联系删除。