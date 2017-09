加拿大国际广播及CBC/Radio-Canada版权所有 抄袭举报 网站:www.rcinet.ca 微信ID:radio-canada

– 人工智能翻译临近爆发点,新闻媒体也受益

在人工智能的大潮中,机器自动翻译是公认的有希望获得突破的领域。这种利用神经网络的深度学习功能不断提高的智能翻译系统在不断逼近人类翻译者的水平。在2016年的谷歌开发者大会上,谷歌的现任CEO桑达尔·皮查伊还专门展示了谷歌翻译中文到英文人工智能互译的成果。目前中文到英文的翻译水平已经基本达到人类普通翻译者的能力。

而英文到中文的翻译是一个比中文到英文翻译更加复杂和困难的事。这或许也是谷歌为什么在2016年的谷歌开发者大会后就较少提及中文-英文互译的原因之一。

新闻类的翻译又是一个更大难题。它会牵涉到上下文、现实环境以及更人性化的表达和习惯用法的问题。我们利用谷歌翻译来自动翻译CBC新闻的标题和加广中文新闻互译,并将结果对比另外三两个来自中国的同样也是利用人工智能深度学习来提高翻译能力的系统,百度翻译、搜狗翻译和讯飞。

自动翻译CBC蒙特利尔当地新闻

我们选择了一个和现实最相关的地方新闻的例子:Montreal West Library dedicates room in memory of beloved storyteller Stuart McLean

这个标题正确的翻译应该类似于:“蒙特利尔西部图书馆以深受爱戴的故事人Stuart McLean名字命名纪念房间”。它属于比较难翻译的意思复杂逻辑相互嵌套的句子。

人工智能翻译的实例:

谷歌翻译

蒙特利尔西部图书馆致力于记忆心爱的讲故事者斯图尔特·麦克莱恩的空间
居民们聚集在图书馆,庆祝麦克莱恩的名字开幕
蒙特利尔西部公共图书馆已经开创了一个新的房间,以纪念屡获殊荣的幽默主义者和二月份68岁死亡的"乙烯基咖啡"主持人斯图尔特·麦克莱恩(Stuart McLean)。
长期的CBC电台主持人最初来自蒙特利尔西部,图书馆选择通过在他后面命名一个阅览室来兑现他的遗产。

中国科大讯飞

蒙特利尔西图书馆在记忆中最爱讲的是斯图尔特·麦克莱恩
居民们聚集在图书馆庆祝这个房间的开放
以麦克林的荣誉命名蒙特利西公共图书馆开创了一间新房间,以表彰获奖的幽默大师和乙烯基咖啡馆主持人斯图尔特·麦克林,谁死于今年二月68岁。
他最初来自蒙特利尔西部,而图书馆则选择以他的名字命名一个阅览室来纪念他的遗产。

搜狗搜索人工翻译

蒙特利尔西图书馆致力于纪念爱讲故事的斯图亚特·麦克莱恩的故事
居民聚集在图书馆庆祝以麦克莱恩的荣誉命名的房间的开放
蒙特利尔西部公共图书馆为纪念获奖的幽默作家和乙烯咖啡馆的主人斯图尔特·麦克莱恩开创了一个新的房间,他于2月去世,享年68岁。
长期的CBC广播电台最初是来自蒙特利尔西部,图书馆选择在他身后命名一个阅览室来纪念他的遗产。

百度翻译

蒙特利尔西部图书馆致力于心爱的说书人Stuart McLean的记忆里
居民聚集在图书馆庆祝房间的McLean的名字命名的开放
蒙特利尔西部公共图书馆有了一个新房间的获奖作家的荣誉和乙烯CAFé主持人Stuart McLean,谁死在68岁二月。
长期的CBC电台主持人最初来自蒙特利尔西部,图书馆选择在他身后指定一个阅览室来纪念他的遗产。

各家中文到英文自动翻译的比较

中文到英文翻译的测试我们选择了我们的记者亚明的文章,题为《美国要向加拿大制造的飞机征收220%的惩罚性关税》

中文到英文人工智能翻译的实例:

谷歌翻译

The United States will impose a punitive tariff of 220% on airplanes made in Canada On Tuesday, the US Department of Commerce made a preliminary decision on Boeing’s complaint to Bombardier, who sold a C-Series mid-range passenger plane at a low cost to Delta Airways, to impose a countervailing duty of 220 percent on Bombardier’s aircraft.

百度翻译

The United States will impose a punitive tariff of 220% on aircraft made in Canada On Tuesday, the U.S. Department of Commerce on the Boeing Bombardier of Canada (Bombardier) Company complaints sale C series of medium range airliner case to make a preliminary decision at Delta Airlines Inc, countervailing duties to Bombardier aircraft 220% levy.

搜狗翻译

The United States levies a 220 per cent punitive tariff on aircraft made in Canada On Tuesday, the commerce department filed a preliminary decision on Boeing’s complaint against Canada’s bombardier to sell a c – series intermediate range airliner at a low price to the us delta airlines, charging a 220 % countervailing duty on the aircraft made by bombardier.

科大讯飞翻译

The United States will impose 220% punitive tariffs on the aircraft made in Canada. On Tuesday, the United States department of commerce filed a complaint against the Canadian pangbadi (Bombardier).The company made a preliminary decision on the United States delta airlines to sell the C series of mid-range airliner 1, and levied 220% anti-subsidy tax on the aircraft made by the pangbadi.

初浅分析看端倪

通过初浅分析各家翻译结果,我们可以得到这样的印象:

首先,中文到英文翻译基本解决,达到帮助人类理解其他语言的水平。大致的排名是:

谷歌 – 搜狗 – 百度 – 科大讯飞

但是,英文到中文目前各家都做得不好,还未达到基本流畅理解水平。其中相对较好的是谷歌和搜狗翻译。其中,谷歌逻辑较好而搜狗中文语感较好。大致的排名是:

谷歌 – 搜狗 – 科大讯飞 – 百度

当然这只是一个初略的了解,而且各个公司在推出自动翻译时各留一手,所以这并不是结论,只是方便人们比较了解人工智能翻译的现状。

人工翻译爆发在即

目前的语言翻译还只能说处于一个爆发的前期,大家都在努力,但是人工智能深度学习需要的是时间的积累。在人工智能翻译的最后一米,花费的时间和精力都是最大的。

打个不确切的比方,中文到英文大约达到普通人类翻译者的80% – 90% 水平,而英文到中文大约是普通人类翻译者的60% – 70%。

就媒体界实际应用而言,人工智能翻译草本 +人工审核/润色是现在最好的组合。这样既能大幅度提高效率和产量,又能够填补人工智能翻译在最后语感和复杂句式能力缺失。

