由大数据文摘制作
最近,一款在线机器翻译软件在日本火了。
这个翻译软件叫DeepL,火的原因是对工作太负责,翻译太准确,在日本引起了热议。
从日本网友的民间评价来看,不仅日本方言的翻译效果极佳,文言文也是如此。要知道,这是连谷歌翻译都做不到的。
但是有多准确呢?作为一款严谨的科技软件,我们当然还是要用数据说话。DeepL正式披露了日英翻译和汉英翻译的盲测结果。如下图所示,可以看出DeepL只是一个粉碎级别:
盲测是在专业译员判断不知道哪个翻译版本是由哪个网站翻译的情况下对翻译文本进行评价,这一直是DeepL的测试方法之一。
DeepL也因其出色的准确性引爆了Reddit。有网友指出,DeepL不像谷歌翻译那样从文字翻译。从text莱克特的设置来看,DeepL也支持使用以前的翻译作为上下文来提高翻译结果。
也有不少网友直呼“DeepL牛逼”!
三年前,当DeepL第一次出现在大众的视野中时,引起了很多人的关注。DeepL首席执行官Gereon Frahling曾表示,DeepL的目标不仅仅是翻译任务,神经网络将从理解文本开始,开辟更多的可能性。
至于可能还开发了多少,抽象菌做了一个小评价,然后一起看了DeepL家族的历史。小板凳已经放好了,欢迎大家坐下~
方言,文言文,学术论文,机器翻译,神仙打架!
无论是民间的评价还是DEEP官方的盲测结果,都暗示DEEP可能是目前准确率最高的机器翻译,有必要自己尝试一下。
由于本次更新也包含了简体中文,带着一点点疑惑和好奇,消化器也对DeepL做了简单的评价,并将其与目前主流的谷歌翻译、微软翻译、百度翻译和有道翻译进行了对比。
本次考核分为三轮:第一轮方言、第二轮文言文、第三轮学术论文。好了,现在我们有五位选手。
第一轮,我们来看看方言。
众所周知,中国方言文化博大精深。如果我们不能正确翻译方言,准确性就会受到质疑。
我们用东北方言选了十年级的题目:“我一个人去,你太自大了”。这个题目有两个得分点,一个是“我一个人去”,一个是“我来敲”。我们来看看五位选手的表现。
在第一个得分点上,谷歌将其翻译成“我会去那里”,微软和百度认为这意味着“我会去”,而有一种方法给出了“我不知道”的答案。DeepL表现出色,并以惊讶的语气将其正确翻译为“哦,我的上帝”。
在第二个得分点上,五位选手给出了不同的答案,如谷歌“害羞”、微软“snobful”、百度“寒酸”、有道“不好”、DeepL“丑”。
从评分来看,百度在第二题的表现尚可,有句话说……刚刚通过测试,而谷歌和微软则全军覆没。让我们来看看DeepL的满分试卷:
这是第一个问题,不用担心,还有翻身的机会。接下来,我们来看看文言文。既然DeepL可以翻译古代日语,那么如果不能翻译古代汉语就错了。
第二轮,文言文。
在文言文中,我们以唐代著名诗人张九龄的《望月》中的名句“明月,现已满满过海,照亮整个天堂”为例,意思是一轮明月升起在浩瀚无垠的大海中,让人想起远离天涯海角的亲朋好友。他此刻应该在看同一个明月。
这个题目的评分点是看选手能否用英语表达全诗的意境。好了,中文标准答案已经公布了,那么五位选手表现如何呢?
首先,谷歌、微软、百度都直接放弃了后半句的翻译,将后半句翻译成了“此时天涯”;前半句的翻译,微软和百度都用了born这个词,但是微软的翻译是“大海是天生的”????
让我们来看看DeepL。前半句和谷歌的回答完全一样,但后半句的翻译是否达到了信、达、雅的水平,抽象菌不知道,但读起来感觉很舒服,而且大家也来尝尝:
第三个问题,也是最后一个大结局,是所有参赛选手的学术论文的汉英翻译。
学术论文的关键不仅是句子的流畅性,还有专业词汇的准确性,这也是本次调查的重点。
在汉英翻译部分,我们选择了去年在国际出版社发表的一篇文章。研究者调查了社交媒体信任对隐私风险感知和自我披露的影响。
实证结果表明:1 .隐私风险感知与自我表露之间没有显著相关性;2.社交媒体信任负向影响用户对隐私风险的感知,其中网络人际信任起中介作用;3.社交媒体信任正向影响用户的自我表露,其中网络人际信任起中介作用。
从翻译结果来看,五位选手给出的答案都比较满意,句型和语法都没有问题,但在一些具体的词语上各有优势。比如“自我表露”,DeepL和微软使用“自我表现”,其他三家玩家使用“自我表露”;而“网络人际信任”被陶导、百度、微软翻译成“网络人际信任”,谷歌给出“在线人际信任”的答案,DeepL翻译成“网络人际信任”。
和往常一样,我们来看看DeepL的回答。
在英文翻译部分,我们选择了《抽象细菌》上周报道的帝国理工学院论文的引言部分。从中英文切换到英文时,只有百度、有道、DeepL可以自动识别,而谷歌、微软仍然需要手动选择语言。
原文:新冠肺炎的全球影响已经被发现,它所代表的公共健康威胁是自1918年H1N1流感大流行以来呼吸道病毒中最严重的。在这里,我们介绍了流行病学建模的结果,这些结果在最近几周为英国和其他国家的政策制定提供了信息。在没有新冠肺炎疫苗的情况下,我们评估了一些公共卫生措施的潜在作用,这些措施旨在降低人群的接触率,从而减少病毒的传播。在这里展示的结果中,我们将之前发表的微观模拟模型应用于两个国家:英国和美国。我们的结论是,任何一种单独干预措施的有效性都可能是有限的,需要多种干预措施结合起来才能对传播产生实质性影响。
从成绩来看,五位参赛选手的学术造诣都比较高,学术语言使用的规范性差别不大。但是细节是真实的,只有一种方式保留了双破折号的使用,但这在汉语中其实并不常见;除了陶,其他三位选手对"非药物干预措施"的表述并不完美。
不过,DeepL是最后一个被嘲笑的人。虽然还有各种不能拿满分的小问题,但也是妥妥的高分试卷: