银行账户年检时间在每年( )月( )日前(银行账户年检) 无道具晨会互动小游戏(无道具晨会互动小游戏室内) 黄昏英雄传攻略(黄昏英雄传2.5攻略) 双面胶怎么快速去除胶水(双面胶怎么快速去除) 苹果醋解酒么(苹果醋为什么可以解酒) 怎样关闭电脑杀毒软件和防火墙(怎样关闭电脑杀毒软件和防火墙联想) 莫斯科气温和我国哪里差不多(莫斯科气温) 魔兽世界:探索艾萨拉(魔兽世界 艾萨拉) hopes是什么意思(hope是什么意思) 孕妇可以吃杏仁吗?(孕妇可以吃杏仁吗?孕中期) 8k纸有多大比A3大多少(8k纸有多大) 武汉艺术生文化课到底该如何学习?(武汉艺术生文化课培优) 节奏大师攻略四个技巧刷高分(节奏大师怎样玩才高分) 受凉感冒是风热还是风寒(受凉) 地球的南极北极都是冰天雪地那月球的两极呢(北极和南极都是冰天雪地) 蛇蛇大作战电脑版攻略(蛇蛇大作战游戏下载) 什么是哑口套和窗套(什么是哑口) WIN10电流麦解决方法(win10电脑电流麦怎么解决方法) 平时多吃什么食物补肾效果最好(平时多吃什么食物补肾效果最好女性) 哈伦裤适合什么年龄穿(哈伦裤适合什么人穿) 魔兽世界前夕稀有精英位置一览 看完就知道了(魔兽世界9.0前夕稀有精英位置与掉落) 如何实现创业成功(如何实现创业成功发展) QQ空间如何添加大图模块(qq空间怎么添加图片模块) 梦幻西游挖矿赚钱(挖矿赚钱) 剖腹产的好处(剖腹产的好处有哪些) 如图已知ab为圆o的直径弦cd⊥ab垂足为h(如图 已知AB是圆O的直径 弦CD垂直AB 垂足为H) 深圳上下沙租房攻略(深圳下沙哪里租房便宜) 被2345和hao123主页篡改修复方法 2015(2345是怎样篡改主页的以及如何彻底删除) nba历史得分榜百度一下(nba历史得分榜百度百科) 如何防雾霾 什么口罩防雾霾效果好(什么口罩可以防霾) 制作手工的材料有哪些(制作手工的材料有哪些简单) 天使等级 北京商标注册流程图(北京商标注册流程图解析) Galaxy S4 发布 全面解析新旗舰 图(galaxy s4 上市时间) 土大黄根主要治什么病(土大黄与大黄的区别) vivo手机怎么定位(vivo手机怎么定位查找) dnf更新失败怎么办 安装文件写入失败怎么办(为什么dnf更新写入失败) 隔玻璃晒太阳能起作用(隔着玻璃晒太阳能补钙) steam国服怎么玩apex(steam国服怎么玩最终幻想14) 纳雍县是哪个市 蜂蜜可以放冰箱吗(蜂蜜可以放冰箱吗可以放多久) 电脑怎么连热点(联想电脑怎么连热点) 石器时代宠物攻略(石器时代宠物大全) 经济管理出版社地址(经济管理出版社) 芒果tv怎么看湖南卫视(芒果tv怎么看湖南卫视回放) iPhone13如何在微店购物?(iphone13直营店可以直接买到吗) 淘宝海外版叫什么(淘宝海外版) 幽门螺杆菌抗体(幽门螺杆菌抗体偏高是怎么回事) iOS7.1.1固件下载(ios7.0.4固件下载) 纸的来源视频(纸的来源)
您的位置:首页 >Nature杂志 > Nature杂志精选 >

模型为更快 更有效的更多语言翻译铺平了道路

导读 麻省理工学院的研究人员开发了一种新颖的无监督语言翻译模型 - 意味着它无需人工注释和指导即可运行 - 这可以导致更快,更有效的基于计

麻省理工学院的研究人员开发了一种新颖的“无监督”语言翻译模型 - 意味着它无需人工注释和指导即可运行 - 这可以导致更快,更有效的基于计算机的更多语言翻译。

来自谷歌,Facebook和亚马逊的翻译系统需要培训模型来查找数百万文档中的模式 - 例如法律和政治文档或新闻文章 - 这些文档已被人类翻译成各种语言。给定一种语言的新单词,然后他们就可以找到另一种语言中匹配的单词和短语。

但是这种翻译数据耗时且难以收集,并且对于全世界使用的7000种语言中的许多语言而言可能根本不存在。最近,研究人员一直在开发“单语”模型,这些模型使两种语言的文本之间进行翻译,但两者之间没有直接的翻译信息。

在本周在自然语言处理经验方法会议上发表的论文中,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员描述了一种比这些单语模型运行得更快,更有效的模型。

该模型利用统计中的度量,称为Gromov-Wasserstein距离,其基本上测量一个计算空间中的点之间的距离,并将它们与另一个空间中的类似距离点进行匹配。他们将这种技术应用于两种语言的“单词嵌入”,这两种语言是表示为向量的单词 - 基本上是数字数组 - 具有相似含义的单词聚集在一起。在这样做时,模型在两个嵌入中快速对齐单词或向量,这两个嵌入通过相对距离最密切相关,这意味着它们可能是直接翻译。

在实验中,研究人员的模型与最先进的单语模型一样准确 - 有时更准确 - 但速度更快,仅使用一小部分计算能力。

“该模型将两种语言中的单词视为一组向量,并通过基本保留关系将[这些向量]从一组映射到另一组,”该论文的共同作者Tommi Jaakkola说,他是CSAIL研究员和Thomas Siebel教授在电气工程和计算机科学系和数据,系统和社会研究所。“这种方法可以帮助翻译低资源语言或方言,只要它们有足够的单语内容。”

CSAIL博士生第一作者David Alvarez-Melis说:“如果你没有任何与两种语言相匹配的数据,那么该模型代表了机器翻译的主要目标之一,这是完全无监督的单词对齐。”你可以映射两种语言,并使用这些距离测量来对齐它们。“

关系最重要

对于无监督的机器翻译来对齐字嵌入并不是一个新概念。最近的工作训练神经网络直接在两种语言的词嵌入或矩阵中匹配向量。但是这些方法在训练期间需要进行大量调整以使对准完全正确,这是低效且耗时的。

另一方面,基于关系距离测量和匹配矢量是一种更加有效的方法,不需要太多的微调。无论单词向量落在给定矩阵中的哪个位置,单词之间的关系(即它们的距离)都将保持不变。例如,“父亲”的矢量可能落在两个矩阵的完全不同的区域中。但“父亲”和“母亲”的载体很可能总是紧密相连。

“这些距离是不变的,”Alvarez-Melis说。“通过查看距离,而不是向量的绝对位置,那么你可以跳过对齐并直接匹配向量之间的对应关系。”

这就是Gromov-Wasserstein派上用场的地方。该技术已被用于计算机科学,例如,帮助在图形设计中对齐图像像素。但是这个指标看起来似乎是“量身定做”的,Alvarez-Melis说:“如果在一个空间中有一些点或词,那么Gromov-Wasserstein会自动尝试找到相应的点集群。另一个空间。“

对于培训和测试,研究人员使用了一个公开可用的单词嵌入数据集,称为FASTTEXT,具有110种语言对。在这些嵌入和其他嵌入中,在类似上下文中越来越频繁出现的单词具有紧密匹配的向量。“母亲”和“父亲”通常会在一起,但距离“房子”更远。

提供“软翻译”

该模型注意到与其他矢量密切相关但不同的矢量,并且指定了在另一个嵌入中类似的距离矢量将对应的概率。这有点像“软翻译”,Alvarez-Melis说,“因为它不是仅仅返回一个单词翻译,而是告诉你'这个向量或单词与这个单词或单词有很强的对应关系,在另一个单词中语言。'”

一个例子是一年中的几个月,它们以多种语言紧密结合在一起。该模型将看到一组12个向量,这些向量在一个嵌入中聚类,在另一个嵌入中聚类非常相似。“该模型不知道这些是几个月,”Alvarez-Melis说。“它只知道有一组12个点与另一个语言中的12个点对齐,但它们与其他单词不同,所以它们可能很好地结合在一起。通过找到每个单词的这些对应关系然后它同时对齐整个空间。“

Jaakkola说,研究人员希望这项工作可以作为“可行性检查”,将Gromov-Wasserstein方法应用于机器翻译系统,以便更快,更高效地运行,并获得更多语言的访问权限。

另外,模型的一个可能的好处是它自动产生一个值,可以解释为在数字尺度上量化语言之间的相似性。研究人员表示,这可能对语言学研究有用。该模型计算两个嵌入中所有向量彼此之间的距离,这取决于句子结构和其他因素。如果矢量都非常接近,它们的分数将接近0,并且它们越远,分数越高。例如,法语和语等类似的浪漫语言得分接近1,而经典汉语与其他主要语言得分在6到9之间。

Alvarez-Melis说:“这为你提供了一个很好的,简单的数字,用于表达类似语言的数据......并且可以用来描述语言之间的关系。”

标签:

免责声明:本文由用户上传,如有侵权请联系删除!