Google的MT是基于统计的,内部有平行语料(parallel corpus),比如一段英语,有对应的一段中文翻译;一个英语单词,有对应的中文词语。
基于12个网页-相关网页
In the past three decades, numerous parallel corpora of European languages have been built.
在过去的三十年里,各国的研究人员相继建立了许多印欧语言的平行语料库。
参考来源 - 汉英双语平行语料库中对齐方法的研究·2,447,543篇论文数据,部分数据来源于NoteExpress
基于平行语料抽取双语词典是一个很重要的研究方向。
The research on the bilingual dictionary extraction based on parallel corpora is an important direction.
平行语料库研究是近年来语料库语言学横向发展的新趋势。
The research on parallel corpus is a new trend for corpus linguistics horizontal development.
适用于翻译研究的语料库主要是平行语料库和可比语料库。
Corpora applicable to translation research includes mainly parallel corpora and comparable corpora.
应用推荐