The effect of corpus (particularly the bilingual corpus) has become prominence day by day in the research of language information processing.
在语言信息处理的研究中,语料库(特别是双语语料库)的作用日益凸现出来。
参考来源 - 专业语料库建立及其在机器翻译中的应用Major works are listed as follows:Material collection is the first step to do extraction. The method of locating and recognizing bilingual resource on the Internet is thoroughly discussed.
主要工作包括:收集资源是进行信息抽取的前提条件,在这一阶段,讨论在因特网上定位和识别双语语料的方法,分析并获取某个站点检索程序的结构,对于没有提供检索功能的站点,利用爬行程序链接下载。
参考来源 - 基于Web的双语资源信息抽取研究·2,447,543篇论文数据,部分数据来源于NoteExpress
双语语料对齐是自然语言处理的一个重要研究课题。
Align bilingual corpus is a natural language processing important research subject.
大规模双语语料库的建设是进行基于语料库研究的基础。
Building a large scale of bilingual corpus is the foundation of research on corpus.
对利用汉英双语语料进行翻译等价词对抽取进行了探索。
This paper examines how the translation equivalent pairs could be extracted from parallel corpus.
应用推荐