balanced corpus
平衡语料库(balanced corpus)主要是指其语料的取样上是均衡的,有代表性的.这种语料可以用作得出有关某种语言特性的一般性的结论.
基于124个网页-相关网页
中央研究院平衡语料库 Sinica Corpus
·2,447,543篇论文数据,部分数据来源于NoteExpress
但是大规模双语平行语料库的获取并不容易,现有的平行语料库在规模、时效性和领域的平衡性等方面还不能满足处理真实文本的实际需要。
However, access to a large-scale bilingual parallel corpus is not easy, the existing parallel corpora can not meet the actual needs in terms of the scale, timeliness and balance of the fields.
youdao
应用推荐
模块上移
模块下移
不移动