语料,即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。
n. corpus
misc. linguistic data
关键词】 古今汉语;平行语料库;语料; XML 标注;句子对齐 [gap=14429]Keyword: Classic-Cotemporary Chinese; Parallel Corpus; Corpora; XML Marking; Sentence Level Alignment
基于16个网页-相关网页
converstion » 语料 children can study not only in modern schools but also on the internet. » 儿童不仅可以研究在现代学校,但也在互联网上。
基于12个网页-相关网页
语料库 text corpus ; [计] Corpus ; The Bank of English ; corpora
英国国家语料库 British National Corpus ; the BNC
语料库语言学 [计] Corpus Linguistics ; An Introduction to Corpus Linguistics ; Douglas Biber
布朗语料库 Brown Corpus ; Brown corpora
国际英语语料库 International Corpus of English
美国国家语料库 American National Corpus
美国当代英语语料库 Corpus of Contemporary American English ; COCA
英语语料库 the Bank of English ; COBuILD ; English Corpora
平行语料库 parallel corpus ; Parallel corpora ; GEPCOLT
This leads to the development of corpus-based linguistic study.
从语料库语言学的角度来研究语言便是顺应这种变化和要求发展起来的。
参考来源 - “这Developing the idea of treating the whole Internet as a corpus.
4.提出将整个互联网作为语料库的思想。
参考来源 - 自然语言文本中数字水印的设计与研究By using this system, feature selection and weight computation can be studied, trained and tested for different language materials directly.5.
4.实现了一个文本分类实验系统,利用该系统可以进行特征选择、权重计算研究,也可以直接对不同的语料进行训练与分类。
参考来源 - 文本分类特征选取技术研究·2,447,543篇论文数据,部分数据来源于NoteExpress
通过大型语料库(海量文本)来检查是个好方法。
生成语料库的原因之一是规范化文本并删除任何不相关的内容。
One of the reasons for generating a corpus is to normalize text and remove anything that isn't relevant.
在一个我用的英语语料数据库中,我发现10%的用法是当成名词。
In an English corpus database I use I found that 10% of usage was an anathema.
应用推荐