关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源。
misc. language database
...标引 语料库 知识库 《中国图书馆分类法》[gap=1546]Key words: automatic classification; automatic indexing; text corpus;knowledge base; Chinese Library Classification..
基于4658个网页-相关网页
海外英语专业英语教学本栏目责任编辑:万艳丽2010年11月语料库(Corpus)是收集并科学地组织起来的一套语言材料,这种材料是某种语言中自然出现的,可以是书面的,也可以是口头的。
基于2685个网页-相关网页
所有义项均采用整句释义,亲切自然,深入浅出;全部英语语料出自规模为6.5亿词的世界知名语料库(the Bank of English),例句真实、可靠、地道;提供词频、语法、搭配结构和语用等方面的信息,帮助学习者正确使用语言,成功达到交流的目的;62000余例...
基于272个网页-相关网页
1.1研究背景和意义 1.1.1语料库 语料库(Corpora)是指为特定的应用目标而专门收集加工、具有一定结构、 可被计算机程序检索的原始语料集合,语料库往往需要具有一定的规模【lJ。
基于190个网页-相关网页
英国国家语料库 British National Corpus ; the BNC
语料库语言学 [计] Corpus Linguistics ; An Introduction to Corpus Linguistics ; Douglas Biber
布朗语料库 Brown Corpus ; Brown corpora
国际英语语料库 International Corpus of English
美国国家语料库 American National Corpus
美国当代英语语料库 Corpus of Contemporary American English ; COCA
英语语料库 the Bank of English ; COBuILD ; English Corpora
平行语料库 parallel corpus ; Parallel corpora ; GEPCOLT
基于语料库 corpus-based ; Corpus-Bautomotive service engineersd
·2,447,543篇论文数据,部分数据来源于NoteExpress
通过大型语料库(海量文本)来检查是个好方法。
生成语料库的原因之一是规范化文本并删除任何不相关的内容。
One of the reasons for generating a corpus is to normalize text and remove anything that isn't relevant.
由于不关心单词的大小写,所以您从内容创建的语料库全是小写的。
As you do not care about what case a word is in, you create the corpus out of the content, which is all lowercase.
应用推荐