文本切分(Text segmentation)某些书面语言,如汉语、日语和泰语就没有词之间的界限,因此,任何重要的分析要求词边界的识别,通常是一项重要的任务。
基于26个网页-相关网页
分词器会考虑在哪将文本切分成词(典型的如空格)的实际规则。
The tokenizers take care of the actual rules for where to break the text up into words (typically whitespace).
文章描述了一种从熟语料中自动获取文本切分知识的机器学习的方法。
This paper presents a learning method to auto ma tically acquire segmentation knowledge from Chinese corpus.
本文针对信封地址的识别,设计了一种手写汉字文本切分的协动计算方法。
In order to recognize the letter's address, we provide an algorithm for cutting handwritten text in this paper.
应用推荐