不过,近几年,由于「中文断词(Chinese Word Segmentation),「未知词辨识(Unknown Word Identification))与「人事时 地物辨识(Named Entity Recognition,简称 NER),已有不少接近实用性的系统出 现(Tsai 2005a; Thomas, 2005)..
基于12个网页-相关网页
Ambiguity resolution and unknown word identification are two difficulties in CWS.
歧义消除和未登录词识别是分词的两大技术难点。
参考来源 - 面向大规模信息检索的中文分词技术研究·2,447,543篇论文数据,部分数据来源于NoteExpress
It simultaneously solves ambiguous phrase boundary resolution and unknown word identification problems.
它同时解决了模糊的短语边界的问题和未登录词识别问题。
The task of part of speech identification is to automatically assign a part of speech tag to an unknown word with empty part of speech information.
词类自动判定就是对词类未知的生词由机器自动赋予一个合适的词类标记。
应用推荐