...Seg 就是一个中文分词程序,当前最新版本是 0.7.3,采用 C++ 开发,分词算法采用的是“复杂最大匹配 (Complex maximum matching)”,同时支持 Linux 平台和 Windows 平台,切分速度大约在 300K/s(PM-1.2G),LibMMSeg 从 0.7.2 版本开始,作者提供了 Ruby 调...
基于10个网页-相关网页
复杂最大匹配:从chunk中以最大长度取第一个单词,如果有多于一个chunk最大长度,应用下一个规则。
Complex maximum matching: Pick the first word from the chunk with maximum length. If there are more than one chunks with maximum length, apply the next rule.
MMSEG系统实现了前面讨论的最大匹配算法的简单和复杂形式。
The MMSEG system implemented both simple and complex forms of the maximum matching algorithm discussed earlier.
应用推荐