3)去除停词(Stop Word) 语言处理: 将分词后得到的词(Token)传给语言处理组件(Linguistic Processor),对于英文一般做如下处理
基于52个网页-相关网页
第三步:将得到的词元(Token)传给语言处理组件(Linguistic Processor)。第四步:将得到的词(Term)传给索引组件(Indexer)。
基于36个网页-相关网页
linguistic processor
语言处理器
以上为机器翻译结果,长、整句建议使用 人工翻译 。
应用推荐
模块上移
模块下移
不移动