...越大,同一个词在大型语料库中出现的频次越来越高,在对一些常用词项进行检索时,常常会生成数目庞大的 索引行 ( concordance lines ),有时甚至多达成千上万; 索引行 信息的“过载”给词典编纂者发现语言的规律性东西带来极大的不便,造成词典编纂的效率低下。
基于36个网页-相关网页
每个索引分区仅从相应的数据分区取得索引行。
Each index partition indexes rows only from the corresponding data partition.
接下来,创建一个查询以生成要被索引的行。
我们不是很乐意使用DPSI,但是我们必须跨多个分区探测多个索引树来寻找行。
We are not so pleased with the DPSI if we must probe multiple index trees to find rows across multiple partitions.
应用推荐