基于文本聚类的工具书查重方法研究

(整期优先)网络出版时间:2011-06-16
/ 1
由于工具书编纂队伍庞大,工作流程上又多头并进,所以工具书编纂过程中难免会出现内容交叉重复问题。为了减少工具书查重的工作量,文章提出了一种基于文本聚类的查重方法。试验表明,分层聚类算法可用于大型工具书词条查重工作,它对工具书编纂中解决词条交叉重复问题是有效的。