基于改进的SinglePass层次化在线话题聚类算法

在线阅读 下载PDF 导出详情
摘要 摘要针对网络数据的海量性和相对无序性,定义了多层次话题语义结构模型,基于多层次话题语义模型,对经典的SinglePass算法做出了改进,包括使用子话题质心来代表子话题内的文档、AverageLink比较策略、进行类似于K均值算法的聚类重调整的方法、子话题和话题的双层次语义结构。在实验过程中对比了在线话题的聚类算法的性能,确定了层次化在线话题聚类方法,形成有机统一的热点话题聚类模型,具有较高的应用价值和研究价值。
出处 《电力设备》 2018年32期
出版日期 2018年12月22日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献