简介:[目的/意义]基于关键词分析,得出不同类型的微博阅读群体的特殊行为特征,分析微博对群体阅读所起的作用和用户参与中的得失。[方法/过程]通过采集微博热门读书话题的数据样本,进行关键词提取、关键词词频统计、关键词与微博热度相关性分析、关键词文本分类和情感分析。[结果/结论]对于在微博平台如何更好开展群体阅读分别从有影响力用户、普通用户、商业用户及平台方角度提出具体发展建议:有影响力的微博用户应加强与普通用户的深度互动;普通微博用户应加强自己的"深阅读"能力和交流能力;微博商业用户应减少书籍的过度营销;新媒体应加强对知识性阅读话题的重视和推广。
简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。