学科分类
/ 1
4 个结果
  • 简介:基于收集到的153部中文叙词表,从出版年代、编制规模、学科分布等方面总结概述我国1980—2009年期间叙词表的编制修订情况,并从等同率、参照度以及逻辑错误等方面测评叙词表的性能,以揭示我国叙词表发展状况存在的问题,以求为今后叙词表编制或修订提供参考依据。

  • 标签: 中文叙词表 性能测评 质量分析 《汉语主题词表》(工程技术版)
  • 简介:网页去重是提高网络检索效果的有效途径。针对现有网页去重算法的不足网页正文的结构特征,提出一个基于网页正文逻辑段落长句提取的网页去重算法。该方法通过用户检索关键词将网页正文物理段落结构表示成逻辑段落,在此基础上提取逻辑段落中的长句作为网页特征码实现相似网页判断。实验证明,该方法提高了篇幅短小的镜像网页近似镜像网页的去重效果。

  • 标签: 网页去重 逻辑段落 长句提取 句子相似度
  • 简介:结合数字图书馆的相关理论,总结古籍数字的丰硕成果;指出古籍数字存在的如资源重复建设、数字格式繁多、数字产品价格昂贵等问题;探索我国古籍数字的发展趋势,即地域特色的古籍文献与大部头典籍是今后古籍数字的主流;指出古籍数字技术相关政策法规将会更加完善。

  • 标签: 数字图书馆 古籍数字化 趋势
  • 简介:以英国澳大利亚少儿图书内容索引情况为线索,从其少儿图书内容索引的研究、政策支持、普及程度、编制质量等角度,介绍其先进于我国的方面,旨在为我国少儿图书内容索引的发展提供启示。

  • 标签: 少儿图书 内容索引