科技情报用户画像标签生成与推荐研究

(整期优先)网络出版时间:2022-03-29
/ 2

科技情报用户画像标签生成与推荐研究

韩志红,王潇,刘国强,聂振焘,史超

北方自动控制技术研究所, 030000

摘要:在大数据时代的发展背景下,科技管理部门已经成为科技情报的重要用户组成,如何对科技情报需求进行快速地了解也成为了当前时代情报服务的重要表现。因此,在科技情报的背景下出现了用户画像的方法,这种方法也为科技情报工作提升了更大的可能性。这种用户画像的方法通过对多种数据的采集与分析,为情报用户打上独特的标签,并用标签来找出用户的特征和需求。文章重点围绕科技情报用户画像标签的生成以及推荐进行探讨。

关键字:科技情报;用户画像;标签生成

前言:随着高科技社会的发展以及现代社会的需求的持续推动,科技情报工作经历了从传统的文献资料服务再到现代化发展的智能服务过程。这也意味着科技情报工作在现代发展中具有一定的主动性以及预判性,同时也要求提供科技情报的服务结构要对服务对象的信息进行提前了解,将其作为服务的标准依据。基于上述目的,很多科技情报机构已经采用自然语言处理的相关方法生成画像标签,并根据标签与标签之间的关联度通过协同发展的模式建立初步的用户画像,有效地找出当前科技情报机构的主要需求特征。

  1. 科技情报与用户画像

科技的创新离不开科技情报的支撑,可以说通过科技情报可以了解到最先进的科学技术,并分析时代条件下的科技竞争优势,掌握科技时代的发展趋势。在科技情报的背景下出现了用户画像的方法,这种方法也为科技情报工作提升了更大的可能性。而科技情报事业的发展又离不开科技管理部门,我国各级的科技管理部门是科技情报的主要服务用户,它在本质上连接着国家政府产业的科技投入以及相关政策的发布。科技情报工作经历了从传统的文献资料服务再到现代化发展的智能服务过程,意味着科技情报工作在现代发展中具有一定的主动性以及预判性。科技情报季候作为可就管理部门的重要信息支撑,在根本上提供了相应的战略决策以及战术选择,通过多种个性化服务模式提升科技生产的利益,从而提升科技管理部门决策的正确性。那么传统的情报服务就是将相同的情报资料传递给不同的政府领导,在事实上不同的政府具有不同的领导职责,所需的情报资料也必须拥有不同的表现形式,进一步提高情报服务的准确性。因此在新时代大数据发展的环境下,科技服务的提供者必须对信息数据进行实时的分析,实现情报提交的差异化表现。那么科技情报用户画像方法基于科技管理部门的业务数据来说,实现了数据的标签化、关联化以及可视化,驱动主体用户发展,为科技情报用户画像的建立提供了参照依据。在科技情报的用户互相理论中,标签的生成与关联是先决性条件。利用推荐算法为用户推荐最合适的标签也是探索用户需求的捷径。因此,利用科技情报用户画像分析的方法分析用户需求,就可以为提供优质情报服务创造发展前提1】

  1. 用户画像标签的生成

对于建立用户画像的关键来说,最重要的就是对画像标签的生成。画像标签从理论上来说就是具有规范化且具有基本含义的较短文本,这类具有基本含义的标签能够直接被相关人员所理解,并且更容易利用计算机技术对标签进行提取,在工作中更容易处理,缩短工作时间提高效率。那么在标签处理的过程当中首先就是对文本数据的获取,然后对数据进行预备处理,将数据进行分词、词性标注、词频统计。其次就是提取标签的五种方法,分别为直接抽取词、高频词和关键词、LDA生成词、组合词以及TF-IDF生成词。最后对标签词进行初始化,通过人工处理筛选的形式进行标签关联计算与匹配。那么在标签预处理与标签词性标注的环节当中,为了能够准确的识别标签,提高标签的辨识度,就要在数据分词的环节上,选择不同的方法生成画像标签。例如首先可以将不同类型的数据进行数据合并划分,筛选出与情报工作内容无关的业务,其次选取默认精确模式,对情报文本进行数据分词,在对同义词进行合并,准确识别出科技情报的关键字。最后通过对分词结果做统计的形式,将词频、关键词等特点,作为标签生成的参照标准,建立标签之间的联系,并利用标签之间的关系进行标签内容的推荐。

  1. 用户画像建立推荐算法

在得到用户标签与标签之间的关联以后,就可以建立对应的用户画像,也可以说用户画像是画像标签的结合体,是用户画像创建的基本要素。那么标签在实质上是为了反映用户需求的重点标识,而标签与标签之间存在一定的关联性,从标签的关联当中能够找出相关的标签。再将相关的标签推荐给不同的用户,就可以得到用户对情报的内在需求。因此,用户画像建立的推荐算法主要利用了标签之间的关联性算法、协同过滤的推荐方法以及在基本的逻辑基础上发现情报的推荐方法。那么基于标签之间的关联性算法来说,标签内部的关联性主要是在标签内容上的含义联系,并组织标签类别的形式。对于有关联性的标签,可以用于情报集成上的推荐。其次从协同过滤推荐方法的角度上看,协同过滤推荐算法的基本指导理论是利用群体智慧,利用协作的形式进行情报推荐。并且在为相似度高的用户群体进行内容推荐时,根据个体的不同特征进行不同的内容推荐,并根据标签的内容为用户进行同一类标签的划分。最后就是在基本的逻辑基础上发现情报的推荐方法,这种方法能够根据情报用户自身的特点,在理论上既有一定的实践依据,从而进行相互参考借鉴。充分利用科技发展的信息满足自身科技的需求,从而为科技信息做到决策上的支撑,从宏观的角度发展科技管理部门

2】

结论:

综上所述,利用大数据技术进行科技情报的用户画像模型能够为情报服务的提升提供新的发展思路,同时也为情报中的隐藏信息找到新的解决方法。通过对相关部门的决策进行信息分析,找出情报信息的根本特征,探索出内在的情报需求。从而能够以最快的速度为相关决策部门提供决策依据,变被动为主动。同时利用相关的数据信息构建不同的用户画像,对此各类的科技管理组织,找出在决策方法实施上的差异,互补借鉴,确保科技情报知识水平的智能服务标准。

参考文献:

[1]王忠军,苏鹏.回鉴与预见:科技情报事业的坚守与任务——第57次情报科学读书会暨读书会10周年纪念交流札记[J].情报理论与践,2021,44(10):211+26.

[2]钱虹.面向技术创新生态系统的科技情报服务平台建设——以陕西省科技情报综合服务平台为例[J].中国科技资源导刊,2019,51(05):83-88.