基于大数据的疫情地理传播与网络舆情时空关系研究

(整期优先)网络出版时间:2020-10-12
/ 2

基于大数据的疫情地理传播与网络舆情时空关系研究

陈锋

浙江安防职业技术学院

摘要:在疫情等重大突发事件中网络舆情研判工作十分重要,传统的网络舆情研判通常基于模糊推断方式,以经验为驱动分析主体在网络时空中舆论的规律,对舆情发展趋势的预测存在偏差,导致无法为网络舆情研判提供真实、有效的依据。为此,文章以H7N9疫情为例,应用大数据分析及地理信息分析的方式研究疫情地理空间传播与网络舆情传播之间的时空关系。研究结果表明,疫情的地理传播会影响网络舆情的空间分布;网络舆情的数量、时间、地理区域与现实疫情的地理传播具有共通性但也存在一定的偏差。以上研究旨在为网络舆情研判工作提供思路。

关键词:大数据;疫情;地理传播;网络舆情;时空关系

引言

疫情防控工作不仅包括动用大量人力、物力、资金等组织阻止的传播,还包括舆论的引导。近年来,我国相继爆发了多次疫情,一方面对公众生产、生活及国家社会、经济发展造成了恶劣的影响,另一方面也引发了公众的舆论。网络舆情起源于地理事件,并借助互联网的开放性进行广泛传播。传统观念认为网络打破了地域的限制,因此网络舆情传播的地理时空特征将逐渐被弱化。但从网络舆情的数量、时间、发展规律来看,其与现实疫情传播的地理分布具有极强的联系。下文将利用大数据统计、地理信息分析方式研究H7N9疫情地理时空分布与网络舆情时空分布的关系。

  1. H7N9疫情地理时空分布及网络舆情时空分布数据

  1. H7N9疫情传播地理时空分布数据

H7N9疫情爆发及控制阶段,各地政府以省、直辖市为单位公布疫情统计数据,H7N9疫情传播地理空间数据主要包括疫情感染人数、疫情感染新增病例、疫情感染死亡人数。同时,H7N9疫情传播时间数据以天为统计单位,选择三十天的疫情数据为该部分研究的数据来源。各地区H7N9死亡及感染人数累计统计如下图1所示。

5f83bed0ce5e0_html_b6af3c912d0d0d70.png

图 1 各地区H7N9死亡及感染人数累计数据

  1. H7N9疫情引起的网络舆情传播时空分布数据

为了保证疫情地理统计与网络舆情统计时间与空间单元的一致性,H7N9疫情引发的网络舆情传播数据也以省为单位,同样包括上述三十天的疫情感染人数、疫情感染新增病例、疫情感染死亡人数。同时,数据提取自微博平台。主要原因在于:我国使用微博的网民数量较多,微博在近几年的舆情发展中具有重要的作用,并自带用户的地理位置定位功能,便于研究地理空间与网络舆情传播的关系。此外,通过大数据统计方式初步获取与疫情相关的微博数据,再通过关键词检索提取相关记录,该部分研究所使用的关键词为“H7N9”、“疫情”、“感染人数”、“死亡人数”。最后通过噪音处理剔除地理位置信息不清晰、错误、重复等记录数据,较为真实地掌握微博用户对疫情的关注情况。具体数据如下图2至3所示。

5f83bed0ce5e0_html_7b9ae529dcf12e6d.png

图 2 部分地区H7N9网络舆情关注数

5f83bed0ce5e0_html_199995d68f198075.png

图 3 各地区网民规模和互联网普及率

  1. 数据处理

首先,将获取的H7N9疫情地理时间数据(图1中的数据)以表格形式整理,利用大数据对疫情发展趋势进行统计分析,得出H7N9疫情增长趋势图,如下图4所示。

5f83bed0ce5e0_html_1fe9c0536a48672d.png

图 4 H7N9疫情病例数统计

其次,由于各省网民数量、网络发展情况具有差异性,因此采用相对指标衡量各省网民对H7N9疫情事件的关注程度,相对指标计算方式为:某省对H7N9疫情事件关注数/该省网民数量,得出不同省份对疫情事件关注度的时间发展趋势,如下图5所示。

5f83bed0ce5e0_html_9acc7d04118ba2f5.png

图 5 网络舆情相对关注度统计

最后,采用地理信息分析方式展示统计数据,以省为统计单位,将统计数据与行政区域划分进行空间关联,将H7N9疫情感染人数与网络舆情关注数分别映射到相应的地理空间区域,对相关数据进行空间统计分析,得出H7N9疫情空间传播与网络空间传播的对比,如下图6至9所示。

5f83bed0ce5e0_html_46b79843a7a8530.png

图 6 4月1日H7N9疫情与网络舆情对比

5f83bed0ce5e0_html_d53ba7a1f32dcdd.jpg5f83bed0ce5e0_html_3b1a485c94bee46c.png

图 7 4月11日H7N9疫情与网络舆情对比

5f83bed0ce5e0_html_6f589a2ded911e52.png5f83bed0ce5e0_html_ddce522d4d77a37b.png

图 8 4月21日H7N9疫情与网络舆情对比

5f83bed0ce5e0_html_bc14c22dd3e0c593.png5f83bed0ce5e0_html_a0e9f077d43d81a4.png

图 9 4月30日H7N9疫情与网络舆情对比

  1. H7N9疫情引起的网络舆情传播数量与时间特征

分析对比图3所示的各省份H7N9疫情病例数总体发展趋势与图2所示的各省份H7N9疫情事件网络关注数量、图4所示的H7N9疫情事件网络相对关注度可知,现实疫情传播地区与网络舆情传播在数量特征及时间特征上具有一致性。

我国首例H7N9禽流感患者于上海被发现,在随后的几日内,疫情迅速扩散至周边的江苏、浙江等地。疫情爆发的近半个月以内,上述地区每日均有新增的感染患者,疫情感染死亡人数也有所增加。自十五日后,各省疫情得到有效控制,除浙江省以外,其他省份新增感染者数量增长速度趋于平缓,但开始有新的省份出现H7N9禽流感感染患者。与现实疫情发展趋势相对应,随着H7N9疫情在全国范围内的蔓延,网络舆情也先后经历了舆论初步形成—舆论发酵—舆论高峰——舆论下降—舆论平缓五个阶段,与现实疫情的地理传播具有高度的契合性,表明网络舆情能够较为敏感地反映疫情发展的时间。

  1. H7N9疫情引起的网络舆情的地理区域特征

由图6至图9 可知,H7N9疫情事件的传播与网络舆情的发展均会随疫情传播的时间、地理区域发生变化,且两者变化的趋势既有一致性,又有差异性。

其一,网络舆情的覆盖面要略大于疫情传播的地理覆盖面。在H7N9禽流感疫情爆发初期,虽然只有上海、浙江等省份出现感染者,但北京等地的网民已经表现出对疫情的关注,网络舆情迅速由疫情爆发省份向全国发展。由此可见,疫情的传播与影响受到自然地理条件、地理距离等因素的影响,而网络舆情依托互联网的便捷性与开放性能够突破地域的限制在全国甚至世界范围内传播。

其二,通过对比分析图4至图9可以得出以下结论。一是网络舆情传播在很大程度上受到地域的影响。H7N9疫情发生地区网络舆情关注度远高于其他地区。例如在疫情发展初期,上海感染人数最多,其网络舆情关注人数、相对关注度也最高。同时,在4月15日前,江苏省感染人数高于浙江省,江苏省网络舆情关注度也高于浙江省。在15日之后,浙江省新增病例不断增加并高于江苏省,其网络舆情关注度反超江苏省。二是H7N9疫情引发的网络舆情随着传播距离的增加呈现出衰减趋势,即越靠近疫情发生地的省份网络舆情关注度越高,反之亦然。

  1. H7N9疫情引起的网络舆情与地理传播的时空偏差

除上述所说的疫情传播与网络舆情传播时空的一致性外,两者间还表现出一定的局部性偏差。例如当上海出现H7N9感染者后,与上海地理位置相距较远的北京、广东等地对于H7N9疫情的网络关注度一直较高。此种局部性差异出现的主要原因在于北京与广东地区经济发展水平及教育水平较高。同时,北京及广东地区网络资源丰富,网络发展良好。此外,北京与广东曾是非典疫情的高发区,对同类型的突发公卫事件关注度高于其他地区。

结束语

因公共卫生事件而起的网络舆情,其传播形式及规律虽不同于地理事件,但网络舆情的大众参与性使得其整体关注度和情绪倾向性与现实地理事件有强相关性。

参考文献

[1]李杰,陈思宇,张静文,徐培罡.基于大数据的疫情地理传播与网络舆情时空关系研究[J].地理信息世界,2020,27(03):31-34+41.

[2]徐迪.基于时空大数据的重大疫情类突发事件网络舆情研判体系研究[J].现代情报,2020,40(04):23-30+81.

[3]王敬泉,王凯.基于GIS的突发事件网络舆情传播可视化探究[J].测绘通报,2019(12):142-146.

[4]张晓峰.用于GIS系统的网络舆情标号体系研究[J].中国新通信,2019,21(17):145-146.

研究方向:网络大数据、互联网评价体系、网络传播和舆情应对。