大数据思维与传统统计思维的差异研究

(整期优先)网络出版时间:2019-04-14
/ 2

大数据思维与传统统计思维的差异研究

姜楠

河北省地质测绘院河河北省廊坊市065000

摘要:大数据思维是当前统计学发展的重要支撑,其不仅确保了数据统计的全面与精确,更对数据应用效率和质量的提升具有重大影响。本文在阐述大数据思维基本内涵的基础上,对其与传统统计思维的差异进行系统分析,并指出大数据思维下统计工作的开展策略。以期有利于大数据思维理念的进一步强化,进而推动统计工作的进一步发展。

关键词:大数据思维;传统统计思维;差异;应用

信息数据是人们进行社会决策和生产的重要依据。信息时代下,人们对统计数据的应用提出了较高要求,其不仅要具备较高的精准度,更应在数据全面性,针对性等方面进行系统保证;基于此,大数据思维在多领域中得以推广和应用。从本质上讲,大数据与传统数据的应用目的具有相似性,即其在显示数据捕获分析的基础上,对事物的本质和发展趋势进行分析判断。然而在数据应用形式上,两者差异较为明显,本文就大数据思维与传统统计思维的差异展开分析。

一、大数据思维的基本内涵及特征(是一种全新的思维方式,很多数据的交叉多维度的数据的关联性地增强,出现了大数据)

1、大数据思维的基本内涵

大数据思维是一种全新的思维方式,其在大量数据多维度交叉的基础上,实现了数据关联性的有效提升。实践过程中,其使得数据统计从传统的数量增加转移到架构变化,实现了数据计算模式的根本转变;即在大数据思维下,数据价值原理得以充分体现,数据成为统计的核心,而传统意义下的统计流程得以弱化。

2、大数据思维的应用特征

大数据思维下,数据量大、速度快、类型多、价值丰富是数据应用的四个基本特征。具体而言,数据应用过程中,传统化的抽样数据处理已超着全样本转变,其使得信息的决策拥有大量的数据予以支撑。同时在数据获取速度上,全效率原理的应用使得数据获取途径逐渐多样,数据的类型也逐渐多元。譬如,其在人工预留的基础上,更加注重现代电子设备的数据监控与捕获,由此带来了视频、音频、图片、文本等多种形态的数据类型。此外,价值丰富是大数据应用结果的表现,其在验证预测结构的基础上,为后期的工程建设提供了有效的指导。就目前而言,深层次的数据挖掘、存储和可视化管理使得大数据应用领域非常广泛,其实现了以统计、测绘等多个行业工作模式的系统转变,对其工作效率提升具有重大影响。

二、大数据思维与传统统计思维的差异

1、理论差异

从本质上讲,大数据思维是基于传统数据思维,并在考虑当前数据应用需求的基础上产生的;其使得统计所获得数据具有一定的性质差异。具体而言,在传统数据思维应用下,样本量较小、格式统一、高精确度是其主要的数据特征;并且其是对一定预测结果的验证,统计策略性较强。而在大数据思维下,其更加侧重于数据统计量的控制,这就使得半结构化数据和非结构化收据的存在较为广泛,及视频、图片、音频、方位、文本等都可成为数据的基本支撑,其也导致了数据格式的繁杂化,从而影响了单位集合内数据的使用精度,而这一精度差距会在大量数据的分析校正下弱化。

2、技术差异

统计分析的技术差异是大数据思维与传统数据思维最主要的差异所在[2]。具体而言,其主要表现在分析思路、研究方法和数据获取方法三个层面。

2.1分析思路差异

数据分析思路对于统计学数据统计和分析的过程具有重要的指导作用。就传统统计思维而言,“假设、验证、决策”是其分析思路的基本模式,应用过程中,其首先要对研究的对象进行确定,并在设置假设目标的基础上,进行数据的针对性收集和分析,从而实现假目标的验证,并以此为依据,进行后期实践的决策。

大数据思维模式下,其更加注重数据的清洗、挖掘和智能算法应用。即在数据统计过程中,其没有预定目标的指引,与研究对象相关的数据都会被纳入统计范围,然后在捕获的海量信息中进行数据清洗、归纳和分析,在掌控数据内在规律的同时,实现后期实践的预测,可行性分析和选择,即其更加注重数据结果对后期指导作用的显现。

2.2数据获取差异

数据获取是数据统计分析的重要环节。获取过程中,普查、抽样调查和统计报表是传统数据获得的三种基本形式[3]。并且抽样调查的方式应用较为广泛,就实践过程而言,如何更好地进行收据收集是调查人员关注的重点所在。其造成了抽样数据针对性明显,身份特征较强的特征。而在大数据统计模式中,云计算、物联网和人工智能是其数据捕获分析的主要支撑,统计人员对数据产生及提供者的关注度较低,同时数据的指向性不强;在其影响下,体量巨大、数据源多样、数据实时是其主要的特征,其保证了研究对象内在规律的有效把控,有效的提升了数据的利用效率和质量。

譬如传统数据获取方式中,键入用户特征是超市用户数据采集的主要方式,其包含了客户性别、年龄段、行为状态等内容的收集(如图1),然而受人工键入方式的影响,在数据采集过程中存在一定的输入误差,由此造成了抽样调查随机性的增大。而在大数据思维统计应用中,其在现代网络设备的支撑下,通过爬虫抓取、用户留存、用户上传、数据交易和数据共享的基础上,为超市客户信息统计效率的提升提供了保证,有效的辅助了后期实践的进行。

2.3数据研究方式差异

传统统计工作中,根据收集数据的基本情况,进行假设目标验证,并以此获取样本数据与整体数据的关系是其数据研究的基本方式。在大数据思维下,数据的统计与分析排除了人为假设,其在大数据获取,云计算支撑下,实现了数据深层意义的有效挖掘。并且通过全数据分析、归纳、比对的应用,其有效的避免了统计结果偏离现象的发生,对于统计精度具有重大影响,确保了后期工作的有效指导。

图1超市客户信息统计数据获取方式

3、实践差异

从实践对象来看,总体性和样本性是大数据思维和传统统计思维根本区别。传统统计学实践中,统计工具、分析工具等内容会对数据的统计范围造成影响,由此也决定了其必须在随机原则的指导下,进行抽样分析法的引言。从研究对象来看,抽样分析获得数据随机性影响较大,故而难以展示事物的整体面貌,故而偏差总体较大,要实现其统计精度的有效把控,在统计分析过程中就必须注重统计量与随机性的系统平衡。

大数据统计背景下,计算机系统云存储功能的引言实现了海量数据的有效存储,并且云计算能力的支撑下,其使得“样本即总体”的观念得以深刻落实,从而实现了传统数据统计中无法发现细节的深刻挖掘,有效的保证了数据统计的精度,对其应用效率和质量提升具有深刻影响。

三、大数据思维下的统计工作开展策略

1、注重大数据思维意识的树立

对统计学而言,实现数据捕获、分析引言的大数据化处理是其行业发展的重要特征。在统计是实践过程中,统计工作人员应注重自身观念的有效转变,在数据全样本原理、全效率原理、相关性原理、预测原理、信息找人原理和智能化原理学习的基础上,实现大数据思维意识的有效确立,并积极的以此进行统计工作开展,实现数据统计应用的灵活、高效。

2、注重大数据统计过程的规范

要实现大数据思维与统计学的高度融合,在统计应用过程中,实现大数据统计过程的规范势在必行。一方面,在统计工作开展过程中必须实现统计人员业务素质的有效培养,从而确保其充分掌握大数据应用的相关原理,能够以现代化的思维进行数据的捕获、清洗、归纳、分析和应用。另一方面,大数据思维下,数据统计工作的开展离不开电子信息技术的支撑。因此,在实际工作开展过程中,从业人员应注重互联网、物联网、云储存、础计算等支撑技术的系统规范,从而为数据的统计应用提供有效保证。

结论

大数据思维是当前统计学建设发展的重要指导,其与传统统计思维在理论、技术和实践中具有较大差异。统计工作人员只有充分认识到大数据思维在统计工作中应用的必要性,并在分析其与传统统计思维差异的同时,进行实施策略的有效保证,才能实现大数据思维理念的进一步强化,进而推动统计工作的进一步发展。

参考文献:

[1]郑磊.大数据思维与传统统计思维方式的差异分析[J].无线互联科技,2017(22):110-111.

[2]陈超,沈思鹏,赵杨,等.大数据思维与传统统计思维差异的思考[J].南京医科大学学报(社会科学版),2016,16(6):477-479.

[3]毛远军.大数据思维在统计分析中的应用[J].电子技术与软件工程,2017(4):182-182.