据维基百科的定义和特点:大数据又称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过目前主流软件工具,在合理时间内达到截取、管理、处理、并整理成为帮助企业经营决策更积极目的信息。大数据的4V特点:量(Volume,数据大小)、速(Velocity,数据输入输出的速度)与多变(Variety,多样性),Veracity(可用性)。
大数据在人们不知不觉中悄然降临,据麦肯锡咨询公司的报告:2010年,超过40亿人(世界人口的60%)在使用手机,其中大约12%拥有智能电话——其渗透率以每年20%以上的速度增长。随之而来的数据仓库、数据安全、数据分析、数据挖掘等,围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。从现实来看,大数据的优势在各个领域已经明显出现。
1、网络舆情的“可预见性”
大数据的核心特点就是能够“预见未来”。舆论发酵的过程,意见的表明和“沉默的”扩散是一个螺旋式的社会传播过程。在现实社会中,由于来自群体的压力,害怕陷入孤立的状态,而进入选择沉默期,但是在网络社会中,传播特点具有“碎片化”的信息传播方式、传播过程的互动性、病毒式传播模式,多渠道传播,如微博的准入门槛低、内容简短、操作便捷,因而,总能在一定时间内及时迅速地传播,网民之间相互转发形成的再传播,会引起很高的舆论关注,产生巨大的传播影响力。网民们更倾向于“选择”那些与自己的既有立场、态度一致或接近的内容。
由于匿名性与互动性,人们更快的表达出意见,从沉默期转入雪崩状态出现网络舆论的一边倒。大数据时代舆情进入雪崩状态的时间更短,网络舆情一般分潜伏期、爆发期与恢复期。事发后的12小时是一个关键的时间节点。在潜伏期的12小时内,越早回应越主动。因此,在大数据时代,要不断增强关联舆情信息的分析和预测,从以往单纯的收集有效数据向对舆情的深入研判拓展,从注重“静态收集”向注重“动态跟踪”拓展,从致力“反映问题”向致力“解决问题”拓展,能够做到研判快、预警快、决策快。
2、以小见大,重视微的力量
社交媒体如Twitter,Facebook,微博等,是大数据真正的兴奋点所在。这种社会化媒体,在网络上每天产生成千上亿级的话语文本,每个“小”数据,都可能包含着重“大”的意义,以微博为例,一条短则数字的消息或是一张图片就可能引发一连串社会反响,产生重大舆情甚至引发突发危机事件和社会公共事件,如“秦火火”“表叔”等。相比传统媒体的线性传播,网上的社交媒体实际上则属于反馈式的环形传播,实现了一种真正意义上的双向互动传播。“郭美美事件”引起亿万民众对中国红十字会的质疑与指责,网络舆论的监督功能再次被放大。
舆情等数据分析机构从互联网浩如烟海的数据中挖掘信息、判断趋势、提高效益已有实际应用。在美国中央情报局,情报人员通过抓取海量数据来追踪恐怖分子和监控社会情绪,首席技术官格斯•汉特称,在“阿拉伯之春”中,大数据分析可以了解多少人和哪些人正在从温和立场变得更为激进,并“算出”谁可能会采取对某些人有害的行动。
3、深度挖掘相关性,重构网络舆情
大数据重视深度挖掘,非常重视各种数据间的相关性。我们每天在网络上产生上亿数据,数据之间具有相关性,而大数据通过对海量信息的解构与重构,为我们创造更加进步的媒体提供可能,充分整合政府和企业的数据资产,进而完善决策流程。蔓延于网络的“弱势心理”“情绪型舆论”,有时产生的负面影响也很大,从而加剧了群众的盲从,产生网络舆情的“一边倒”现象,大数据的深度挖掘可以防患于未然。通过搭建关联领域的数据库、舆情基础数据库等,在舆情预警、研判、应对、决策等环节,丰富和完善决策参考体系。届时,舆情和数据服务不再局限于个案分析,同时需要跟踪关联舆情,不再局限于危机解决,还要辅之以决策参考,化解舆情危机,构建和谐舆情空间。