基于大数据环境下的数据安全探究
一、大数据的概念
大数据是互联网技术和云计算技术迅猛发展的产物,指的是无法在规定的时间内使用当前通用的数据管理工具进行收集处理的规模巨大且形式多样化的数据信息。大数据的研究如今已成为国内外学者、政府机构、研究机构广泛关注的前沿科技。其主要来源是人们在使用互联网和各种终端设备所产生和输出的各种文字、图片或者视频、文件等种类繁多的数据信息。
二、大数据环境的特点
通过对大数据概念的研究我们可以看到大数据环境的特点如下:
(一)数据量大且呈几何级数增长趋势
大数据时代的来临,各种智能终端、移动设备、传感器以及社交网络每时每刻都有大量的数据产生,并且呈现出几何级数的增长趋势。预计至2020年,全球电子数据将会超过35ZB。
(二)数据形式多种多样
随着信息化技术的发展,大数据中的主流数据由以普通文本为代表的结构化数据逐步演化为自由文本形式存在的非结构化数据。互联网技术的发展改变了传统数据的二维结构,随着手机及各种终端设备应用范围的拓展,网页、图片、音频视频等非结构化数据的发展显得尤为迅速。统计结果显示,非机构化数据在大数据中所占的比例已达百分之八十以上。
(三)价值密度低
对大数据进行分析可以获得大量有价值的信息,可以对生产生活起到一定的指导作用,因为数据来源的不同,获得的数据信息也是复杂多样,因此大数据以成千上万倍的速度增长,这使得大数据的存储和计算分析成本大大提高。同时也导致大数据的统计缺少细化处理,信息的价值含量低。
(四)具有高效的运算速度和运算能力
大数据的运算系统属于一个分布式机构的系统,以海杜普大数据框架为基础,充分发挥集群的效力,来使自身达到高效的运算速度和运算能力。信息数据发掘技术的不断发展以及大量应用程序的开发和使用和搜索引擎的使用推广必然会使大数据提取和分析变得更快更高效。
三、大数据环境下存在的数据安全问题
(一)网络技术的发展普及发展使数据安全面临巨大风险
随着互联网技术的全球推广使用以及无线路由器、服务器等设备技术的发展,网络的日常应用越来越便捷,信息数据的获取也越来越高效,同时不同行业大数据资源共享也变得十分便利。网络的发展给信息资源提供了一个开放的共享平台,在这个平台之上可以对大数据进行快速的整合分析,并且对有效数据进行整理共享。但是安全问题也接踵而至,开放的网络平台随着使用对象的变换,将众多大数据相互关联,使得网络黑客窃取数据信息变得十分容易。一旦数据泄露,数据的价值也将被窃取,并且数据产生者的个人隐私也将受到威胁。
(二)大数据环境下信息的可靠性下降
大数据环境产生于信息量巨大的网络环境,而且数据的增长传播又十分迅速,虽然数据收集的方式相比传统结构数据更加灵活方便,但是大量的数据给数据的处理分析工作带来了很大的难度,数据的不确定性会造成数据信息失真,在传播速记极快的网络平台,失真的数据可能会产生负面影响,因此在大数据环境下,信息的可靠性大大降低。
四、大数据环境下数据安全的保证措施
(一)建立健全大数据安全管理体系和管理制度
大数据环境是由大量数据信息构建的信息系统,为了保证信息数据的安全可靠性,首先要建立一个安全的数据管理系统,明确重点数据保护的对象,加强对数据信息的监管。当下网络安全形势不容乐观,数据安全已经不仅仅涉及个人隐私保护层