欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

大数据时代 这些问题待解决

科普小知识2022-10-27 09:13:07
...

■张兆辉,本报见习记者

近日,据《参考新闻》报道,中国正在进行的全国网络安全执法检查活动首次开展了大数据安全整改工作,具体包括大数据的全生命周期监管、安全整改和保护收集、存储、应用、传输和销毁。这个消息引起了社会各界的广泛关注。

在今天的网络时代,数据和信息是否安全触动了每个人的心弦。相关专家告诉《中国科学报》记者,虽然大数据已经使用多年,但在技术监督的各个方面仍然存在许多技术难题。

数据源是否可靠还有待确定。

据了解,大数据安全检查的关键任务之一是对合法收集的内容和非法收集的内容进行分类。其中,非法收集的信息将被定向和销毁。合法和合规收集的信息将纳入保护和监督范围。

浙江大学网络空间安全研究中心主任任奎表示,从网络安全的角度来看,首先,在收集大数据的过程中,一方面要考虑对数据源进行认证,以保证数据本身的可靠性。如何在不增加负载的情况下实现有效的认证,尤其是对于物联网中计算和处理能力相对较弱的设备,还有待研究。另一方面,我们需要注意隐私保护。如何有效地降低数据敏感度仍然是一个挑战。目前,差分隐私技术等流行方法仍在积极开发中。

“公民的信息是公民的私有财产。如果不追溯数据以证明数据来源,就有可能助长非法数据来源。”上海交通大学计算机科学与工程教授朱说。

中科院信息工程研究所DCS中心副研究员王告诉记者,对于大数据,关键是要尽可能完善技术,保证数据分析结果的真实性和可靠性。

非关系数据库是数据存储的主流

任奎在谈到大数据存储存在的问题时告诉记者,主要问题是如何在有效保护数据的前提下,充分支持常用的搜索、排序、聚合分析等传统功能。与明文应用相比,目前相关的安全技术在功能和性能上仍有差距,需要改进。

“此外,我们还应该考虑如何执行安全重复数据消除等实际要求,以减轻数据存储的压力。然而,这不同于“备份”的主动防灾机制,相关安全技术的安全性和性能之间的平衡仍需进一步研究。”任奎接着说道。

在采访中,关于大数据存储技术,王和任奎一致认为,软件层面的主流是基于分布式系统的非关系数据库。

据了解,非关系数据库的优势主要在于易于扩展和高性能,但也存在标准化不足和功能支持不足等缺点。常见的分类包括键值存储、列存储、文档存储和图形存储。然而,要平衡实际应用中的需求,如系统一致性、可用性和分区容错,以及提供定制技术,仍有许多工作要做。

如何避免“中间人”攻击?

任奎说,网络中的数据传输还需要防止监控和篡改等传统的“中间人”攻击,所以端到端加密是非常必要的。然而,端到端加密技术仍然面临着许多新的边信道攻击来窥探隐私的挑战,特别是最近一些用人工智能方法进行的边信道分析工作也表明,在这个领域还有许多问题需要解决。“此外,虽然端到端加密易于使用,但它也给网络入侵检测和加密数据防火墙的设计带来了更多挑战。如何安全有效地支持这些应用需要进一步研究。”任奎说道。

360安全专家刘洋在接受记者采访时曾表示,传统的网络安全理念已经不能保证大数据时代的安全。传统的网络安全保护思想是划分边界,将内部网络和外部网络分开,将业务网络和公共网络分开,用终端设备隔离潜在的风险。通过在每个边界设置网关设备和网络流量设备来守卫“边界”,安全问题有望得到解决。然而,随着移动互联网和云服务的出现,移动终端在4G信号、无线信号和电缆之间穿梭,网络边界实际上已经消失。

大数据销毁不是简单的“删除”或“清空”

在朱看来,数据销毁在我国仍然是一个大问题。他指出,欧盟发布的《一般数据保护条例》明确规定了用户的“被遗忘的权利”,即用户可以要求负责方删除自己的数据记录,而国内法律没有规定这一点。此外,企业是否销毁数据在技术上没有得到很好的验证。例如,您的手机可以进行一些设置,但您如何知道服务器是否已被破坏朱接着说道。

任奎指出,大数据的销毁是实现有效数据管理的必要过程。这个过程不仅仅是“删除”和“清空”。如何确保指定的内容被真正“清除”和“销毁”,除了技术的发展,仍然有必要建立有效的规范,如美国国防部的国防部5220.22-M规范。

对此,王表达了不同意见。他说,在大数据时代,数据源是一个从线到面的过程,破坏本质上是一种消极的方法。“大数据就像一座金矿。我们尽力从中找到黄金,然后保护它。这是我们应该做的。”王对说道。

中国科学新闻(2018-08-06第四版)