图书管理员利用刑侦技术整理老旧档案
照片来源:自然
当加州斯坦福大学的档案管理员收到已故古生物学家史蒂芬·杰·古尔德的论文集时,他们立即发现了一个问题。许多论文实际上储存在各种计算机磁盘上,而后者已经是过时的形式了。
“你可以想象这是一个巨大的收藏。他在写作中使用了许多早期的文字处理技术。许多磁盘有不同的格式。”斯坦福大学图书馆波恩数字/法医实验室的服务经理迈克尔·奥尔森说。
学校的档案管理员花了很大的力气来整理古尔德的论文:首先,找到可以读取这些旧光盘的设备,并破译它们所读取的内容。"例如,很难找出他使用的是哪种文字处理软件."奥尔森说。
事实上,古尔德的论文反映了一个紧迫的问题:个人电脑革命40年后,第一代电脑用户已经退休或去世。档案工作者如何恢复和保存他们留下的数据?
“世界各地的人们都将信息保存在磁盘上,随着技术的变化,这些媒体变得越来越难以阅读。”北卡罗来纳大学信息与图书馆学院的研究员克里斯托弗·李说。"这包括磁盘,光盘,光盘,DVD,硬盘驱动器和其他媒体."许多文档只存储在过时的计算机硬件中,它们都在经历物理退化,最终无法被读取。
目前,许多图书馆、档案馆和博物馆在他们的仓库里保存着大量的这类材料。他们希望,如果有必要,有人会找到一种方法来阅读它们。越来越多的档案工作者在数字取证领域寻找灵感:从电脑驱动器、智能手机、笔记本电脑甚至全球定位系统设备中提取不法行为证据的技术。“事实证明,执法和计算机安全人员能够处理数字媒体中的数据稳定性和恢复问题。”马里兰大学的马修·金鲍姆说。此外,文件管理器可以直接使用他们的许多解决方案。
例如,在执行过程中,最重要的事情之一是保持材料的原始形式。这是非常困难的:几乎所有在电脑上完成的事情都会留下模糊的数字痕迹。因此,数字取证专家开发了“磁盘印象”技术,可以从未使用和隐藏的磁盘空间复制所有信息。然后,他们可以保存完整的原始证据,同时可以对更好的备份进行取证分析。
同样的需求也适用于破译收集到的文本的组织,尽管他们的目标是为未来的研究人员保留数据的原始版本。李说,8到10年前,为司法审判制作数据拷贝是一个相对边缘化的概念。"目前,这在图书馆和档案机构中非常普遍."
然而,对于档案管理员来说,磁盘图像通常是由商业软件包生成的,如司法工具包和EnCase。由于这些软件包是为刑事调查人员设计的,它们包括文件雕刻、密码破解、访问加密文件、高级搜索和为法庭审判生成报告等。,这对文件管理过程并不重要。此外,这些软件的成本并不低,这使得档案管理等机构本已紧张的资金更加困难。
因此,李和他的同事在2011年推出了Bit策展人。该平台是专门为文件领域设计的,是一个可以免费下载的开放资源。“这是第三方开源工具和我们自己工作的结合。”参与该项目的北卡罗来纳大学信息与图书馆学院的研究科学家卡姆·伍兹说。Lee预计,目前有数十家机构经常使用该工具包,数百家机构偶尔会使用它。
bit策展人不仅具有磁盘映像的功能,还具有许多研究者不需要的其他功能。例如,编辑功能:在发布前删除机密材料。“对于档案馆或图书馆人员来说,你不希望有人的健康记录被公布。”奥尔森说。因此,BitProducer有几种访问控制方法,这在刑事侦查领域是不需要的。
BitProducer的另一个特点是它能够读取已经过时的磁盘。这对被困在旧磁盘甚至磁带的“海洋”中的档案工作者来说至关重要。李说,尽管数字取证人员通常会设计更新的生成系统,但他们的技术对于数据恢复非常有用。“即使您不知道文档系统或无法阅读它,您也可以使用取证技术来制作数据的安全副本。”他说。
此外,奥尔森指出,这种基于取证的方法有一些超越技术考虑的优势。例如,对于古尔德的文件,“你可以从不同的文本信息处理系统中获得时间戳,以找出他在特定时间实际写了什么,写作顺序,编辑方法等等。”这项技术也用于档案以外的领域。奥尔森实验室正在帮助越来越多的大学教师和学生读取存储在过时的计算机系统中的数据。
目前,科学数据正快速流失。一些研究表明,20世纪90年代初发表的生态学论文中,只有20%仍然有效。研究合作者蒂姆·韦恩斯(Tim Vines)表示,科学家保存数据的最佳方式是将数据上传到图书馆档案或在线开放数据库。
“最好把它放在一个特殊的数据存储组织手中,而不是放在书架上。”他说。(张张)
中国科学新闻(2016-06-13,第三版国际)
阅读更多
《自然》杂志的相关报道