香山会议热议数字科技文献资源长期保存困境
不久前,著名的国际情报和数据提供商汤森路透(Townsend Reuters)宣布,将以35.5亿美元的价格将其知识产权业务和科学信息业务(包括中国学者熟知的SCI(科学引文索引)和IF(影响因子))出售给Onex公司和巴林亚洲(Baring Asia)。两者都是商业投资公司,而不是与知识产权管理相关的公司。
这个消息在中国科研领域引起了不小的反响。然而,与大多数人担心这一变化对未来科研评估体系的影响不同,张晓麟中国科学院文献信息中心的研究人员更担心这一大事件对科技文献资源长期保存和管理的潜在影响以及由此产生的风险。“数字化科技文献的查询和保存不仅影响科研工作的评价,也是当前科研工作的生命线。其重要性不言而喻。”
11月3日至4日,在第576届香山科学大会上,50多位专家学者围绕“数字科技文献资源长期保存的前沿和重大问题”这一主题进行了讨论。
科学研究高度依赖数字文献资源。
会议执行主席、中国科学院物理研究所研究员杨国桢指出,文献资源数字化已成为科技领域和许多人文社会科学研究中学术信息的主流形式。它是科研机构和研究型大学每天依赖的主流信息资源,也是国家科研、教育和创新体系不可或缺的战略物资。
张晓麟在他的专题报告中指出,由于科技发展和科学研究行为的变化,学术文献本身也发生了重大变化。除了文字以外,图片、音像、数据库等也逐渐成为数字文献资源的主体。在科学研究领域,以科研论文为代表的科研出版物逐渐从印刷版本发展到印刷版本+电子版本,最后发展到电子版本。“目前,社会再也不能回到纸质书的时代,而变得高度依赖数字资源,特别是在科学研究领域。”
多重风险威胁着数字技术资源的保存
1992年毕业于中国人民大学信息资源管理学院文件保护专业的钱乙告诉《科学日报》:“数字文献资源的管理和保存所面临的问题远远超过纸质文献。由于存储介质和存储格式更新非常快,许多不久前仍在使用的数据不再能够读取,例如存储在3英寸软盘和5英寸软盘上的数据。”
杨国桢认为,与传统非数字载体的信息相比,数字信息面临更高的风险。一方面,随着信息技术的快速发展和快速升级,相应的数字媒体、格式、软件或系统版本发生变化,导致数字信息不可用。另一方面,目前数字文献资源的利用机制基本上是利用出版社的网络数据库远程提供服务,因此由于技术故障、自然灾害、商业失败、市场并购、战争冲突等原因。,信息的获取也随时处于危险之中。
大科学数据的保存有特殊的需要。
对于科学研究来说,还有一种特殊的数字文献资源需要长期保存,那就是科学数据。
科学数据不仅包括原始实验/观测数据、相关元数据和衍生数据产品,还包括相关源代码、文件、模型、算法和研究成果。科学数据已经成为科学发现和创新的新战略资源。
中国科学院计算机网络信息中心研究员李建辉认为,随着越来越多的科学仪器的建设和重大科学实验的开展,以及无处不在的科学传感器和传感器网络在天空、陆地和海洋中的广泛应用,以及对自然环境的全方位探测和监测,不断产生的科学数据在数量、速度和变化的复杂性等方面都在迅速发展。典型数据包括高能物理大数据、生物基因检测大数据、天文观测大数据、气候变化监测大数据等,其中许多都是静止图像数据。这些科学数据的长期保存面临一系列新的问题和挑战。
我们没有时间建立国家数字文献资源保存系统。
中国科学院规划局的黄在一次演讲中说,他对数字文献资源的长期保存知之甚少。他认为找到几台大机器来存放它们就足够了。参加会议后,他发现这是一个系统工程问题,涉及文件的定义、保存期限的规定、相关的格式规范、相应的法律安排、多种资源的投入等。他认为我们应该高度重视这个问题,提高我国的科技安全水平,这需要*的领导、统筹考虑和顶层设计。“随着时间的推移,这个问题将变得越来越紧迫。时间不多了!”
与会专家认为,鉴于数字文献资源的战略重要性和数字文献资源长期保存的复杂性,有必要在国家层面进行统筹安排,考虑技术条件、权益管理、运行机制和可持续保护,加快数字文献资源长期保存体系建设,尽快、尽可能高效、可靠、可持续地实现我国重要科技文献资源的长期保存。为确保科研生命线的安全稳定打下坚实基础。
(北京,11月4日,《科技日报》)
阅读更多
汤森路透计划在全球裁员2000人,以实现集团重组
汤森路透:系统调查异常行为的期刊
特别声明:转载本文仅用于传播信息,并不代表本网站的观点或确认其内容的真实性。如果其他媒体、网站或个人从本网站转载,他们必须保留本网站注明的“来源”,并承担版权等法律责任。如果作者不希望被重印或联系重印费,请联系我们。