运用知识发现技术促进*档案信息化
摘 要:本文阐述了*档案信息化的现状,知识发现技术发展与应用概况及其对*档案信息化建设的重要作用,并根据*档案信息系统存在的问题指出了在警务领域应用知识发现技术所要解决的关键技术问题。
关键词:档案 知识发现 *数据库
在当前的社会转型期,社会治安形势日益复杂,突出表现是犯罪率明显上升,新型犯罪不断涌现,大案、要案层出不穷,犯罪的滋生速度快速递增。这一严峻形势使*机关面临着极大的压力,而*机关档案管理信息化建设,对于警务创新、提高执法效率、更有效地打击与制止犯罪具有不可估量的作用。档案工作是*工作的一个重要组成部分。随着社会日益进入信息化时代,*档案作为一种重要的信息资源,在*机关打击各种违法犯罪活动、维护社会治安稳定的过程中,发挥着越来越重要的作用。改革开放以来,党和*高度重视档案资源的管理和利用,*机关的档案工作取得了很大进步。但是,我们也应该看到,由于种种原因,目前的*档案管理工作还存在一些问题,应在实践中努力解决。
1 *档案信息化的现状
目前,*部正在实施金盾工程,大力进行信息化建设,从而使*机关的档案存储方式发生了根本变化,由纸质档案转变为电子档案。各地各警种分别建设了各自的数据库来存储相关的档案信息,不仅刑事案件档案资料(包括犯罪痕迹物证、被盗抢车辆或物品、犯罪嫌疑人等信息),而且居民户籍、旅馆流动人口、出入境人员、在逃人员、重点监管人员、机动车、驾驶员、道路交通、消防管理等档案资料都以电子档案的形式加以存储,并在维护社会治安、打击犯罪等工作中发挥了重要作用。Www.11665.Com如根据在逃人员数据库进行网上比对来抓捕通缉犯,极大地提高了抓捕效率。
另一方面,由于*档案信息系统建设中存在以下问题,警方目前只能从这些档案信息中进行简单查询和统计汇总等工作,从而制约了档案信息效能的发挥,阻碍了警方工作效率的提高。
1.1 各警务数据库彼此缺乏联系,警方各部门间的档案信息不能共享。刑侦、治安、户政、消防、边防、交通等各部门分别投入大量的人力、物力、财力建立了自己的一套信息网络,然而由于种种原因,这些网络未能有效互连,导致档案信息不能在数据库之间互相贯通、共享,以致形成了一个个的“信息孤岛”。
1.2 警务数据库中档案数据的异构性问题突出。各地警方一般根据本地财力等条件进行金盾工程建设,信息化的标准、水平不一。目前各警务数据库中档案信息的种类繁多,且信息标准、信息存量、运行方式乃至软件版本等也都存在着一定的差异,兼容性不强,成为制约档案信息共享的一大障碍。
1.3 许多*应用软件不能充分满足业务需要。表现在软件开发环境不成熟,功能比较单一、运行不稳定,时常造成档案信息丟失、泄密,甚至贻误正常业务工作:有的*机关投入了巨额资金建设信息网络,却因应用软件不配套,只能进行简单的档案文件传输,从而使整个系统的运行效率很低。
2 知识发现技术对*档案信息化建设的意义
不可否认,*档案信息化建设取得了巨大成绩,各警务数据库已存储了大量的档案信息。能否充分发挥这些档案信息的作用,是衡量*档案信息化建设成效的重要标准,也是提高警方工作效率的关键。如果将知识发现技术应用于警务数据库系统,则能从海量的档案数据中自动发现令人感兴趣的知识,如自动发现原本需经领域专家分析才能得到的案件线索等,从而为警方进行科学决策提供必要的支持,这对于提高*档案的利用效果和警方工作效率,进而提高*档案信息化建设水平都具有重要的意义。知识发现技术的作用具体体现在以下几个方面:
2.1 在案件侦破方面,总结各类案件的发生规律,预测未来的防范重点,指出可疑人的特点,划定犯罪嫌疑人的范围,对案件进行串案并案,为案件侦破提供侦查方向和线索。
2,2 在交通管理方面,监测路面状况和交通流量,总结交通事故的发生规律,及时制定对策,有效疏导交通,以及减少交通事故的发生。
2,3 在警力配置方面,科学、合理地安排警力,以应对突发事件:在消防调度决策中对人员、车辆配置、水源安排、最佳路线选择等提供最佳方案。
3 知识发现技术发展与应用概况
数据库中的知识发现(knowl-edge discoveryin databases,kdd),又称数据挖掘(data min-ing,dm),是从海量的档案数据中提取出需要的知识的技术,当今的世界正处于一个“数据爆炸”的时代,但是要从浩如烟海的档案数据中获取真正有用的或感兴趣的知识却非易事,即所谓“人们被数据淹没了,却饥饿于知识”,于是数据库中的知识发现(kdd)技术应运而生。kdd一词首次出现在1989年8月由美国人工智能协会组织的第11届国际人工智能联合学术会议上,此后,kdd研究吸引了越来越多的研究者。近年来,国内外高校以及ibm、microsoft、nasa等公司、机构竞相投入大量资金以推动kdd的理论和应用研究,众多企业也正在或将要实施以知识发现为基础的商务智能项目。一个著名的例子是美国加州walmart超市对长期积累的顾客购物档案数据进行数据挖掘,结果发现购买纸尿布的顾客通常也会购买啤酒。经进一步调查发现,这一地区的不少已婚男子常在下班回家的路上帮太太买纸尿布,顺便会买一些啤酒,于是销售主管立即进行货架调整,将纸尿布和啤酒的货架摆在一起,并在附近摆放了许多佐酒的小食品,结果几种商品的销售量都显著上升。
在警务领域,美国警方使用通用或商务数据挖掘工具,已实现了对知识发现技术的初步应用。如fbi将microstrategy商业智能平台的报表及分析软件应用于反恐及调查工作,以及警方将地理信息系统(gis)与犯罪信息中心(ncic)相结合,从中发现犯罪线索、总结发案规律和进行犯罪预防等。
我国警方现已初步建成了一些警务档案信息系统,但目前这些系统并不支持真正意义上的知识发现任务,国内在警务领域对知识发现技术的研究离实际应用尚有相当远的距离。
4 实现警务领域知识发现所要解决的关键技术问题
知识发现研究的发展趋势是强调面向领域、面向最终用户和面向实际应用,在警务领域应重点研究解决以下问题:
4.1 数据仓库和元数据技术。通过运用数据仓库技术来集中各个孤立的数据库中的数据资源:通过元数据来管理异构的数据,最终可实现各部门的数据共享。
4.2 适合警务应用的数据挖掘技术和算法。特别是能够适应不同数据质量和融合语义的知识发现算法,在知识发现中对新技术的应用,以及分布、并行算法的设计与实现等是决定知识发现质量的关键。
4.3 面向一线干警的自然语言需求获取模型。现有的知识发现系统需要由专业人员来操纵知识发现过程:而未来的趋势是知识发现领域的专业人员只专注于开发更加高效灵活的知识发现算法和模型,而由最终用户根据自己的需要来使用知识发现系统,这对一线干警来说无疑更有意义。
4.4 知识发现质量评价模型。当前的研究对发现质量方面的问题关注较少。评价知识发现的质量可有不同的指标,如确定程度和响应时间等,并且它们之间还可能存在一定的矛盾性。用户对知识发现质量的需求可能不同,相应的质量评价模型也应有不同的侧重。警用知识发现系统要求在确定程度和响应时间等指标之间做出适当的折中。
下一篇:本土化的文件中心探析
推荐阅读