人工智能靠什么走向大众
[科技论文]
随着人脸识别、语音识别和自动驾驶成为人们关注的焦点,人工智能与社会和人类生活的融合程度正在迅速发展。
事实上,早在1956年,“人工智能”一词就被正式提出。然而,面对诸如有限而昂贵的计算能力、现有计算方法的缺陷以及数据量不足等不可逾越的基本障碍,“模拟人脑”似乎遥不可及。从那以后,直到20世纪80年代初,人工智能程序“专家系统”才开始被世界各地的公司采用,第二次人工智能热潮才出现。各国已经开始投入大量资金。例如,日本经济产业省有一个雄心勃勃的研究项目,旨在创造“第五代计算机”。它的目标是创造能和人交谈、翻译语言、解释图像和像人一样推理的机器。20世纪80年代末,业界质疑人工智能系统的巨额投资,但仅限于有限的应用。人工智能泡沫逐渐破灭,投资大大减少。人工智能再次进入寒冷的冬天。
那么,人工智能依靠什么来接触公众呢?作者认为,可视化人工智能技术将是未来的发展方向。
对人类来说,70%至80%的信息来自视觉。对于人工智能来说,视觉人工智能也被认为是目前最具应用价值的人工智能技术。它可以使机器具备“从人到物无所不知”的能力,从而了解世界,帮助我们提高生产和工作中信息处理的效率。
简而言之,视觉人工智能就是研究如何让机器“看见”,即用照相机和计算机代替人眼来提取和分析图像的特征,训练模型来检测和识别新的图像数据和其他任务,从而建立一个能够从图像或多模态数据中获取“信息”的人工智能系统。
由于深度学习的突破,视觉人工智能的识别能力正在突飞猛进。2012年的两大轰动事件更被视为视觉人工智能发展的转折点。当时,由多伦多大学的杰弗里·辛顿领导的团队,在一个名为ImageNet的图像识别竞赛中,利用深入学习和图形处理器强大的计算能力将错误率降低了10%,震惊了学术界,因为在此之前,错误率每年仅降低1%-2%。
同年,吴恩达带领团队使用10亿个参数的神经网络创建了一个猫脸识别系统。在没有任何先验知识的情况下,他只是观看了未标记的YouTube视频,并创建了一个猫脸识别系统——从大量照片中自动识别猫脸。
视觉人工智能因其在安全、医疗、无人驾驶等领域的应用前景,迅速成为人工智能领域最重要的研究领域。
例如,在安全领域,视觉人工智能技术可用于人群分析、逃犯跟踪、目标人群锁定以及通过城市中数千台道路摄像机进行筛选,并且可实现实时报警以帮助提高安全效率。在手机领域,人工智能可以提供更安全、更方便的体验,如刷脸解锁、刷脸付款等,还可以自动节省时间,为以后的洗面奶拍照;在自动驾驶领域,人工智能技术可以通过摄像头获取的图像来识别和分析车身周围的环境,从而辅助进行准确的路径规划。
在许多可视化人工智能应用场景中,人工智能医学图像分析是近年来非常流行的一个细分领域。这主要是由于医院信息数字化建设的不断加快,以及以医学图像为核心的大数据的不断丰富,为人工智能在医学领域的发展提供了充足的营养。与此同时,高质量医疗资源的稀缺和不均衡分布也不断催生出社会对人工智能的需求。
目前,人工智能+医疗正在蓬勃发展,对该行业的发展起到了不可磨灭的推动作用。还有丰富的应用场景和巨大的挖掘机会,如个性化医疗、可穿戴智能医疗设备的实时监控和分析等。
展望未来,更多的应用前景将被称为可视化人工智能。例如,人脸识别技术有望应用于更多的物联网终端设备,使得安全便捷的身份认证无处不在,提高生活体验。在人工智能+行业,工业机器人和物流机器人将取代更多的传统劳动力。在人工智能+文化领域,基于人工智能的增强现实技术可以逼真地还原古代文物和场景的真假。在人工智能+教育领域,利用可视化技术实现学生注意力管理,跟踪学生知识点,真正做到因材施教。
当然,人工智能在短短几年内就掀起了一波新的产业浪潮。它需要技术上的不断突破和创新。这个行业需要不断的深度培养和挖掘。公众也需要给它足够的耐心。
(作者:张少婷,上塘科技研究院副院长)