欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

对抗性神经网络凭啥入选MIT2018十大突破性技术

科普小知识2022-07-17 09:54:43
...

几天前,《麻省理工学院评论》发表的一篇文章将2018年十大突破性技术命名为“对抗性神经网络”,令人印象深刻。

什么是对抗性神经网络?为什么它被选入麻省理工学院十大突破技术?它是如何发展的?与以前熟悉的神经网络有什么不同?哪些场景可以应用于人工智能?还有哪些关键问题有待解决?

中国自动化学会混合智能专业委员会副主任、中国人工智能学会机器学习专业委员会常务委员、复旦大学博士生导师张俊平教授在接受《科技日报》记者采访时做了深入简单的说明。

故事中的甘幽灵

张俊平告诉记者,尽管GAN是科技领域的“新贵”,但这种想法的影子在很久以前的中外小说中都可以看到。

这个想法可以追溯到奥地利小说家斯蒂芬·茨威格1941年的小说《象棋的故事》。

在这部小说中,主人公b博士被*在纳粹*很长一段时间。在尝试了各种方法来摆脱空虚和孤独,但都是徒劳之后,b博士意外地得到了一本象棋手册。

在书里记了几千个象棋分数后,他用送来的面包做了一副象棋,开始和自己下棋。最终,他变成了一系列疯狂的相互挑战,这使得他的象棋实力飙升。出狱后,他在游艇上轻松击败了当时的世界冠军。

中国小说中也有类似的影子,出现在金庸1957年的武侠小说《射手座英雄传》中。

王重阳的弟弟周·被东方的“黄·”困在桃花岛的山洞里。为了打发时间,周用左手和右手打架取乐。他武术的关键在于“左手画圈,右手画方块”。他分神了,可以同时使用两种武术,从而使原力翻倍。

在这两部小说中,主人公技能大幅度提高的关键是“与自己战斗,尽全力去击败对方”,其结果是,经过练习,在与上级战斗时,很容易杀死对手。用一句俗语来解释,就是“双拳难胜四手”。

让机器学会“左右作战”

GAN网络的原理本质上是这两部小说中英雄训练的人工智能或机器学习版本。

网络中有两种角色。在培养过程中,左手充当攻击者,即生成器,试图生成与自然界中要完成的任务非常相似的目标。右手充当防御者或鉴别者,试图区分这个假的、生成的目标和真实的目标。经过反复的双手格斗,左手和右手的力量将会加倍,从而达到“放弃他人”的目的。

知道了这个道理,不难理解为什么一旦GAN网络出现,会有一种独孤求败的感觉。

正因为GAN网络的机制是“双手相争,一颗心”。因此,尽管最初的应用场景是针对与图像相关的任务,但其机制是通用的。只要你能使用这个“技巧”,你就能把你的技能提升到一个更高的水平。然而,应该注意的是,GAN只用双手来训练他的“双手”技能。在大多数实际应用中,它只使用自己的锤打发生器,并获得很好的效果。

因此,自2014年以来,由Ian J. Goodfellow等人提出了gan网络,各种版本的GAN网络已经扩散到各个领域,如城市突袭。

在今年的人工智能高级会议IJCAI、机器学习高级会议ICML和NIPS以及著名的深入学习会议ICLR,通过阅读与会论文的标题可以发现大量的GAN网络痕迹。图像处理、计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控...甘似乎已经做了一切。

张俊平用了几个消防人工智能应用的例子——

在年龄估计中,GAN可以根据给定的面部图像通过攻击和防御来生成人的外貌。

在多视角人脸识别和跨视角步态识别领域,采用相似机制实现人脸角度和步态角度的自动旋转,有效提高了多视角、跨视角人脸和步态识别的准确性。

在自动驾驶领域,有必要对复杂环境下的智能车辆进行虚拟训练。此时,GAN可用于实现与实际交通场景分布一致的图像生成。具体地,随机噪声图像可以首先被输入到GAN,并且生成器可以最小化接近真实场景的图像,而鉴别器可以最大化所生成的场景和真实场景之间的差异。经过攻防博弈的反复迭代,可以得到与真实环境相一致的交通场景。

“不仅在应用领域有了突破,我们相互争斗的方式也发生了许多变化。既然两只手可以互相竞争,当然三只或更多的手可以互相竞争,或者群体可以成对、成串地互相竞争,等等。也有可能用圆和正方形来交换其他东西或所谓的功能或结构来相互竞争。然而,一切都将保持不变,内部机制也将保持不变。”张俊平接着说道。

GAN的“软肋”是什么?

毫无疑问,这种能够增加“能力”的技术值得被选为麻省理工学院年度十大突破技术。然而,值得注意的是,这项技术仍有很大的改进空间。”作为《电气与电子工程师学会智能系统》和《电气与电子工程师学会智能交通系统交易》等著名期刊的编委会成员,张俊平对GAN的“软肋”了如指掌

首先,如果对抗不好,很容易出现问题。例如,这位中国象棋世界冠军在感受到他强烈的焦虑和渴望后,有意识地放慢了下棋的速度。结果,博士的精神分裂症被诱发,他再次陷入疯狂的自我游戏。最后,他突然醒来,告别了这场象棋比赛。对抗网络也是如此。稳定一直是它的问题之一。虽然Wasserstein GAN (WGAN)在理论上可以部分解决其收敛性问题,但实际效果并未达到令人满意的程度。

其次,由于这项技术非常好,所以还有许多挑战需要克服。据不完全报道,似乎有15波“武术专家”挑战了GAN网络的抗攻击能力。在极端情况下,给图像添加一个像素可能会导致GAN网络的错误判断。

第三,GAN网络也是一种深层网络。在可解释的道路上仍然没有明确的方向。

最终,两只手互相争斗的基础是手。然而,近几十年来,这一基本结构并没有脱离人工智能发展的框架。

因此,张俊平提醒说,用GAN的独特技术来攻击“真正能推理、能解决问题、有意识、有独立意识”的强人工智能,还远远没有达到预期的效果。