李开复《AI未来进行式》
02 假面神祇
### 什么是计算机视觉技术 - 计算机视觉(Computer Vision,CV)是AI的技术分支之一,主要研究如何让计算机拥有“看”的能力。这里的“看”不仅意味着看到并捕捉一段视频或图片,而且意味着能够分析并理解图像序列的内容和含义。简单到复杂,计算机视觉技术包括以下从简单到复杂的功能。 - ※ 图像采集和处理——使用摄像头及其他类型的传感器采集真实世界中的三维场景,将其转化为视频。每段视频就是一系列的图像,而每个图像都是一个二维矩阵,矩阵里的每个点都代表人所能看到的颜色(这个点也就是所谓的“像素”)。 - ※ 目标检测和图像分割——把图像划分为若干个不同区域和物体。 - ※ 目标识别——对物体进行识别(例如识别出一只狗),并在此基础上掌握更多的细节特征(例如确认该狗为德国牧羊犬、深棕色等)。 - ※ 目标追踪——在视频中定位和跟踪物体。 - ※ 动作识别——对动作和手势进行识别,如Xbox体感游戏中的舞蹈动作。 - ※ 场景理解——对一个完整的场景(例如一只饥饿的狗正在盯着一根骨头)进行分析并理解,掌握其中复杂而微妙的关系。 ### 计算机视觉技术的应用 - ※ 化身汽车上的“助理驾驶员”,监测人类驾驶员是否疲劳驾驶; - ※ 进驻无人超市(如天猫无人超市),通过摄像头自动识别顾客把商品放进购物车的过程; - ※ 为机场提供安全保障,用于清点人数,识别是否有恐怖分子出没; - ※ 姿态识别,开发Xbox舞蹈游戏,为用户的动作打分; - ※ 人脸识别,让用户“刷脸”解锁手机; - ※ 智能相机,iPhone的人像模式可以识别并提取前景中的人物,巧妙地让背景虚化,效果堪比单反相机; - ※ 应用于军事领域,将敌方士兵与平民区分开,或打造无人机和自动驾驶汽车。 计算机视觉技术还可以基于现有的图像或视频进行“锦上添花”,例如: - ※ 对照片和视频进行智能编辑,比如美图秀秀等软件工具,在计算机视觉技术的支持下,可以实现优化抠图、去红眼、美化自拍等功能; - ※ 医学图像分析,比如检查判断肺部CT中是否有恶性肿瘤; - ※ 内容过滤,监测社交媒体上是否出现色情、暴力等内容; - ※ 根据一段视频内容搭配相关广告; - ※ 实现智能图像搜索,根据关键字或图像线索查找目标图像; - ※ 实现换脸术,把原视频中A的脸替换为B的脸。 ### 计算机视觉的基础——卷积神经网络(CNN) - 卷积神经网络(CNN)就是受人类视觉工作机制的启发而产生的。每个卷积神经网络中都有大量类似于人脑感受野的滤波器。这些滤波器,会在图像处理的过程中被反复使用。每个滤波器都只针对图像的部分区域进行特征提取。深度学习的原理,就是通过不断向模型“投喂”大量的图像实现模型的优化,在这个过程中,卷积神经网络的所有滤波器都将自主学会应该提取哪一个特征。每个滤波器的输出,都是它所检测的特征(例如黑色线条)的置信度。 - 卷积神经网络是为计算机视觉而生的一种改良版深度学习模型架构,而且有不同版本的变体,适用于处理不同类型的图像和视频。 ### 深度伪造技术 Deepfake - 深度伪造技术(Deepfake),是被称作“生成式对抗网络”(GAN)的机器学习模型将图片或视频合并叠加到源图片或视频上,借助神经网络技术进行大样本学习,将个人的声音、面部表情及身体动作拼接合成虚假内容的人工智能技术。 - 深度伪造最常见方式是AI换脸技术,此外还包括语音模拟、人脸合成、视频生成等。它的出现使得篡改或生成高度逼真且难以甄别的音视频内容成为可能,观察者最终无法通过肉眼明辨真伪。 ### 生成式对抗网络 - Deepfake换脸术建立在一种名为生成式对抗网络(GAN)的技术基础之上。顾名思义,GAN是由一对互相对抗(博弈)的网络组成的深度学习神经网络。 - 其中的一个网络名为生成式网络,负责尝试生成一些看起来很真实的东西,例如基于数百万张狗的图片,合成一张虚构的狗的图片。另一个网络名为判别式网络,它会把生成式网络所合成的狗的图片与真实的狗的图片进行比较,确定生成式网络的输出是真是假。 - 生成式网络会根据判别式网络的反馈,重新进行自我训练,努力让损失函数最小化,即缩小真实图片与合成图片之间的差异,朝着下一次能够成功愚弄判别式网络的目标迈进;而判别式网络也会重新进行自我调整,努力让损失函数最大化,希望练就火眼金睛,不被生成式网络蒙骗。经过数百万次这样的“对抗”之后,生成式网络和判别式网络的能力会不断提升,直至最终达到平衡。 - 到2042年,针对Deepfake视频的防伪软件将成为类似于杀毒软件的存在。政府网站和官方新闻网站上对信息的真实度要求非常高,所以会设置强度最高的防伪检测器。人们需要不断改进防伪检测技术和工具来应对Deepfake,同时需要出台相应的法律,对恶意制造Deepfake的人采取严厉的处罚措施,以威慑潜在的犯罪者。 ### 生物特征识别 - 生物特征识别是利用人体固有的生理特征来进行个人身份鉴定的一个研究领域。在现实生活中,生物特征识别主要用于实时的身份鉴定。未来20年内,智能生物特征识别技术将更广泛地应用于刑事调查和取证。 ### AI安全 - 专门设计的对抗性输入是针对AI系统的攻击方法之一。攻击者将挑战AI系统的决策边界,并借此调整对AI系统的输入,进而达到让AI系统出错的目的。还有一种攻击AI系统的方法是对数据“下毒”:攻击者通过“污染”训练数据、训练模型或训练过程,来破坏AI系统的学习过程。 - 加强模型训练及执行环境的安全性,创建自动检查“中毒”迹象的工具,以及开发专门用于防止篡改数据或与其类似的规避手段的技术。
上一篇
顶部
下一篇
收展
底部
[TOC]
本书目录
序一 AI的真实故事
01 一叶知命
02 假面神祇
03 双雀
04 无接触之恋
05 偶像之死
06 神圣车手
07 人类刹车计划
08 职业救星
09 幸福岛
10 丰饶之梦
推荐书籍
李开复《AI·未来》