李开复《AI未来进行式》
03 双雀
### 自然语言处理(NLP) - AI研究的核心目的,是希望计算机拥有与人类一样的智慧和能力。 - 自然语言是人类通过社会活动和教育过程习得的语言,包括说话、文字表达以及非语音的交际语言,这种习得的能力或许来自先天。 - 长期以来,对NLP的研发推进是AI科学家的重要议题,但进展缓慢。直到近年,深度学习技术横空出世,打破僵局,使科学家在教计算机学习语言这件事上,彻底摒弃了传统的计算语言学方法。 ### 有监督的NLP - “有监督”意味着在AI模型的学习阶段,每一次输入时都要提供相应的正确答案。成对的标注数据(输入和“正确的”输出)被不断“投喂”给人工神经网络,用于AI模型的训练,然后AI模型学习生成与输入相匹配的输出。 - 除了自然语言识别,还有一类更复杂的任务——自然语言理解。只有理解了人类语言所表达的“意图”,计算机才能采取下一步行动。有监督的NLP模型的训练数据应尽量穷尽针对同一种意图所可能使用的尽可能多的表达方式,但是只有经过人工标注的数据才能训练出有效的语言理解模型。 ### 自监督的NLP - 所谓自监督,就是在训练NLP模型时,无须人工标注输入、输出数据,从而打破了我们刚刚讨论的有监督学习的技术瓶颈。这种自监督学习方法名为“序列转导”(Sequence Transduction)。 - 2017年,谷歌的研究人员发明了一种新的序列转导模型,称为Transformer,在做了海量语料训练后,它可以具备选择性记忆机制和注意力机制,选择性地记住前文的重点及相关内容。百度和谷歌等搜索引擎也引入了AI搜索模型,它们会在搜索框里自动补全关键字,帮助用户更快地锁定搜索目标。 - 这种NLP模型在学习语言时所依靠的不是人类语言学理论中的词形变化规律和语法规律,而是依靠AI自创的结构和抽象概念,从数据中汲取知识,然后将其嵌入一个巨大的神经网络。整个系统的训练数据完全来源于自然语言环境,没有经过人工标注。以丰富的自然数据和强大的数据处理功能为基础,系统可以建立自己的学习模式,进而不断强化自己的能力。 ### NLP能通过图灵测试或者成为通用人工智能吗 - 我始终相信,机器“电脑”与人类“大脑”的“思考”模式截然不同,提升机器“智能”的最佳途径是开发通用计算方法(如深度学习、GPT-3),在数据持续增加和算力持续升级的基础上,这些通用计算方法会使机器逐渐变得更“智能”。 - 在通往通用人工智能的道路上,有许多尚未解决的极具挑战性的难题。有些难题我们目前尚未取得任何进展,而有些难题我们甚至不知从何入手,例如如何赋予AI创造力、战略思维、推理能力、反事实思考能力、情感以及意识。这些难题至少需要十几项类似于深度学习这种量级的技术突破。在过去的60多年中,AI领域只出现了一项巨大的技术突破。我认为,在未来20年中,出现十几项这种量级的技术突破的概率极低。 ### 教育领域的AI - 如今,教师的部分工作可以利用先进的AI技术实现自动化、标准化,特别是一些重复性高的工作。例如,AI助教工具能够纠正学生的错误,回答常见问题,布置家庭作业及考试,阅卷评分(对于教师而言,这些都是沉重不堪的日常工作);AI还能够协助教师策划、设计丰富的课堂形式与教学内容,为学生提供更好的沉浸式互动体验,比如让历史人物“复活”并与学生对话。除教学环节的辅助性工作外,拟定教学计划、进行教学评估等可标准化的任务也可以交给AI。 - 我觉得,AI在教育领域最需要挖掘的潜能,就是为未来的孩子提供个性化的学习方式。AI导师能够注意到什么方式或内容会让学生的瞳孔放大、变得兴奋,什么方式或内容会让学生的眼皮发沉、开始走神。它会针对每个学生推导出一套特定的教学方法,让每个学生学起来更快,尽管这种特定的方法可能对其他学生没有用。
上一篇
顶部
下一篇
收展
底部
[TOC]
本书目录
序一 AI的真实故事
01 一叶知命
02 假面神祇
03 双雀
04 无接触之恋
05 偶像之死
06 神圣车手
07 人类刹车计划
08 职业救星
09 幸福岛
10 丰饶之梦
推荐书籍
李开复《AI·未来》