人工智能:现代方法(第4版)(上下册)

0
(0)

人工智能:现代方法(第4版)(上下册)

作者:[美]斯图尔特·罗素(StuartRussell)

出版社:人民邮电出版社

出品方:异步图书

译者:张博雅/陈坤/田超/顾卓尔/吴凡/赵申剑

出版年:2022-11

页数:928

定价:198.00元

装帧:平装

ISBN:9787115598103

内容简介
······

人工智能领域“大百科全书”!

时隔十年重磅更新!

全球1500多所学校采用的经典教材!

★编辑推荐:

配备丰富的教学资源,解决教师授课后顾之忧。

配套网站提供多种语言版本源代码,满足不同编程语言使用者的自学需要。

程序员入门人工智能领域的大百科全书。

★内容简介:

本书全面、深入地探讨了人工智能(AI)领域的理论和实践,以统一的风格将当今流行的人工智能思想和术语融合到引起广泛关注的应用中,真正做到理论和实践相结合。全书分7个部分,共28章,理论部分介绍了人工智能研究的主要理论和方法并追溯了两千多年前的相关思想,内容主要包括逻辑、概率和连续数学,感知、推理、学习和行动,公平、信任、社会公益和安全;实践部分完美地践行了“现代”理念,实际应用选择当下热度较高的微电子设备、机器人行星探测器、拥有几十亿用户的在线服务、AlphaZero、人形机器人、自动驾驶、人工智能辅助医疗等。本书适合作为高等院校人工智能相关专业本科生和研究生的教材,也可以作为相关领域专业人员的参考书。

★专业书评:

本书是在世界范围内广受欢迎的人工智能教材之一,其最鲜明的特点有二:第一,一卷在手,人工智能方方面面的主要知识被系统性地一网打尽,经典知识内容与前沿知识内容取舍剪裁别具匠心,深具章法,驾轻就熟,相得益彰,颇有一种“包藏人工智能宇宙之机,吞吐人工智能天地之志”的架势;第二,文字阐述深入浅出,言简意赅,旁征博引,详略得当,同时适合初学者以及在人工智能领域已有一定经验和造诣者这两大类人群阅读和学习,各取所需,甘之若饴。本书冠以人工智能的“现代方法”,可谓实至名归。特别是在以勃兴于2011年的深度学习模型为基本表征的人工智能走到山重水复、柳暗花明的当前形势下,其中的“现代”二字就显得更为重要。人们正呼唤着下一代人工智能新境界的到来。2022年10月,包括两位图灵奖得主约书亚·本吉奥(Yoshua Bengio)和杨立昆(Yann LeCun)在内的一批学者撰文提出了“具身图灵测试”的概念,强调机器系统与世界环境的具身交互研究是开拓下一代人工智能创新方法的关键要义,而这一点与本书从“智能体”的视角总揽全篇的前瞻性思路不谋而合。显然,深度学习远不能包打天下,复杂开放环境下智能任务的解决离不开多种理论、方法和技术手段在“具身智能”条件下的兼包并蓄、融会贯通,这就对人工智能研究者在知识结构体系上提出了更高的要求,而本书恰好具备能够满足这种要求缺一不可的广博性和深刻性。

——孙茂松,欧洲科学院外籍院士,清华大学计算机科学与技术系教授,清华大学人工智能研究院常务副院长

本书可谓是一流学者撰写一流教材的典范,作者是国际人工智能领域知名专家、ACM/AAAI会士、曾获IJCAI卓越研究奖、AAAI费根鲍姆奖、AAAI/EAAI杰出教育家奖、ACM杰出教育家奖等荣誉,自1995年第1版出版以来已被全球大约1500所大学用作人工智能入门教科书。人民邮电出版社隆重推出第4版中文版,无疑是中文读者的福音。

——周志华,ACM/AAAI会士,欧洲科学院外籍院士,南京大学计算机系主任兼人工智能学院院长

《人工智能:现代方法》是一本经典教材。“现代方法”选择从当下的角度讲述人工智能的故事,而贯穿全书的核心方法论是“智能体”。以计算机为载体的人工智能,揭开了机器智能大幕的一角,制造更复杂的机器,实现更强大的智能,机器智能将为科学研究创造无穷无尽的新对象。在这个意义上,智能是“科学的无尽疆域”,而人工智能这个“现代方法”,正是开疆拓土的动力之源。方法不止,智能无疆,“人工智能:现代方法”这个书名可以永远延续下去。

——黄铁军,北京智源人工智能研究院院长,北京大学计算机学院教授

这是一本教材,但不是传统意义上的教材,它用现代思想凸显人工智能及相关工作的发展脉络,用智能体贯穿全书知识点的诠释,各章内容自然衔接,易于理解与掌握。

这不仅是一本教材,还是一本“大”百科全书,它全方位探讨了人工智能领域的方方面面,涵盖了从基础知识、模型方法、工具技术、社会伦理到应用专题等各个层面,是一本人工智能的高级工具书。

这是一本面向人工智能大领域的“大”书,作者也是大学者,连译者都是大学者领衔的团队,堪称经典之作,非常值得初学者、从业者、教师及科研工作者等专业人员阅读。

——俞勇,上海交通大学特聘教授,上海交通大学ACM班创始人,首批国家高层次人才特殊支持计划教学名师

人工智能领域的特点是知识点散、前置知识多、技术迭代快,因此写一本全面深入的人工智能教材是一件很难的事。本书是人工智能领域的经典教材,全方位描述了人工智能的主要分支和技术方向,提供了人工智能领域的全景图。经过20多年的不断优化,目前本书已经是第4版。和第3版相比,本书增加了深度学习、人工智能伦理等近年来的热点研究内容,非常适合对人工智能技术感兴趣的读者阅读。强烈推荐!

——邱锡鹏,复旦大学计算机学院教授

这是人工智能领域世界范围内最经典、最全面、最具影响力的教材,覆盖了人工智能领域所有重要子领域的核心问题、算法思想和现实应用。第4版加入了深度学习、多智能体系统、机器人、人工智能伦理等前沿领域的最新进展和挑战,更适合作为不同层次和领域的研究人员及学生的人工智能入门教材。

——安波,新加坡南洋理工大学教授

本书是享誉世界的人工智能经典教材,我在读博期间就学习过其第3版,内容全面翔实,介绍深入浅出,既是初学者理想的入门教材,也是人工智能从业者的案头参考书。很高兴这本书的第4版被译介到国内,新版增加了2010年以来深度学习等最新前沿技术动态,新章节的贡献者有朱迪亚·珀尔(Judea Pearl)和伊恩·古德费洛(Ian Goodfellow)等知名学者。期待这本新版教材更好地推动我国人工智能的发展。

——刘知远,清华大学计算机系长聘副教授

本书是继“西瓜书”和“花书”之后又一部大师之作。本书简称为AIMA,其历史其实更为久远,几乎可以认为是国际上关于人工智能的标准教材。两位作者斯图尔特·罗素和彼得·诺维格是打通学术和产业“任督二脉”的大师。相比于“花书”的作者,本书的两位作者可以被归类为“传统派”,他们认为机器智能并不一定要学习生物智能,机器可以通过更擅长的计算、更完美的数学模型以及大数据下的去模型化来实现智能。因此,在2009年出版第3版时,彼得·诺维格无法预测到近10年深度学习在诸多领域(特别是他擅长的自然语言处理、机器翻译)的快速进展,而作为强化学习的高手,斯图尔特·罗素也不会预想到深度强化学习在决策应用中的流光溢彩。第4版中融入了两位大师基于人工智能近10年最新进展的深度思考。同时,作者也是人工智能伦理和哲学的思想家,他们在最后一章中回答了人工智能未来走向和关乎人类命运的几乎所有问题。这是一本大部头的书,若能日拱一卒,势必功不唐捐。

——吴甘沙,驭势科技董事长/CEO

在炒作和质疑声中,人工智能技术不断倔强而真实地成长。可以预见并且逐渐成为现实的是,智能化革命就如同当年的信息化革命一样,会给很多领域和行业带来革命性的变化。人工智能也从一门选修型前沿学科,逐渐演化成一门必修型基础学科。要了解人工智能,一本全面的人工智能教材必不可少,眼前的这本书出自名家,是一本享誉世界的经典教材,翻译质量也非常高。相信这本经典之作能带你踏入人工智能之门。

——王斌,小米集团技术委员会主席、人工智能实验室主任

人工智能与计算机技术几乎同时起步,但与计算机技术几乎线性的发展路径不同,人工智能的发展路径经历了几次大的转向,目前越来越依赖于数据科学和高性能计算机器的发展,因而知识和技术覆盖范围非常广泛。作为一本经典教材,本书提纲挈领,像百科全书一样涵盖了人工智能的大部分领域,每章几乎都对应了一个人工智能问题或技术分支,甚至可以单独成为一门课程。本书的特色是不纠缠于技术和工程细节,直击问题的本质和方法的底层逻辑,在帮助读者形成人工智能领域知识的整体大框架的基础上,增强读者对人工智能基础问题和技术方法的理解和进一步学习的能力。

——肖睿,北大青鸟研究院院长,课工场创始人

作者简介
······

斯图尔特·罗素(Stuart Russell),1986年他进入加利福尼亚大学伯克利分校,任计算机科学系教授,并曾担任系主任,人类兼容人工智能中心主任,他也是史密斯–扎德(Smith-Zadeh)工程系讲席教授。1990年,他获得了美国国家科学基金会(NSF)杰出青年科学家总统奖;1995年,他成为计算机与思想奖的获奖人之一。他是美国人工智能协会(AAAI)、美国计算机协会(ACM)和美国科学促进协会的会士,牛津大学瓦德汉学院的荣誉院士和安德鲁·卡内基(Andrew Carnegie)院士。2012年到2014年,他在巴黎担任布莱斯·帕斯卡(Blaise Pascal)主席。他在人工智能领域发表了300多篇论文,涉及范围广泛。

彼得·诺维格(Peter Norvig)曾任谷歌公司的研究总监、核心网络搜索算法的负责人。他曾与他人合作共同教授了一门有16万名学生注册的在线人工智能课程,帮助开启了当下的大规模在线公开课程的大幕。他曾担任美国宇航局艾姆斯研究中心计算科学部的负责人,负责人工智能和机器人学的研究和开发。他曾任南加利福尼亚大学的教授和加利福尼亚大学伯克利分校、斯坦福大学的教师。他是美国人工智能协会和美国计算机协会的会士,以及美国艺术与科学院和加利福尼亚科学院的院士。

两位作者共同获得了2016年首届AAAI/EAAI杰出教育家奖。

目录
······

第一部分 人工智能基础

第 1 章 绪论 2

1.1 什么是人工智能 2

1.1.1 类人行为:图灵测试方法 3

1.1.2 类人思考:认知建模方法 3

1.1.3 理性思考:“思维法则”方法 4

1.1.4 理性行为:理性智能体方法 4

1.1.5 益机 5

1.2 人工智能的基础 6

1.2.1 哲学 6

1.2.2 数学 8

1.2.3 经济学 9

1.2.4 神经科学 10

1.2.5 心理学 12

1.2.6 计算机工程 13

1.2.7 控制理论与控制论 14

1.2.8 语言学 15

1.3 人工智能的历史 16

1.3.1 人工智能的诞生(1943—1956) 16

1.3.2 早期热情高涨,期望无限(1952—1969) 17

1.3.3 一些现实(1966—1973) 19

1.3.4 专家系统(1969—1986) 20

1.3.5 神经网络的回归(1986—现在) 22

1.3.6 概率推理和机器学习(1987—现在) 22

1.3.7 大数据(2001—现在) 23

1.3.8 深度学习(2011—现在) 24

1.4 目前的先进技术 24

1.5 人工智能的风险和收益 27

小结 30

参考文献与历史注释 31

第 2 章 智能体 32

2.1 智能体和环境 32

2.2 良好行为:理性的概念 34

2.2.1 性能度量 34

2.2.2 理性 35

2.2.3 全知、学习和自主 36

2.3 环境的本质 37

2.3.1 指定任务环境 37

2.3.2 任务环境的属性 38

2.4 智能体的结构 41

2.4.1 智能体程序 41

2.4.2 简单反射型智能体 42

2.4.3 基于模型的反射型智能体 44

2.4.4 基于目标的智能体 45

2.4.5 基于效用的智能体 46

2.4.6 学习型智能体 47

2.4.7 智能体程序的组件如何工作 49

小结 50

参考文献与历史注释 51

第二部分 问题求解

第 3 章 通过搜索进行问题求解 54

3.1 问题求解智能体 54

3.1.1 搜索问题和解 55

3.1.2 问题形式化 56

3.2 问题示例 57

3.2.1 标准化问题 57

3.2.2 真实世界问题 59

3.3 搜索算法 61

3.3.1 最佳优先搜索 62

3.3.2 搜索数据结构 63

3.3.3 冗余路径 64

3.3.4 问题求解性能评估 65

3.4 无信息搜索策略 65

3.4.1 广度优先搜索 66

3.4.2 Dijkstra 算法或一致代价搜索 67

3.4.3 深度优先搜索与内存问题 68

3.4.4 深度受限和迭代加深搜索 69

3.4.5 双向搜索 712

3.4.6 无信息搜索算法对比 72

3.5 有信息(启发式)搜索策略 73

3.5.1 贪心最佳优先搜索 73

3.5.2 A* 搜索 75

3.5.3 搜索等值线 77

3.5.4 满意搜索:不可容许的启发式

函数与加权 A* 搜索 79

3.5.5 内存受限搜索 80

3.5.6 双向启发式搜索 83

3.6 启发式函数 85

3.6.1 启发式函数的准确性对性能的影响 85

3.6.2 从松弛问题出发生成启发式函数 86

3.6.3 从子问题出发生成启发式函数:模式数据库 87

3.6.4 使用地标生成启发式函数 88

3.6.5 学习以更好地搜索 90

3.6.6 从经验中学习启发式函数 90

小结 90

参考文献与历史注释 92

第 4 章 复杂环境中的搜索 95

4.1 局部搜索和最优化问题 95

4.1.1 爬山搜索 96

4.1.2 模拟退火 98

4.1.3 局部束搜索 99

4.1.4 进化算法 99

4.2 连续空间中的局部搜索 102

4.3 使用非确定性动作的搜索 104

4.3.1 不稳定的真空吸尘器世界 105

4.3.2 与或搜索树 106

4.3.3 反复尝试 107

4.4 部分可观测环境中的搜索 108

4.4.1 无观测信息的搜索 108

4.4.2 部分可观测环境中的搜索 111

4.4.3 求解部分可观测问题 112

4.4.4 部分可观测环境中的智能体 113

4.5 在线搜索智能体和未知环境 115

4.5.1 在线搜索问题 115

4.5.2 在线搜索智能体 117

4.5.3 在线局部搜索 118

4.5.4 在线搜索中的学习 119

小结 120

参考文献与历史注释 121

第 5 章 对抗搜索和博弈 124

5.1 博弈论 124

5.2 博弈中的优化决策 126

5.2.1 极小化极大搜索算法 127

5.2.2 多人博弈中的最优决策 128

5.2.3 α-β 剪枝 129

5.2.4 移动顺序 131

5.3 启发式 α-β 树搜索 132

5.3.1 评价函数 132

5.3.2 截断搜索 134

5.3.3 前向剪枝 135

5.3.4 搜索和查表 136

5.4 蒙特卡罗树搜索 136

5.5 随机博弈 139

5.6 部分可观测博弈 142

5.6.1 四国军棋:部分可观测的国际象棋 142

5.6.2 纸牌游戏 144

5.7 博弈搜索算法的局限性 146

小结 147

参考文献与历史注释 148

第 6 章 约束满足问题 152

6.1 定义约束满足问题 152

6.1.1 问题示例:地图着色 153

6.1.2 问题示例:车间作业调度 154

6.1.3 CSP 形式体系的变体 155

6.2 约束传播:CSP 中的推断 156

6.2.1 节点一致性 157

6.2.2 弧一致性 157

6.2.3 路径一致性 158

6.2.4 k 一致性 158

6.2.5 全局约束 159

6.2.6 数独 160

6.3 CSP 的回溯搜索 161

6.3.1 变量排序和值排序 163

6.3.2 交替进行搜索和推理 164

6.3.3 智能回溯:向后看 164

6.3.4 约束学习 166

6.4 CSP 的局部搜索 166

6.5 问题的结构 168

6.5.1 割集调整 169

6.5.2 树分解 170

6.5.3 值对称 171

小结 171

参考文献与历史注释 172

第三部分 知识、推理和规划

第 7 章 逻辑智能体 176

7.1 基于知识的智能体 176

7.2 wumpus 世界 178

7.3 逻辑 180

7.4 命题逻辑:一种非常简单的逻辑 183

7.4.1 语法 183

7.4.2 语义 184

7.4.3 一个简单的知识库 185

7.4.4 一个简单的推断过程 186

7.5 命题定理证明 187

7.5.1 推断与证明 188

7.5.2 通过归结证明 190

7.5.3 霍恩子句与确定子句 194

7.5.4 前向链接与反向链接 194

7.6 高效命题模型检验 196

7.6.1 完备的回溯算法 196

7.6.2 局部搜索算法 198

7.6.3 随机 SAT 问题概览 199

7.7 基于命题逻辑的智能体 200

7.7.1 世界的当前状态 200

7.7.2 混合智能体 203

7.7.3 逻辑状态估计 204

7.7.4 用命题推断进行规划 205

小结 207

参考文献与历史注释 208

第 8 章 一阶逻辑 211

8.1 回顾表示 211

8.1.1 思想的语言 212

8.1.2 结合形式语言和自然语言的优点 213

8.2 一阶逻辑的语法和语义 215

8.2.1 一阶逻辑模型 215

8.2.2 符号与解释 216

8.2.3 项 218

8.2.4 原子语句 218

8.2.5 复合语句 218

8.2.6 量词 219

8.2.7 等词 222

8.2.8 数据库语义 222

8.3 使用一阶逻辑 223

8.3.1 一阶逻辑的断言与查询 223

8.3.2 亲属关系论域 224

8.3.3 数、集合与列表 225

8.3.4 wumpus 世界 227

8.4 一阶逻辑中的知识工程 228

8.4.1 知识工程的过程 229

8.4.2 电子电路论域 230

小结 233

参考文献与历史注释 234

第 9 章 一阶逻辑中的推断 236

9.1 命题推断与一阶推断 236

9.2 合一与一阶推断 238

9.2.1 合一 239

9.2.2 存储与检索 240

9.3 前向链接 241

9.3.1 一阶确定子句 242

9.3.2 简单的前向链接算法 242

9.3.3 高效前向链接 244

9.4 反向链接 247

9.4.1 反向链接算法 247

9.4.2 逻辑编程 248

9.4.3 冗余推断和无限循环 249

9.4.4 Prolog 的数据库语义 251

9.4.5 约束逻辑编程 251

9.5 归结 252

9.5.1 一阶逻辑的合取范式 252

9.5.2 归结推断规则 253

9.5.3 证明范例 254

9.5.4 归结的完备性 256

9.5.5 等词 258

9.5.6 归结策略 260

小结 261

参考文献与历史注释 262

第 10 章 知识表示 265

10.1 本体论工程 265

10.2 类别与对象 267

10.2.1 物理组成 268

10.2.2 量度 269

10.2.3 对象:事物和物质 271

10.3 事件 272

10.3.1 时间 273

10.3.2 流和对象 275

10.4 精神对象和模态逻辑 275

10.5 类别的推理系统 278

10.5.1 语义网络 278

10.5.2 描述逻辑 280

10.6 用缺省信息推理 281

10.6.1 限定与缺省逻辑 281

10.6.2 真值维护系统 283

小结 284

参考文献与历史注释 285

第 11 章 自动规划 290

11.1 经典规划的定义 290

11.1.1 范例领域:航空货物运输 291

11.1.2 范例领域:备用轮胎问题 292

11.1.3 范例领域:积木世界 292

11.2 经典规划的算法 294

11.2.1 规划的前向状态空间搜索 294

11.2.2 规划的反向状态空间搜索 295

11.2.3 使用布尔可满足性规划 296

11.2.4 其他经典规划方法 296

11.3 规划的启发式方法 297

11.3.1 领域无关剪枝 299

11.3.2 规划中的状态抽象 300

11.4 分层规划 300

11.4.1 高层动作 301

11.4.2 搜索基元解 302

11.4.3 搜索抽象解 303

11.5 非确定性域的规划和行动 307

11.5.1 无传感器规划 309

11.5.2 应变规划 312

11.5.3 在线规划 313

11.6 时间、调度和资源 315

11.6.1 时间约束和资源约束的表示 315

11.6.2 解决调度问题 316

11.7 规划方法分析 318

小结 319

参考文献与历史注释 320

第四部分 不确定知识和不确定推理

第 12 章 不确定性的量化 326

12.1 不确定性下的动作 326

12.1.1 不确定性概述 327

12.1.2 不确定性与理性决策 328

12.2 基本概率记号 329

12.2.1 概率是关于什么的 329

12.2.2 概率断言中的命题语言 330

12.2.3 概率公理及其合理性 333

12.3 使用完全联合分布进行推断 334

12.4 独立性 336

12.5 贝叶斯法则及其应用 337

12.5.1 应用贝叶斯法则:简单实例 338

12.5.2 应用贝叶斯法则:合并证据 339

12.6 朴素贝叶斯模型 340

12.7 重游 wumpus 世界 342

小结 344

参考文献与历史注释 345

第 13 章 概率推理 348

13.1 不确定域的知识表示 348

13.2 贝叶斯网络的语义 350

13.2.1 贝叶斯网络中的条件独立性关系 353

13.2.2 条件分布的高效表示 354

13.2.3 连续变量的贝叶斯网络 356

13.2.4 案例研究:汽车保险 358

13.3 贝叶斯网络中的精确推断 360

13.3.1 通过枚举进行推断 361

13.3.2 变量消元算法 363

13.3.3 精确推断的复杂性 365

13.3.4 聚类算法 366

13.4 贝叶斯网络中的近似推理 367

13.4.1 直接采样方法 368

13.4.2 通过马尔可夫链模拟进行推断 372

13.4.3 编译近似推断 378

13.5 因果网络 379

13.5.1 表示动作:do 操作 380

13.5.2 后门准则 382

小结 382

参考文献与历史注释 383

第 14 章 时间上的概率推理 388

14.1 时间与不确定性 388

14.1.1 状态与观测 389

14.1.2 转移模型与传感器模型 389

14.2 时序模型中的推断 391

14.2.1 滤波与预测 392

14.2.2 平滑 394

14.2.3 寻找最可能序列 396

14.3 隐马尔可夫模型 398

14.3.1 简化矩阵算法 398

14.3.2 隐马尔可夫模型示例:定位 400

14.4 卡尔曼滤波器 403

14.4.1 更新高斯分布 403

14.4.2 简单的一维示例 404

14.4.3 一般情况 406

14.4.4 卡尔曼滤波的适用范围 407

14.5 动态贝叶斯网络 408

14.5.1 构建动态贝叶斯网络 409

14.5.2 动态贝叶斯网络中的精确推断 412

14.5.3 动态贝叶斯网络中的近似推断 413

小结 417

参考文献与历史注释 418

第 15 章 概率编程 421

15.1 关系概率模型 421

15.1.1 语法与语义 423

15.1.2 实例:评定玩家的技能等级 425

15.1.3 关系概率模型中的推断 426

15.2 开宇宙概率模型 427

15.2.1 语义与语法 428

15.2.2 开宇宙概率模型的推断 429

15.2.3 示例 430

15.3 追踪复杂世界 433

15.3.1 示例:多目标跟踪 433

15.3.2 示例:交通监控 436

15.4 作为概率模型的程序 436

15.4.1 示例:文本阅读 437

15.4.2 语法与语义 438

15.4.3 推断结果 438

15.4.4 结合马尔可夫模型改进生成程序 439

15.4.5 生成程序的推断 439

小结 440

参考文献与历史注释 440

第 16 章 做简单决策 444

16.1 在不确定性下结合信念与愿望 444

16.2 效用理论基础 445

16.2.1 理性偏好的约束 445

16.2.2 理性偏好导致效用 447

16.3 效用函数 448

16.3.1 效用评估和效用尺度 448

16.3.2 金钱的效用 449

16.3.3 期望效用与决策后失望 451

16.3.4 人类判断与非理性 452

16.4 多属性效用函数 454

16.4.1 占优 455

16.4.2 偏好结构与多属性效用 456

16.5 决策网络 458

16.5.1 使用决策网络表示决策问题 458

16.5.2 评估决策网络 460

16.6 信息价值 460

16.6.1 简单示例 460

16.6.2 完美信息的一般公式 461

16.6.3 价值信息的性质 462

16.6.4 信息收集智能体的实现 463

16.6.5 非短视信息收集 463

16.6.6 敏感性分析与健壮决策 464

16.7 未知偏好 465

16.7.1 个人偏好的不确定性 466

16.7.2 顺从人类 467

小结 468

参考文献与历史注释 469

第 17 章 做复杂决策 473

17.1 序贯决策问题 473

17.1.1 时间上的效用 475

17.1.2 最优策略与状态效用 477

17.1.3 奖励规模 479

17.1.4 表示 MDP 480

17.2 MDP 的算法 482

17.2.1 价值迭代 482

17.2.2 策略迭代 485

17.2.3 线性规划 487

17.2.4 MDP 的在线算法 487

17.3 老虎机问题 489

17.3.1 计算基廷斯指数 491

17.3.2 伯努利老虎机 492

17.3.3 近似最优老虎机策略 493

17.3.4 不可索引变体 493

17.4 部分可观测MDP 495

17.5 求解POMDP 的算法 497

17.5.1 POMDP的价值迭代 497

17.5.2 POMDP的在线算法 500

小结 501

参考文献与历史注释 502

第 18 章 多智能体决策 505

18.1 多智能体环境的特性 505

18.1.1 单个决策者 505

18.1.2 多决策者 506

18.1.3 多智能体规划 507

18.1.4 多智能体规划:合作与协调 509

18.2 非合作博弈论 510

18.2.1 单步博弈:正则形式博弈 510

18.2.2 社会福利 513

18.2.3 重复博弈 517

18.2.4 序贯博弈:扩展形式 520

18.2.5 不确定收益与辅助博弈 525

18.3 合作博弈论 527

18.3.1 联盟结构与结果 528

18.3.2 合作博弈中的策略 529

18.3.3 合作博弈中的计算 531

18.4 制定集体决策 533

18.4.1 在合同网中分配任务 533

18.4.2 通过拍卖分配稀缺资源 535

18.4.3 投票 539

18.4.4 议价 541

小结 544

参考文献与历史注释 545

第五部分 机器学习

第 19 章 样例学习 550

19.1 学习的形式 550

19.2 监督学习 552

19.3 决策树学习 555

19.3.1 决策树的表达能力 556

19.3.2 从样例中学习决策树 557

19.3.3 选择测试属性 559

19.3.4 泛化与过拟合 560

19.3.5 拓展决策树的适用范围 562

19.4 模型选择与模型优化 563

19.4.1 模型选择 564

19.4.2 从错误率到损失函数 566

19.4.3 正则化 567

19.4.4 超参数调整 568

19.5 学习理论 569

19.6 线性回归与分类 572

19.6.1 单变量线性回归 572

19.6.2 梯度下降 574

19.6.3 多变量线性回归 575

19.6.4 带有硬阈值的线性分类器 577

19.6.5 基于逻辑斯谛回归的线性分类器 579

19.7 非参数模型 581

19.7.1 最近邻模型 581

19.7.2 使用 k-d 树寻找最近邻 583

19.7.3 局部敏感哈希 584

19.7.4 非参数回归 585

19.7.5 支持向量机 586

19.7.6 核技巧 589

19.8 集成学习 589

19.8.1 自助聚合法 590

19.8.2 随机森林法 590

19.8.3 堆叠法 591

19.8.4 自适应提升法 592

19.8.5 梯度提升法 594

19.8.6 在线学习 595

19.9 开发机器学习系统 596

19.9.1 问题形式化 596

19.9.2 数据收集、评估和管理 597

19.9.3 模型选择与训练 601

19.9.4 信任、可解释性、可说明性 601

19.9.5 操作、监控和维护 603

小结 604

参考文献与历史注释 605

第 20 章 概率模型学习 610

20.1 统计学习 610

20.2 完全数据学习 613

20.2.1 最大似然参数学习:离散模型 613

20.2.2 朴素贝叶斯模型 615

20.2.3 生成模型和判别模型 616

20.2.4 最大似然参数学习:连续模型 616

20.2.5 贝叶斯参数学习 618

20.2.6 贝叶斯线性回归 620

20.2.7 贝叶斯网络结构学习 622

20.2.8 非参数模型密度估计 623

20.3 隐变量学习:EM 算法 624

20.3.1 无监督聚类:学习混合高斯 625

20.3.2 学习带隐变量的贝叶斯网络参数值 627

20.3.3 学习隐马尔可夫模型 630

20.3.4 EM 算法的一般形式 630

20.3.5 学习带隐变量的贝叶斯网络结构 631

小结 632

参考文献与历史注释 632

第 21 章 深度学习 635

21.1 简单前馈网络 636

21.1.1 网络作为复杂函数 636

21.1.2 梯度与学习 639

21.2 深度学习的计算图 640

21.2.1 输入编码 641

21.2.2 输出层与损失函数 641

21.2.3 隐藏层 642

21.3 卷积网络 643

21.3.1 池化与下采样 646

21.3.2 卷积神经网络的张量运算 646

21.3.3 残差网络 647

21.4 学习算法 648

21.4.1 计算图中的梯度计算 649

21.4.2 批量归一化 650

21.5 泛化 650

21.5.1 选择正确的网络架构 651

21.5.2 神经架构搜索 652

21.5.3 权重衰减 653

21.5.4 暂退法 653

21.6 循环神经网络 654

21.6.1 训练基本的循环神经网络 655

21.6.2 长短期记忆 RNN 656

21.7 无监督学习与迁移学习 657

21.7.1 无监督学习 657

21.7.2 迁移学习和多任务学习 661

21.8 应用 662

21.8.1 视觉 662

21.8.2 自然语言处理 663

21.8.3 强化学习 663

小结 664

参考文献与历史注释 664

第 22 章 强化学习 668

22.1 从奖励中学习 668

22.2 被动强化学习 670

22.2.1 直接效用估计 671

22.2.2 自适应动态规划 671

22.2.3 时序差分学习 672

22.3 主动强化学习 674

22.3.1 探索 675

22.3.2 安全探索 677

22.3.3 时序差分 Q 学习 678

22.4 强化学习中的泛化 680

22.4.1 近似直接效用估计 680

22.4.2 近似时序差分学习 681

22.4.3 深度强化学习 682

22.4.4 奖励函数设计 683

22.4.5 分层强化学习 683

22.5 策略搜索 686

22.6 学徒学习与逆强化学习 688

22.7 强化学习的应用 690

22.7.1 在电子游戏中的应用 690

22.7.2 在机器人控制中的应用 691

小结 692

参考文献与历史注释 693

第六部分 沟通、感知和行动

第 23 章 自然语言处理 698

23.1 语言模型 698

23.1.1 词袋模型 699

23.1.2 n 元单词模型 700

23.1.3 其他 n 元模型 701

23.1.4 n 元模型的平滑 701

23.1.5 单词表示 702

23.1.6 词性标注 703

23.1.7 语言模型的比较 706

23.2 文法 707

23.3 句法分析 709

23.3.1 依存分析 711

23.3.2 从样例中学习句法分析器 712

23.4 扩展文法 713

23.4.1 语义解释 715

23.4.2 学习语义文法 717

23.5 真实自然语言的复杂性 717

23.6 自然语言任务 720

小结 722

参考文献与历史注释 722

第 24 章 自然语言处理中的深度学习 727

24.1 词嵌入 727

24.2 自然语言处理中的循环神经网络 730

24.2.1 使用循环神经网络的语言模型 730

24.2.2 用循环神经网络进行分类 732

24.2.3 自然语言处理任务中的 LSTM模型 733

24.3 序列到序列模型 733

24.3.1 注意力 735

24.3.2 解码 736

24.4 Transformer 架构 737

24.4.1 自注意力 737

24.4.2 从自注意力到 Transformer 738

24.5 预训练和迁移学习 739

24.5.1 预训练词嵌入 740

24.5.2 预训练上下文表示 741

24.5.3 掩码语言模型 742

24.6 最高水平(SOTA) 742

小结 745

参考文献与历史注释 745

第 25 章 计算机视觉 748

25.1 引言 748

25.2 图像形成 749

25.2.1 无透镜成像:针孔照相机 749

25.2.2 透镜系统 751

25.2.3 缩放正交投影 752

25.2.4 光线与明暗 752

25.2.5 颜色 753

25.3 简单图像特征 754

25.3.1 边缘 755

25.3.2 纹理 757

25.3.3 光流 758

25.3.4 自然图像分割 759

25.4 图像分类 760

25.4.1 基于卷积神经网络的图像分类 761

25.4.2 卷积神经网络对图像分类问题

有效的原因 762

25.5 物体检测 763

25.6 三维世界 766

25.6.1 多个视图下的三维线索 766

25.6.2 双目立体视觉 766

25.6.3 移动摄像机给出的三维线索 768

25.6.4 单个视图的三维线索 769

25.7 计算机视觉的应用 769

25.7.1 理解人类行为 770

25.7.2 匹配图片与文字 772

25.7.3 多视图重建 773

25.7.4 单视图中的几何 774

25.7.5 生成图片 775

25.7.6 利用视觉控制运动 778

小结 780

参考文献与历史注释 781

第 26 章 机器人学 785

26.1 机器人 785

26.2 机器人硬件 786

26.2.1 机器人的硬件层面分类 786

26.2.2 感知世界 787

26.2.3 产生运动 789

26.3 机器人学解决哪些问题 789

26.4 机器人感知 790

26.4.1 定位与地图构建 791

26.4.2 其他感知类型 795

26.4.3 机器人感知中的监督学习与无监督学习 795

26.5 规划与控制 796

26.5.1 构形空间 796

26.5.2 运动规划 799

26.5.3 轨迹跟踪控制 806

26.5.4 最优控制 809

26.6 规划不确定的运动 810

26.7 机器人学中的强化学习 812

26.7.1 利用模型 812

26.7.2 利用其他信息 813

26.8 人类与机器人 814

26.8.1 协调 814

26.8.2 学习做人类期望的事情 817

26.9 其他机器人框架 820

26.9.1 反应式控制器 820

26.9.2 包容架构 821

26.10 应用领域 822

小结 825

参考文献与历史注释 826

第七部分 总结

第 27 章 人工智能的哲学、伦理和安全性 832

27.1 人工智能的极限 832

27.1.1 由非形式化得出的论据 832

27.1.2 由能力缺陷得出的论据 833

27.1.3 数学异议 833

27.1.4 衡量人工智能 834

27.2 机器能真正地思考吗 835

27.2.1 中文房间 835

27.2.2 意识与感质 836

27.3 人工智能的伦理 836

27.3.1 致命性自主武器 837

27.3.2 监控、安全与隐私 839

27.3.3 公平与偏见 841

27.3.4 信任与透明度 844

27.3.5 工作前景 845

27.3.6 机器人权利 847

27.3.7 人工智能安全性 848

小结 851

参考文献与历史注释 852

第 28 章 人工智能的未来 857

28.1 人工智能组件 857

28.2 人工智能架构 862

附录 A 数学背景知识 865

附录 B 关于语言与算法的说明 871

参考文献 873

评论 ······

抢先迷你书在读

本书是第3版出版10年后的经典升级,更新了人工智能领域的最新进展。与第3版相比,新版本增加了近25%的新内容,更加关注机器学习、深度学习、自然语言处理、多智能体系统等人工智能领域的新技术,及时反映了人工智能领域的技术发展趋势,剩下75%的内容也根据人工智能领域的新发展进行了大量重写,更加符合当前的知识需求。

教材读物有自己的特点,希望早日读到。

继“西瓜书”和“花书”之后又一部大师之作。本书简称为AIMA,其历史其实更为久远,几乎可以认为是国际上关于人工智能的标准教材。两位作者斯图尔特·罗素和彼得·诺维格是打通学术和产业“任督二脉”的大师。相比于“花书”的作者,本书的两位作者可以被归类为“传统派”,他们认为机器智能并不一定要学习生物智能,机器可以通过更擅长的计算、更完美的数学模型以及大数据下的去模型化来实现智能。因此,在2009年出版第3…

点击星号评分!

平均分 0 / 5. 投票数: 0

还没有投票!请为他投一票。

推荐阅读

评论 抢沙发

评论前必须登录!

 

登录

找回密码

注册