从搜索到购物、从自我认知到社会变革、从数据分享到网络战争、从人工智能威胁论到硅基智能的进化,新的世界正在形成,而机器学习是解锁这个世界的钥匙。
所有知识,无论是过去的、现在的还是未来的,都有可能通过单个通用学习算法来从数据中获得。该学习算法就叫“终极算法”。如果这种算法成为可能,它的发明将成为人类最伟大的科学成就之一。在大数据和机器学习成为热点的今天,这本书可以让读者一窥其背后神奇的技术原理和哲学本质。
《终极算法:机器学习和人工智能如何重塑世界》
作者:[美]佩德罗·多明戈斯
出版社:中信出版社
出版日期:2017年1月
在《终极算法》一书中,全球著名的算法问题专家、机器学习领域的先驱人物佩德罗·多明戈斯为我们揭开了算法的神秘面纱,让我们一窥谷歌以及你的智能手机背后的机器学习原理。
他阐释了机器学习的五大学派思想,解释了它们如何将神经科学、心理学、物理等领域的理论转变为算法并为你服务,还提出了“终极算法”的设想,探讨了终极算法对未来商业、科学、社会,以及对每个人的意义。对于想要理解未来将发生怎样的变革,以及想走在变革前沿的人来说,这是一本必不可少的思想指南。
本书的作者多明戈斯是华盛顿大学的终身教授,也是一位在机器学习领域具有20年研究经历的资深科学家。多明戈斯一直致力于融合各种机器学习算法的优势,提出一种可以解决所有应用问题的通用算法,即终极算法。在这本书中,作者详细地阐述了他的思路。其实,我个人在阅读本书的过程中,始终对“终极算法”的提法充满怀疑。在我看来,机器学习作为人工智能领域的主流技术,在现实社会中一直以技术工具的面目为人所知。不同的技术流派和相应算法往往可以很好地解决一些问题,却对另一些问题一筹莫展。所谓的终极算法真的存在吗?如果存在,有价值吗?
带着这种疑问,我通篇读下来之后才发现作者的另一层用意。诚如作者所说,很多普通人可能没有意识到在自己的生活中,机器学习算法的影响已经无处不在,机器学习已经在逐渐接管现实世界。大众对这样一种技术的认知程度和该技术的重要性相比显得远远不够。在不远的将来,了解机器学习并有能力利用机器学习改进自己工作的人在职业发展上会具备巨大优势。“不要和人工智能对抗,要让人工智能为你服务”是作者诚挚的忠告。而要利用好机器学习这个工具,并不一定需要读一个计算机博士学位,但有必要了解一些基本的概念,了解各种技术的优缺点和能力边界。
正如一位称职的驾驶员不必了解具体怎么制造汽车发动机,但是对发动机的工作原理和种类还是需要略知一二的。因此,相比一板一眼地介绍机器学习的典型算法,作者设计了一个更引人入胜的套路:先抛出一个“是否存在一种终极算法”的问题,然后带着读者一章一章地回顾机器学习发展史上的重要流派和代表算法。每回顾一派,作者就鼓励读者思考终极算法应该如何借鉴这类算法的优点。好奇的普通读者带着疑问读完本书后,不论其是否相信终极算法的存在,至少对各类算法都会有一定的印象。
作为今日头条的一位算法架构师,我倒是希望头条用户都能陷入作者的“圈套”,带着好奇心,好好读读这本书。如果大多数用户都能了解一些机器学习的基础知识,应该就能够更好地推荐算法互动,不断把算法调校得更好,使其更符合自己真正的兴趣,而不会因为算法一开始推荐的内容不好就放弃这个产品。诚如作者所说,也许在未来,对应人类的心理学,也会出现机器心理学。了解一点机器人的心理,会让你和机器的互动更有效率,也会让机器更快地成为你忠实、不知疲倦的助手。(本文节选自今日头条首席算法构架师曹欢欢为《终极算法》一书作序)
书评
如果你想了解人工智能,那么推荐佩德罗·多明戈斯的这本《终极算法》,非常值得一读。
——微软公司创始人比尔·盖茨
让机器可以实现像人类一样从经验中自学——这是计算机科学的圣杯。机器学习可以在各个方面帮助我们,比如治愈癌症、打造类人机器人。佩德罗·多明戈斯为我们揭开了机器学习的神秘面纱,展示了奇妙而让人兴奋的未来图景。
——《乔布斯传》《创新者》作者沃尔特·艾萨克森
多明戈斯开篇就直截了当地提出“所有知识都可以通过一个单一的终极算法来获得”。然后,他带领读者在机器学习的全新世界进行了一场急速穿越之旅。《终极算法》全书行文轻松、流畅,但内容极富深度和权威性。如果你想知道机器学习领域现有的所有知识,以及科学和哲学领域的相关知识,那么多明戈斯就是你的完美导游。
——微软研究院首席研究员邓肯·瓦茨
节选
终极算法是狐狸,还是刺猬
我们有必要考虑藏得更深、反对终极算法的观点,这个观点可能是所有反对观点中最严肃的一个。这个观点不是来自知识工程师或者对其不满意的专家,而是来自机器学习实践人员。假设我是持反对观的机器学习实践者,可能会说:“终极算法和我日常生活中看到的不一样。我尝试用许多学习算法的数百种变形来解决所有给定的问题,而且对各类不同问题都会有更好的算法,那么单个算法(我们说的终极算法)怎么可能代替所有这些算法?”
这个问题的答案是:的确如此。不用尝试多种算法的数百种变形,而只需尝试单个算法的数百种变形,这不是更轻松吗?只要我们弄明白,每个算法中重要的与不重要的东西、重要部分的共同点,以及这些部分如何进行互补,那么我们真的可以从这些多种算法中合成一个终极算法。这就是我们在本书中要做的事情,或者说尽可能要做到的事情。
终极算法复杂到什么程度?它包含几千行代码,还是几百万行?我们尚未知晓。但机器学习有一段可喜的历史:简单的算法意外地将精心设计的算法打败了。在《人工科学》一书的某章节中,人工智能先驱人物、诺贝尔奖得主赫伯特·西蒙让我们想象蚂蚁费力地穿过沙滩回家。蚂蚁的路线非常复杂,这不是因为蚂蚁本身复杂,而是因为沙滩这个环境对蚂蚁来说意味着要爬很多山丘,绕很多卵石。如果我们通过对每条可能的路线进行编程,模仿蚂蚁,那我们注定会失败。同样,在机器学习中,复杂性存在于数据中。
终极算法需要做的就是消化复杂性。因此,如果终极算法变得非常简单,那么我们也不用感到惊讶。虽然人类的手很简单(四个手指,一个大拇指),但它却可以制作并使用无数种工具。终极算法与算法的关系,就如同手指与钢笔、剑、螺丝刀、叉子的关系。
正如以赛亚·柏林明确提出的那样,有些思想家就是狐狸——他们知道许多微小的事情;而有些思想家却是刺猬——他们知道一件大事。学习算法也是同样的情况。我希望终极算法是一只刺猬,但即使它是只狐狸,我们也没法很快抓住它。当今学习算法最大的问题不是它们数量太多,而是尽管它们有用,却不能完成我们让它们做的所有事情。我们利用机器学习来发现深刻的真理之前,得先找到关于机器学习的深刻真理。
最好的时代,最坏的时代
“这是最好的时代,也是最坏的时代。”英国作家狄更斯在《双城记》中的这句话不仅适用于第二次工业革命,也适用于现在,适用于每一个发生重大改变的时代。智能时代已到来,要么加入浪潮,成为前2%的人;要么观望徘徊,被社会淘汰。
《智能的本质:人工智能与机器人领域的64个大问题》
[美] 皮埃罗·斯加鲁菲
皮埃罗·斯加鲁菲所写的这本书生动易懂而又发人深思,对于人们回归常识与本质,客观地理解人工智能、机器人乃至未来智能社会的人类生活都是有意义的。
《智能浪潮:增强时代来临》
[美]布雷特·金
作者在书中创新性提出,我们已经进入一个被增强了的时代。在这个时代,个人和组织在科技的影响下将会出现颠覆式转变。他在书中举出了大量案例,并以丰富的图片向我们展示了一个智能的未来。在当下快速变化的世界,无论是个人还是组织,这本书都是一本实用的指南。
《智能红利:即将到来的后工作时代 》
[中] 刘庆振等
本书讨论了正在如火如荼进行着的人工智能革命对人类工作方式和工作观念的影响。同时,作者也探讨了机器红利对人口红利的替代作用,并指出:尽管如此,人仍然还是有人的用处,人类将与机器共存、共荣,创造一种全新的经济景观和工作形态。