作者:凯德·梅茨
出版社:中信出版社
出版时间:2022年12月
这本书的作者是《纽约时报》科技记者。他历时8年,采访了400多位深度学习行业相关人士,从谷歌、Facebook到百度,从中国、美国到欧洲,展现人工智能这场全球“军备竞赛”的来龙去脉。
6月13日,从事自动驾驶专用芯片开发工作的地平线公司创始人兼首席科学家余凯博士应邀来到上汽集团,在中心组(扩大)学习会上作了关于人工智能的辅导报告。他给与会人员带来了一本书:《深度学习革命》。如果不是余博士推荐,仅看书名,并不会知道这本书读起来是如此轻松、有趣。翻看之后,感觉欲罢不能,便想推荐给《上海汽车报》的读者。
在辅导报告中,余凯博士讲述了一场秘密竞拍的故事。令人欣喜的是,这个故事完整呈现在此书中。本报特地摘录了其中一部分片段,让大家先睹为快。(以下摘自余凯博士为此书撰写的推荐序,其中的“我”即余凯博士)
我在2012年4月离开了位于美国硅谷的NEC实验室,回到北京,加入百度,领导百度新成立的多媒体部,包括语音识别团队和图像识别团队。这是后来的IDL(百度深度学习研究院)的前身。
2012年10月,杰夫·辛顿与他的两名学生亚历克斯·克里哲夫斯基(Alex Krizhevsky)和伊利亚·萨特斯基弗(Ilya Sutskever),在ImageNet图像识别比赛中拿到了冠军,并且发表论文,介绍了冠军算法AlexNet。这件事对于别人来说,可能只是一个新闻,但是对我来说,却意义非凡!因为我曾经带领NEC实验室的研究团队,在2010 年拿到过第一届ImageNet竞赛的冠军。我们采用了多层稀释编码方法,一种非监督的卷积深度学习算法来提取图像特征,然后用浅层的监督学习方法进行识别。当时,我们尝试过监督学习的卷积神经网络,但是训练很难收敛。所以,我应该是世界上最了解辛顿团队用卷积神经网络赢得ImageNet竞赛这件事的重要意义的人之一。当时,我感到兴奋不已,就像触电了,于是立刻写了封电子邮件给辛顿,迫切地表达要和他深入合作的想法。
辛顿很快就回复了,说很愿意合作,但是希望百度能提供一些研究经费。我说:“没问题啊!大概需要多少钱?”辛顿说:“大概100万美元吧。”于是,我去找百度首席执行官李彦宏,对他说我希望有足够多的经费支持辛顿与百度在深度学习研究方面开展合作,李彦宏非常支持。随后,我就回复辛顿:“没问题,百度很愿意出研究经费。”他一方面表示感谢,另一方面很绅士地问我,是否介意他也去问一下谷歌对此有没有兴趣。我当时有点儿后悔,猜测自己可能回答得太快了,让辛顿意识到了巨大的机会。但是,我只能大度地说“不介意”。结果,他不只问了谷歌,还问了其他一些公司。大概在2012年11月,他告诉我,还有几家公司表示要和他合作,而且他注册了一家公司,名字叫DNNresearch,准备让各家竞争者以秘密竞拍的方式做团队收购。我心里想,辛顿真是聪明,不仅会做研究,而且很有生意头脑。2012年12月初,我飞往美国旧金山,租了一辆车,开车前往太浩湖,参加一年一度的机器学习顶级盛会NPS(神经信息处理系统大会),同时在那里与另外三家公司一起竞拍杰夫·辛顿的团队。我时刻与李彦宏,以及时任百度投资副总裁汤和松保持沟通,并且代表百度做了第一次报价(1200万美元)。(编者注:竞拍价格最后达到4400万美元,辛顿叫停了竞拍,并决定与谷歌合作。)
会议结束后,我飞回了北京。尽管竞拍失败,但我仍然很开心。我想,我的目的达到了,因为李彦宏亲眼见证了国际巨头不惜花费巨资投资深度学习研发。这让他下定决心,自己把深度学习做起来。所以,2013年1月,百度在年会上宣布要组建IDL,并招募全世界顶级人才。为了提高对人才的吸引力,李彦宏亲自担任院长,我担任常务副院长。IDL开创了中国公司建立前沿人工智能研发机构的先河。后来,中国几乎所有的大型科技公司都组建了类似的机构。IDL率先把深度学习技术应用到语音、图像、广告、搜索等各个领域,招聘和培养了一批顶级人才。如今,这些人才在中国人工智能领域可谓群星璀璨。IDL启动的项目,包括PaddlePaddle(百度深度学习平台)、百度自动驾驶,直到今天依然属于中国最有影响力的技术项目。后来,百度自动驾驶成为业界的“黄埔军校”,百度前员工创立的自动驾驶公司占据了中国自动驾驶行业的“半壁江山”。
我自己的职业生涯也是如此,我从一名在硅谷从事基础研究工作的实验室主任变成了一个大型研发团队的管理者,并且使自己带领的团队研发的技术被上亿名用户使用。我很感谢百度能给予我一个这样的舞台。2015年夏天,我从百度离职,迈向新的征程,创立了地平线。地平线创业的想法来自我在IDL工作期间的一个观察:GPU运行深度学习算法的效率是CPU(中央处理器)的几十倍,但是GPU本来是为图形渲染设计的,所以用GPU做深度学习是无心插柳的结果。那么,我进一步想,如果专门为深度学习设计加速芯片,会不会效率更高?答案是显而易见的。
于是,地平线开辟了中国深度学习芯片创业的赛道。在过去10年里,深度学习改变了人工智能,也改变了世界。参与那场拍卖的大部分人,如今都活跃在科技的舞台上。2019年,杰夫·辛顿与约书亚·本吉奥(Yoshua Bengio)、杨立昆(Yann LeCun)共同获得了计算机领域的最高奖项——图灵奖。他的两名学生之一亚历克斯是AlexNet最主要的贡献者,加入谷歌后,似乎动静不是很大。但是,另外一名学生伊利亚后来与埃隆·马斯克等人联合创立了著名的 OpenAI(人工智能研究公司),打造了在强化学习领域几乎与DeepMind 齐名的研究机构。辛顿一直很感谢我。有一次,我在加拿大温哥华举行的一场学术会议上碰到他,他非常热情地请我去餐馆吃饭。我仍然记得,由于他的腰背部有问题,不能坐在椅子上,只能双腿跪在地上,餐馆里的服务员用奇怪的眼光看着我们。代表微软参与了竞拍的邓力博士,后来成为世界上最大的对冲基金之一——Citadel(城堡投资)的首席人工智能科学家。最具传奇色彩的是戴密斯·哈萨比斯,他创立的DeepMind后来被谷歌收购,公司开发的AlphaGo震惊了全世界,激起了无数人对人工智能的热情。最近,我看到一则新闻:我在NEC实验室工作期间的前同事科拉伊·卡武库奥格鲁(Koray Kavukcuoglu),现为DeepMind研究副总裁,成为2022年度新晋英国皇家工程院院士。此前,另一位当选院士的是DeepMind创始人哈萨比斯,他们两人都为AlphaGo做出了杰出的贡献。
深度学习领域发生的很多事情,包括我自己的职业生涯和创业经历,都和那场太浩湖畔的竞拍有着某种奇妙的联系。最让我感动的是,经历过那场竞拍的大部分人,直到今天依然在努力奋斗着,没有人懈怠或躺在功劳簿上,包括我自己。2015年创立的地平线,如今也成为行业中有影响力的科技企业。
《深度学习革命》这本书并不是侧重讲一个个研究成果的技术概念,而是在讲推动这些研究进展的背后一群人。人工智能领域最近取得突飞猛进的进展,关键在于有一群执着、热情和可爱的研究者。任何伟大的成就,可贵之处都在于人的精神。
相关链接
地平线与英伟达
近日,英伟达成功跻身万亿美元市值俱乐部,在美股市场沸沸扬扬。
英伟达能完成这个伟业,离不开最近爆火的AI大模型对算力的巨大需求。除了AI芯片,英伟达最近也把目光盯上了汽车领域。如果说英伟达是一家通用芯片企业,那么地平线更专注于深度学习的专用芯片,而且是一家地道的中国公司,上汽集团是其战略股东之一。
余凯认为,汽车芯片算力并非越大越好,行业还是要回归理性。“高阶的自动驾驶,其实在用户感知上并没有刚需,算力到达一定程度后,用户并不会为算力所带来的浪费埋单。”他认为,未来几年内,行业依然要在软件算法创新、数据闭环迭代、工程落地等方面不断逼近用户上限,让用户真正愿意为算力成本埋单。
“地平线与英伟达有一个共同点,在某种意义上,我们都是披着芯片外衣的软件公司。英伟达有他的CUDA软件生态,地平线也有自己的软件生态。软件的成熟度是生死门。”