野心勃勃的英伟达:成为新一轮科技革命的“心脏”
2016-12-23 16:14
25
29200

当普通玩家面对英伟达GeForce GTX 1080显卡的性能诱惑,还在犹豫是否要花几千块钱升级自己的电脑时,英伟达的创新能力则犹如其显卡的进化速度,在多个领域突飞猛进、遍地开花。

成立于1993年,英伟达以制造显卡起家,并于1999年上市。在今年之前,英伟达股价从未超过40美元。今年以来,在科技行业的热门领域,无论是无人驾驶还是微型超级电脑,英伟达突然以全新的面貌冲了出来。其股价也一路上涨,昨日收盘达到107.11美元。

过去多年来,英伟达一直遭到英特尔以及高通等竞争对手的围剿。2008年,当英特尔决定在自家产品中融入芯片组技术时,英伟达的芯片组业务几乎一夜间消失。但是在显卡业务上,英特尔始终未能打造出足以媲美英伟达的产品,英伟达在高端电脑市场的位置固若金汤。

在近年来极为火热的智能手机市场,英伟达CEO黄仁勋很早就曾指出,人们的交流方式以及计算行业将迎来重大变革,英伟达也于2008年首次发布了手机芯片Tegra,开始在移动领域大显身手。

随后,全球首款双核Tegra 2、首款四核Tegra 3更是让英伟达在这个领域的表现达到顶峰,以强劲的性能拉开与对手的差距。

但从Tegra 4开始,这种势头就开始下降,原因是缺少了通信基带导致整机成本、设计难度高于高通等竞争对手,即便图形性能再强也于事无补。于是,2014年5月24日黄仁勋表示,英伟达决定撤离智能手机市场。

但是,英伟达的故事才刚刚开始。

引领无人驾驶汽车革命

今年9月,英伟达汽车业务高级主管Danny Shapiro表示,在路上行驶的车辆之中,有超过20个品牌的1000万辆车在不同程度地使用英伟达的技术。此时,有更多的人看到了英伟达占据下一代汽车技术核心位置的潜力。

与特斯拉上17英寸屏幕对英伟达显卡技术的依赖相比,更值得注意的是英伟达打造的无人驾驶汽车的“大脑”: Drive PX 2,这是一台能够帮助汽车进行定位和躲避障碍物的人工智能电脑。

2

(图片来自英伟达官网)

Drive PX 2到底有多强大?Shapiro称,甚至可以这样说,Drive PX 2让车辆获得了亲眼“看”世界的能力,总计已有超过80家汽车厂商、创业公司以及研究机构依赖于Drive PX 2驱动他们所研发的无人驾驶汽车。

Shapiro对Drive PX 2进一步解释称:

这个系统让车辆能够感知周边情况,加以理解,并在1/30秒内采取行动,这种能力是目前的自动驾驶汽车能够上路的前提。

今年年初,英伟达推出Drive PX 2,其性能堪比150台苹果 Mac Pro。英伟达称,Drive PX 2的深度学习处理频率达到了前所未有的每秒24万亿次,深度学习将使得自动驾驶汽车分辨出周围的物体,比如一只狗或者一部警车,并对此发出警报。

改变VR的黑科技

虚拟现实(VR)领域是英伟达技术的另一用武之地。

一款VR产品如果要让用户使用时感受不到眩晕,画面就要达到一定的帧率要求。而对整个画面按照高帧率渲染,对硬件计算能力的要求则又极高。

为解决这个问题,英伟达基于其积累多年的图像处理技术,利用人眼的视觉原理,尝试在VR设备中仅对视觉中心区域进行完全渲染,其他区域则保留很低的分辨率。

按照这种做法,仅仅对用户目光聚焦处进行这种渲染,则能节省出巨大的硬件计算能力,大幅提升整体性能表现。“(硬件)表现上的提升,大到根本无法忽视,” 英伟达研发副总裁David Luebke称。

英伟达称,希望这些发现能够激发大型VR厂商在未来产品中集成眼球追踪技术。“我们目前在做的工作,一部分就是用于帮助(行业)制定VR之路的规则。”

麻省理工科技评论在文章中表示,这种技术未来将对英伟达显卡产品带来影响,也将令开发者按此思路调整图像渲染算法。

新杀手锏

今年4月,英伟达发布了一款定位于深度学习的超级计算机DGX-1。据英伟达官网描述,DGX-1将硬件、深度学习软件以及开发工具整合到了一起,其中包括8块英伟达Tesla P100 GPU,运算能力相当于250台传统服务器,可以帮助用户大幅缩短处理时间。

而其长宽高仅分别为866、444、131毫米,功耗3200W。

自2012年来,数据科学家一直在利用GPU加速对深度学习技术的开发,但是当前计算机处理能力成为他们难以克服的瓶颈。随着DGX-1投入使用,以前部分根本不可能实现的深度学习模块,就能够得以运行。

据麻省理工科技评论,这一超级计算机最早的使用者表示,DGX-1让他们能够更快的训练自身的数据分析模块,从而能加快实验进展,推动在科学、医疗以及金融等多个领域的突破。

黄仁勋的过人之处

英伟达近年的快速发展以及在诸多领域取得的突破,与其CEO黄仁勋的贡献密不可分,而53岁的黄仁勋在公司成立二十多年后依然担任CEO,在西方也并不多见。

曾在黄仁勋手下工作过的人对媒体表示,迄今为止,黄仁勋在运营英伟达时仍像对待一家创业公司一样,决策果断,执行迅速。

对于一家半导体制造商来说,芯片从设计到生产的过程可能要花费数年时间以及巨额资金,企业通常会规划一个路线图,并基于此打造组织结构。

而在英伟达,整个过程则要快得多。当一名高管试图描述新芯片设计进展时,黄仁勋很有可能叫来工程师现场提出技术问题,然后迅速毙掉这个项目,或者改变研发方向。

同时,黄仁勋在对待其产品的理念上也极为灵活。

上面提到,2014年5月英伟达决定撤离智能手机芯片市场,但是撤离之后,英伟达并没有放弃Tegra芯片的研发,而是把目光集中到了移动游戏和汽车领域,自家也推出了Shield游戏掌机,硬生生为Tegra开创出一片新的天地。

尽管Shield并未动摇微软Xbox以及索尼PlayStation在游戏领域的地位,但是却为Tegra芯片带来了任天堂这一重量级客户。今年10月底,任天堂公布的最新游戏机Nintendo Switch采用的就是英伟达定制的Tegra处理器。

Stifel Nicolaus & Co分析师Kevin Cassidy称,Tegra基本上是英伟达的一个内部试验项目,如今则被任天堂采用。英伟达总会卷起袖子创造一个新市场,并拱手将其让给客户,这是又一个例子。

为什么是英伟达?

无论是无人驾驶还是其他尖端技术所依赖的深度学习,都离不开数据处理核心。提到数据处理,人们的第一反应总会是计算机的大脑——CPU,以及全球最大的CPU厂商英特尔。

在处理复杂任务时,英特尔CPU能够展现出优异的速度表现,但是在平行处理多任务的能力上却存在很大限制。GPU的快速发展,不论在处理速度还是多任务处理能力上,都有着更大的优势,而这正是英伟达过去二十多年来孜孜耕耘的领域。

华尔街见闻此前曾援引浙商证券分析师杨云的介绍提到,相比于CPU,GPU的一大优势是高速度。杨云称:

国内最好的人工智能硬件研究项目“寒武纪”小组的最新研究结果表明,GPU能够提供平均 58.82 倍于CPU的速度。GPU的另一大优势,是它对能源的需求远远低于CPU。

杨云认为,正是因为GPU的高速度以及可以平行处理大量琐碎信息的特性,GPU在“深度学习”领域就能发挥巨大的作用。

深度学习所依赖的是神经系统网络——与人类大脑神经高度相似的网络——而这种网络出现的目的,就是要在高速的状态下分析海量的数据。例如,如果你想要教会这种网络如何识别出猫的模样,你就要给它提供无数多的猫的图片。而GPU擅长的正是海量数据的快速处理。

杨云称,与传统的通用处理器(GPP)相比,GPU的核心计算能力要多出几个数量级,也更容易进行并行计算。尤其是英伟达的CUDA,作为最主流的GPGPU编写平台,各个主要的深度学习工具均用其来进行GPU 加速。

英特尔当然不甘示弱。今年8月,英特尔宣布将于2017年推出专门为人工智能深度学习而设计的最新一代产品——Intel Xeon Phi处理器,代号Knights Mill,称其运算能力比对手的产品快两倍以上,矛头直指英伟达。

英特尔数据中心集团副总裁Jason Waxman在8月的一篇博客中也曾表示,虽然现在很多人都在谈论GPU对于机器学习的价值所在,但事实上,去年为深度学习而研发的处理器中,使用到GPU的比例还不到3%。

此外,英特尔还斥资4亿美元收购了深度学习技术公司Nervana Systems,目标在于取得其将于2017年问世的深度学习加速器芯片,以此挑战英伟达在人工智能市场的主导地位。

对于英特尔当时的步步紧逼,英伟达则予以强力反击,称英特尔在宣传其最新Xeon Phi处理器加速深度学习性能时使用了过时数据,其在深度学习性能测试上还使用了英伟达很多年前的旧产品Kepler GPU系列,这属于有意误导消费者,没有给GPU性能一个公正的评价。

口水战固然吸引眼球,但市场并不傻,企业盈利能力依然是关注的核心。

英特尔二季度净利润受到重组减记14亿美元的拖累而遭遇“腰斩”,至13亿美元。其盈利的两大增长点——数据中心和物联网营业收入当季均不及预期,数据中心的净营业收入为40.3亿美元,市场预期为41.6亿美元。

英伟达体量较小,第二季度净利润为2.53亿美元,但同比增速却高达惊人的873%。其数据中心业务营收也达到1.51亿美元,同比增长了一倍多,其中很大一部分是深度学习系统贡献的。

对于这两家企业来说,由于体量大不相同,英特尔市值为英伟达的三倍,其可比性有限。但是,对于华尔街来说,超出预期的业绩显然胜过一切。

5

收藏
相关新闻
请发表您的评论