腾讯科技 5月22日综合报道
谷歌想用新芯片达成的仍然是一个老目标:前所未有的高效率。
谷歌想把人工智能推向新的高度,因此需要一种功耗更低、在更少的时间里完成更多工作的芯片。但这种芯片的影响力远远超出了谷歌帝国本身——它对英特尔和NVIDIA这样的商用芯片制造商构成了威胁,当你看到谷歌的未来愿景时,这种感觉就会越发强烈。
谷歌全球数据中心网络主管乌尔斯·霍勒泽(Urs Hölzle)表示,他们今后还将研发更多这样的芯片。
谷歌不会把这种芯片出售给其他公司,不会直接与英特尔或NVIDIA进行竞争。但谷歌拥有庞大的数据中心,是这两家公司迄今为止最大的潜在客户。与此同时,随着越来越多的企业使用谷歌提供的云计算服务,它们自己购买服务器(和芯片)的数量就会越来越少,也就给芯片市场带来进一步的冲击。
TPU芯片:专为机器学习定制
事实上,谷歌把这种新芯片当作了一种推广自己AI云服务的卖点,企业和程序员可以通过云服务利用谷歌的AI引擎,将其整合到自己的应用软件中。谷歌大力向其他公司推销自己的AI能力,声称自己的AI拥有最好的硬件支撑,而这些硬件是其他公司所没有的。
谷歌的新芯片名为Tensor Processing Unit,简称TPU。叫这个名字是因为它有利于TensorFlow的运行。谷歌的深层神经网络就是由TensorFlow软件引擎驱动的(深层神经网络是一种硬件和软件网络,可以通过分析大量数据,来学习特定的任务网络软件)。其他科技巨头用图形处理单元(GPU)运行深层神经网络——GPU的设计初衷是帮助游戏和其他图形密集型应用程序渲染图像,驱动深层神经网络的那类运算采用GPU比较适合。但谷歌表示,它设计的新芯片在那类计算上效率更高。
据谷歌说,TPU是专为机器学习量身定做的,所以它执行每个操作所需的晶体管数量更少。这意味着芯片每秒执行的操作数量增多了。
将GPU挤出局?
暂时来说,谷歌的深层神经网络将同时使用的TPU和GPU。霍勒泽不愿详细解释谷歌使用TPU的方式,只表示用TPU来处理Android手机语音识别所需要的“一部分计算”。但他说,谷歌将发布一篇阐述TPU好处的论文,而且谷歌将继续设计一些以其他方式推动机器学习的芯片。这样看上去,GPU似乎最终就会被挤出局。霍勒泽说,“GPU已经在一点点出局。GPU太通用了,对于机器学习针对性不强。机器学习本来就不是GPU的设计初衷 。”
NVIDIA可不想听到这样的话。作为全球最大的GPU厂商,NVIDIA正在推动自身业务向AI领域扩展。正如霍勒泽指出,NVIDIA最新的 GPU有一个专门针对机器学习的型号。但显然,谷歌希望进展能更大一些。
可编程芯片FPGA
与此同时,其他公司(其中最值得注意的是微软)正在探索另一种芯片:field-programmable gate array,简称FPGA,你可以对这种芯片重新编程,以便执行特定的任务。微软已经在机器学习方面对FPGA进行了测试,英特尔最近也收购了一家FPGA厂商。
一些分析师认为这是一种更加聪明的做法。密切注视芯片业务的Moor Insights and Strategy公司总裁兼首席分析师帕特里克·摩尔海德(Patrick Moorhead)说,FPGA提供了更多的灵活性。他感到谷歌新的TPU似乎有点“过犹不及”,因为这样一种芯片需要至少6个月才能研发成功,而这是一个竞争非常激烈的市场,最大的互联网公司在里面你争我夺,6个月对它们来说是相当长的一段时间。
但是谷歌并不需要那种灵活性,它最看重的是速度。当被问及为什么谷歌要从零开始研发芯片的,而不是使用FPGA的时候,霍勒泽回答说:“因为会快得多。”
核心业务
霍勒泽还指出,谷歌的芯片不能取代CPU(中央处理单元,计算机服务器的心脏)。谷歌数据中心仍需要CPU在数以万计的机器上运行。CPU是英特尔公司的主营业务。不过既然谷歌愿意仅仅为了AI一个领域就自己研发芯片,人们难免就会觉得它将来会研发自己的CPU。
霍勒泽淡化了这种可能性。 “你想要解决的是那些尚未解决的问题,”他说。意思是CPU已经是很成熟的技术,没有什么问题需要改进。但他同时表示,谷歌希望在芯片市场存在良性竞争。换句话说,它想从众多的卖家那里购买产品,而不只有一个卖家可选。毕竟,更多的竞争对于谷歌来说就意味着更低的价格。霍勒泽解释说,谷歌正在与OpenPower Foundation合作,就是为了扩大选择范围。OpenPower Foundation的芯片设计任何人都可以使用和修改。
这种做法对全球最大的芯片制造商构成了潜在威胁。调研公司IDC分析师谢恩·劳(Shane Rau)估计,在全球销售的所有服务器CPU中,大约有5%都是被谷歌买下的。在最近一年的时间里,谷歌买下了约120万颗芯片,其中绝大部分可能都来自英特尔。
无论谷歌在CPU方面有什么计划,该公司都会继续研究特别适合于机器学习的芯片。要真正弄清哪些做法可行,哪些做法不可行,这可能需要花上几年的时间,毕竟神经网络本身也在不断演变。 “我们一直都在学习,”他说。 “我不清楚最后的答案是什么。”当然,全球芯片制造商肯定会密切关注他们的学习状况。(Kathy)
作者:anenv,如若转载,请注明出处:https://www.anenv.com/407.html
发表评论 抢沙发