大 创 实 验 室

更多内容请联系我们

聊聊人工(gōng)智能芯片

发表(biǎo)时(shí)间(jiān):2018-12-26 10:00作者:中科四平网址:http://www.bellistspa.com

人工智能芯片主要包括NVidia GPU、Google的TPU、Intel的Nervana、IBM的TreueNorth、微软的DPU和(hé)BrainWave、百(bǎi)度的XPU、Xilinx的xDNN、寒武纪芯片、地平线以及深鉴科技的AI芯片(piàn)等,基(jī)本上(shàng)是GPU、FPGA、神经网络芯片三分天下的趋势,三种芯片(piàn)各有各(gè)自的优(yōu)劣,都在(zài)面向自己独特的细(xì)分市场。本章先聊一聊深度神(shén)经网络(luò)和NVidia GPU的崛(jué)起。

   人工智(zhì)能的终极目标(biāo)是模拟人(rén)脑,人脑大概有(yǒu)1000亿(yì)个神经元(yuán),1000万亿个突(tū)触,能够处理(lǐ)复杂的视觉、听觉(jiào)、嗅觉、味觉、语言(yán)能力、理解(jiě)能力、认知能力、情感控制、人体复杂机构(gòu)控(kòng)制(zhì)、复杂心理和生理控制,而功耗只有10~20瓦。

这是人脑基本(běn)神经元和突触:

    这是人工神经元模拟神经元:

微(wēi)信(xìn)图片_20181226100213.png

输入(rù)模拟神(shén)经元输(shū)入电信(xìn)号(hào),权值(zhí)模拟神经元之间的突(tū)触连接,激(jī)活函数模拟突触之间的电信号传导。

早(zǎo)在1981年David Hubel和Torsten Wiesel就发(fā)现了(le)人的视觉系统的信息(xī)处理是分(fèn)级的,因此获得了诺贝尔医学奖。如图所示,从(cóng)视网膜(mó)出发,经过低级的V1区边缘特征(zhēng)提取,到V2区识别基(jī)本形状或目标的(de)局部,再到高层的目标识别(例如识别人脸),以及到更高层(céng)的(de)前(qián)额叶皮层(céng)进行分类(lèi)判断等,人们(men)意识到高层特(tè)征是低层特征的组合,从低(dī)层到高层越来越抽(chōu)象,越来越能表达语义或者意图。

深度神经网络(luò)模型(xíng)模人脑识别的分层识别过程(chéng):

微信图片(piàn)_20181226100220.png

深度(dù)神经(jīng)网络(luò)的输入(rù)层模拟视觉信号的输入,不(bú)同(tóng)的隐藏层模拟不(bú)同(tóng)级别的抽象,输(shū)出层模拟输出的对象(xiàng)分类(lèi)或者语义等。

从上图的(de)典型的人脸识别的(de)训练任务来看,按(àn)照(zhào)10层深度神经网络(luò)、训练上百万张图片,大概需要30 Exaflops的计算能力,如果(guǒ)还是(shì)用CPU来做训练,大(dà)概需要(yào)训练一年的时(shí)间,这显然是无法忍受的速(sù)度(dù),亟待需要计(jì)算(suàn)能力更(gèng)强的人工神经网络芯片出现(xiàn)。

NVidia GPU的崛起

可能有很多人会(huì)问,目前在人工(gōng)智能领(lǐng)域,NVidia GPU为(wéi)什么具有无可撼动(dòng)的霸(bà)主地位,为什么AMD的(de)GPU和NVidia GPU性能相差不(bú)多(duō),但(dàn)是在人工智能领域的受欢迎(yíng)的程(chéng)度却有天壤(rǎng)之别。
我们知道GPU原本就是显卡,它是为游戏和渲染而生的,它里面核心(xīn)运行单元(yuán)是shader,专门用作像素、顶点、图形等(děng)渲染用的。
NVidia在2006年的时候跨时代的推出了统一计算设备架构CUDA(Compute Unified Device Architecture)以及(jí)对应的G80平台,第一次让GPU具有可编(biān)程性,让GPU的核心流(liú)式处(chù)理器Streaming Processors(SPs)既具有(yǒu)处理像素、顶点(diǎn)、图形等渲(xuàn)染能(néng)力,又同时具备通(tōng)用的(de)单精度浮点处理能力,NVidia称(chēng)之为GPGPU(General Purpose GPU),黄教主(zhǔ)的野心(xīn)是让GPU既能做(zuò)游(yóu)戏和渲(xuàn)染也做并行度很(hěn)高的通用(yòng)计算。

2006年,第(dì)一代(dài)GPGPU架构G80

微信图片_20181226100229.png

G80有16组流式处理器Streaming Processors(SPs),每组SP里有16个计算(suàn)核心,一共128个独立的计算核(hé)心,单精度峰(fēng)值计算能(néng)力可(kě)达330 Gflops,而同期主(zhǔ)流(liú)的Core2 Duo CPU只有50 Gflops的处理能力,更(gèng)为重要的是从G80架构开始,GPU开始支持(chí)可(kě)编程,所有的计算密(mì)集型的并行任务(wù)都有可能通过程序(xù)移植在GPU上运(yùn)行起来。

CUDA的编程模型

CUDA将GPU的(de)计算(suàn)单元抽象成3个编(biān)程(chéng)层次(cì):Grids、Blocks和Threads,一个(gè)CUDA kernel在(zài)执行(háng)的(de)前会先把(bǎ)数据和指令传到GPU上,在执(zhí)行(háng)的时候会使用若干个Grids,一个Grid里含(hán)有多个Blocks,一个Block里含有多(duō)个Threads,调度上一个Block的Threads会调度(dù)到一个独立的Streaming Processors上执行(háng),而16/32个Threads称为一(yī)个(gè)Warp,Warp是GPU上指令(lìng)调度的(de)最小单元,一个Warp会(huì)同时运(yùn)行在16/32个(gè)计算核心上。

微信图片_20181226100233.png

性(xìng)能增长远超CPU战略

NVidia从2006年推出Tesla架构以来(lái),不断的更新架构和性能,陆续推出了(le)Femi、Maxwell、Pascal还(hái)有最新(xīn)的Volta架(jià)构,基本(běn)上保(bǎo)持(chí)着2年性能(néng)翻(fān)1倍的增长态(tài)势。
而对CPU的(de)性能(néng)加速比,在单精度计算能力上保持(chí)着遥遥领先的态势,并且(qiě)拉开的差距越来越(yuè)大。

微信图片_20181226100238.png

深(shēn)度神(shén)经网络+NVidia GPU掀起人工(gōng)智能浪潮(cháo)

深度神经网络+NVidia GPU掀起了业界的(de)人工(gōng)智(zhì)能浪潮,不得不说这只是老黄整体战略的一个副产品,谁(shuí)也没有想到,高性能计算(suàn)领域(yù)的一个分支--人工智能会如此火爆。
2011年,负责谷歌大脑的(de)吴恩达通过让深度(dù)神经网络训(xùn)练图片,一周之(zhī)内学(xué)会(huì)了识别猫,他用了12片GPU代替了(le)2000片CPU,这是世界上第(dì)一次让(ràng)机器认识猫。
2015年,微软研究院(yuàn)用GPU加(jiā)速(sù)的(de)深度神经网络,在ImageNet比赛中获得了多项击败人的辨识准确度,这是第一(yī)次机器视觉(jiào)的识别率打(dǎ)败(bài)了人(rén)眼的识别(bié)率(错误率5%),可以认为是人工智能史上的一个重要里程(chéng)碑事件。
2016年(nián),谷(gǔ)歌旗下Deepmind团队研发的机(jī)器人AlphaGo以4比1战胜世界围棋冠(guàn)军职业(yè)九段(duàn)棋手李世石(AlphaGo的神经网络训练用了50片GPU,走(zǒu)棋网络用了174片GPU),引发了(le)围棋界的轩然大波,因为(wéi)围棋一直被(bèi)认(rèn)为是人类智力(lì)较量的巅峰,这可以看做(zuò)是人工智能史上的又一个重大里程碑(bēi)事(shì)件。


山(shān)东省济南市历(lì)下区舜(shùn)华路750号大学科技(jì)园北区(qū)3号楼(lóu)
服务热线:13256445996                                  www.bellistspa.com

首页_JDB(中国)电子_官方网站

首页_JDB(中国)电子_官方网站