1. 首页
  2. 智能硬件

吴恩达:三大技术架构百度深度学习 评:干货

     2015百度世界大会上,百度首席科学家吴恩达操着一口西洋式中文,介绍了百度深度学习架构和最新进展。可以看出,吴恩达学中文很是努力。演讲中,吴恩达还演示了一款名为“脸优”的娱乐应用。使用该应用,吴恩达将自己与李彦宏的面部融合,在台上摆出V形托下巴手势,“自恋地”认为,很好看。


吴恩达:三大技术架构百度深度学习 评:清晰


吴恩达在现场演示脸优


  吴恩达演讲全文:


  今天我想跟大家分享一些我们正在做的先进技术,我也希望未来我们能把这些技术开放给我们的合作伙伴。


  百度语音识别技术进展


  从李彦宏讲的一席话里我们看到语音识别重要性,百度和北京团队一起正在研究新一代的语音识别技术,让我为大家演示一下。这是一段用户手机的录音,请大家仔细听听,你能听出他在讲什么吗(现场观众响应,纷纷摇头)。来,现在请大家闭上眼睛再听一次他到底在讲什么。有时候由于噪音、口音等等,很难听清楚电话那边的人在说什么,我们把这段语音放给我们的语音识别系统得到这个结果,是说中国好声音几点开始,请大家再听一次。


  这个技术还没有上线,目前在很多情况下人的语音识别能力还是比机器识别更准确,但是我们发现如果只有一段很短的语音,尤其是在比较吵的环境下机器识别可以超过人的识别,一年前我没有想到这么快机器就可以做到这点。


  我相信语音有很大的潜力改变人与设备的交互方式,现在语音识别可能已达到95%的准确度,但要看你的口音等等来定。很多人没意识到95%的准确度到99%的准确度带来的不是量变是质变(对于吴恩达而言,这句话成了一个绕口令,还好他用中文说得很顺畅),是从你偶尔使用语音变到常常使用做到更自然。做到99%准确,将彻底改变人与设备交互,这个技术的进展让我对人与设备全新交互充满信心。


  百度深度学习架构(干货)


  在百度人工智能技术的进展主要靠深度学习,深度学习的意思是建设巨大的神经网络,语音识别也是用深度学习做的。


  在这一年中我们在深度学习基础架构上有很大进步,这对人工智能的研究有很大的影响。我们的技术架构分为三个部分,第一就是用于训练的超级计算机,第二就是用于在线服务的云加速器,把训练后的加速器放到云端在线服务。第三就是手机上的深度学习引擎,让我详细解释一下这三个部分。


  如今已是海量数据的时代,百度有着大量的数据可以使神经网络训练得更大效果更好。我们开发了HPC来做深度学习试验,这里百度使用很多的GPU做HPC,在使用HPC做深度学习训练上,百度处于世界领先地位。做HPC的一个难点是提升GPU的使用效率,2014年HPC深度学习的使用效率是20%左右,我们目前GPU使用效率可以提升到85%,能让我们能够更快地训练巨大的神经网络。


  使用HPC训练巨大的神经网络之后,下一步是使用它提供在线服务。例如当用户讲话时,系统会实时返回结果。但是,普通的CPU服务器有时候很难做到运行巨大的神经网络, 我很高兴向大家宣布百度已经开发了两个加速技术。第一,我们开发了FPGA加速器,在很多重要的应用下它可以把速度提升五倍左右。第二,我们也开发了GPU加速器,这里GPU不仅用于训练,我们也打算将其用于在线服务。百度的这种技术是处于世界前列的,这样做的难点是如果有十个用户在使用一个服务器,我们需要找到一个聪明的方法让一个CPU有效的为十个用户提供服务,使用这个技术,我们可以在在线服务上明显的提升神经网络规模。


  对于一些应用,把数据传到云端太慢,影响用户体验,所以我们需要在手机上运行深度学习引擎。


  用HPC训练了巨大的神经网络后,把这个神经网络运行在这么小的手机上很难的,所以我们开发了手机深度学习引擎。


  我们来看一个例子,我们想识别人脸,并理解表情,我们开发了一个深度学习系统,可以识别人脸上的72个关键点,对比其他系统我们识别了比较多的关键点,让我们有更多细节来理解表情。


  在手机上运行神经网络,难点是模型规模、速度和错误率,这张图是一个神经网络在PC上运行的结果,这个神经网络对于手机来说太大了,用我们的手机深度学习引擎我们使用了一个聪明的办法,将神经网络的模型减少,还大量提升运行速度。


  手机深度学习引擎应用:脸优与直达号轻App


  使用手机深度学习引擎,我们做了一个新的APP叫做脸优,我们刚刚在IOS上发布这个APP。用手机拍一张你的照片,用神经网络识别出你的面部,然后和另外一张图片放在一起效果就是这样(现场呈现出了图片)。


  让我为大家演示一下,这就是我的手机,我今天早上跟其他演讲人拍的照片。这就是我的脸变成了王劲,也可以变成李彦宏,很好看(自恋地表现出V字托下巴手势)。这是Travis(Uber CEO) 再试一试,很帅。做女性的也可以,其实这是我妻子的图片(面部融合后的效果展示引起全场大笑)。


  脸优是一个娱乐APP,需要非常快的响应速度。那么手机深度学习引擎还有什么其他用处呢?假如你和你的孩子一起去超市买东西,你们看见了这盒牛奶,我拿了一盒牛奶,如果你的孩子对这盒牛奶好奇你会怎么办?我们与伊利合作做了一个直达号轻应用,它可以识别出牛奶盒,并让你看到一个3D效果的地图,也可以从不同角度来看它,从上面可以看,可以啊,远一点,台上灯光很亮,看见了,那你可以从不同的角度看这个地图,如果小朋友点击这个地图也可以看到另外一端牛奶的信息。这个轻应用两三个月后会上线,可以利用产品包装上的图案提供增强现实体验,不需要特别的图片或二维码,增强现实技术可以让你更多地了解我们的世界,我们目前还是和很少的商家合作,希望未来有更多的商家可以使用这个技术,帮助用户了解产品并探索世界。


  对人工智能前景的看法


  百度已经有很多人工智能的产品,我们的深度学习基础架构可以让人工智能越来越好,派发出更多更新产品。最后人工智能的未来是什么?在我结束演讲前,我想向大家讲讲人工智能的前景。


  很长时间以来我们一直在讲百度大脑越来越聪明,这很重要,他能让我们对用户提供越来越好的服务,但这还不够,人工智能的下一步不止是百度大脑更聪明,也能够使用户也更聪明,像李彦宏提到的度秘,技术可以成为你的合作伙伴,让你变得更有效,虽然是你本人决定去哪里旅行,决定吃什么,决定买什么衣服,但是技术可以成为你的智能伴侣,帮你更好的了解信息,做出选择,做出定,这里技术需要了解你的想法,也需要与你交互,语音识别是一个重要的方法,也是技术与人交互的例子,李彦宏讲的秘书化也是这个意思,因此我对人工智能成为人类合作伙伴的未来充满信心,我也希望与大家共同走向智能伴侣时代。谢谢!

发表评论

登录后才能评论