王维嘉：为什么人类无法理解AlpgaGo的神奇？从神经元谈起

3月30日，2019中国（深圳）IT领袖峰会在深圳市五洲宾馆举行，CEG Ventures 创始管理合伙人王维嘉通过解释“暗知识”概念，分析为什么人类无法理解AlphaGo的神奇。

以下为王维嘉现场分享：

大家好，我是IT领袖峰会最早的发起人之一，在过去的几年中，主要在硅谷投资人工智能，与此同时我也在思考最基本层面的东西。图灵奖前两天发给了三位科学家，他们在人工智能里面是联结主义的代表，联结主义就是我们所说的神经网络。神经网络学派在美国一直被打压，最后他们就跑到了加拿大。

这三个人都在加拿大，一个在谷歌，一个在Facebook，还有一个留在加拿大教书，叫Yoshua Bengio，这是我最佩服的三位中的一位。因为大公司去挖他们其中任何一位，给出的都是几千万美金的身价。但他说如果都去公司了，谁在学校做研究，谁培养下一代，所以他坚持在学校里教书。

今天我就讲一下联结学派的认识论的基础。联结学派到底是什么？从AlphaGo下围棋开始，大家知道柯洁在后台痛哭流涕，这引起了人类的两种反应：一种是否认，另外一种是迷茫。

为什么AlphaGo对我们有这么大的震撼？有了AlphaGo以后，它从头开始，不用学习人类任何的棋谱，并战胜了前面所有的AlphaGo的类型，而且到今天为止天下无敌。这告诉我们一件事情，就是训练数据不一定有用，在某些场合甚至是有害的，比如在围棋里面是有害的，人类的知识是在束缚AlphaGo的知识。这种不可理解性给我们人类带来了巨大的震撼。去年年底DeepMind在科学杂志上发表了一篇文章，只要你告诉我蛋白质的DNA，我就可以算出蛋白质的三维结构来。我们所有的生命都是由细胞组成的，细胞的基本组成就是蛋白质。

为什么AlphaGo可以发现蛋白质三维结构？没有人说得清楚，不光聂卫平不懂，连谷歌设计AlphaGo的工程师也说不清楚为什么每一步棋这么走。于是在AI领域有一个重要的问题叫做不可解释性。这提出了一个很尖锐的问题，怎么可能有一种知识是我们人类不能理解的呢？我认为存在着第三类知识，就是人类不可理解的知识，下面就跟大家回顾一下我们人类认识世界的历史。

过去2000年来，人类认识历史、认识世界大概分成两派，一派是理性主义，一派是经验主义。他们分别是这么认为的：理性主义说人的概念是天生的，有时间、空间。知识是来自推理，万事都是有因果的。经验主义认为不对，我们生下来所有的知识都是后天得来的。但是不一定是因果，仅仅是相关，你只不过看到一件事发生在另外一件事的前面，不代表它就是它的原因，很可能是隐蔽的原因你根本不知道，或者复杂到你根本找不出来，所以只能说它们是相关的。

理性主义和经验主义的争论，为什么这么多年没有结果？原因在于人们当时根本不理解大脑是怎么工作的，甚至认为心是思考的器官。今天我们可以站在人类科学最新的基础上回过头来看他们错在哪里。

我们每个人的大脑大概有860-1000亿神经元，每一根神经元大概有五六千个轴突和树突，和相邻的神经元连接。神经元是怎么工作的呢？一个神经元和另一个神经元之间有连接，它们之间有一个很小的缝隙，这个缝隙之间有化学的分子通过。比如我们大家听过血清素、多巴胺这样的分子，它通过之后就会在相邻的神经元细胞上产生电位，这个电位就激活了下一个神经元细胞。所以神经元细胞的工作原理，我们今天已经揭示清楚了。

有三位科学家为神经元的发现做出了重大的贡献：

第一位科学家是德国科学家巴甫洛夫，我们大家都非常熟悉的条件反射就是由他提出的。

第二个伟大的科学家是西班牙的卡哈尔，他从显微镜下看到了神经元的连接。

最大的突破是由加拿大的科学家赫布发现的，他在1949年提出了一个天才的猜想：如果两个神经元同时受刺激，它们两个神经元会连接起来。比如说狗的嗅觉闻到了香味，同时刺激了口水，与此同时耳朵听到了铃声，这时候铃声和口水细胞就建立了联系。那下一次哪怕鼻子闻不到香味，只要听到铃声就可以把口水细胞激活。这听上去非常简单的原理，就是我们今天人类所有学习的基本原理。1949年以后，大量的科学实验反复证明了他这个猜想，所以今天我们叫做“赫布学习定律”。

我们今天看到的不论是AlphaGo也好，还是自动驾驶也好，还是人脸识别也好，它最基本的单位就是电子路模仿神经元。今天所有基于神经网络的神经元的基本工作原理就是这么简单。1957年，Rosenblatt做了第一个神经元。我斯坦福的导师在1960年做了第一个自适应线性神经元，我在跟他做博士研究的时候就做神经网络的研究，但是老人家从1959年一直到今天从来没有改变他的方向，这个冷板凳一直坐到今天，终于坐出来了。但是有多少人这个冷板凳一生都坐不出来，这就是科学家对知识的追求。

机器学习的工作原理，具体来讲就是把它的输出和目标值相比变成一个目标的误差，这个误差我画成曲线的，像山一样的，目的是让误差最小化。我如果要从山腰上走到山底下，怎么走呢？有一个最笨的方法，叫做大雾里头下山法。比如你去爬山，周围都是大雾，你只能看到眼前5米，你怎么下山，怎么走到最低的地方？很简单，转360度，找到一个最陡的方向往前走5米，再转360度再找到一个最陡的方向往前走5米，只要你这样走，只要函数是连续的，只要没有断崖，只要没有大沟，你一定可以用这个最笨的方法走到山谷去。这就是最陡梯度下降法，今天所有的神经网络算法都是基于最陡梯度下降法。

我们现在就可以总结一下神经网络的本质是什么。每个神经元的工作原理非常简单，一个乘法器、一个加法器，然后用一个连线，但是要有很多神经元。我刚才手里抱着的盒子，整个盒子里只有一个神经元，今天的机器，一个芯片上可以有多个神经元，因为今天跟1959年相比计算速度增长了10亿倍都不止。

重要的是，这样一个复杂的系统没有解析器，它是一个高阶的方程。大家记住它的本质，它是一头牛，吃进去的是数据，提取出来的是相关性。神经网络的本质就是在数据里面提取相关性，这就是我们人类学习的重要基础。比如我教小孩认识英文字母O，这个学习过程是什么呢？就是你眼睛看到一个椭圆的形状，耳朵听到O这样的发言，当形状和发音建立起联系的时候，你就认识了这个字母，学习就是这样建立相关性的过程。它有点像精油的萃取。

现在我们就可以回头来讨论为什么我们无法理解AlphaGo的神奇，我们人类过去2000年的文明都是可以通过文字来传承的，一旦有文字，人类的文明就可以积累了。所以人类最早的文明甲骨文，公式程序都是这样的。一直到70年前人类才发现还有第二种知识叫默知识，就是只可意会，不可言传的知识。有没有人是把手册背下来，上去就能骑车的？没有一个，而且世界上找不出一个教人骑自行车的手册。人类有大量这样的技能，比如舞蹈、绘画、音乐等等都是这样需要反复实践，但是说不出来的。为什么？就因为这些东西在你的大脑里建立了联系，你是无法用符号把它描述清楚的。

我们做企业的可能阅人无数，我们通常面试的人多了以后，这个人进来坐下来5分钟，我们心里基本上就大概有数，这个人是否靠谱。为什么，你说不清楚。同样，企业家作决定，所有重大的决定都是一层一层推到老板那里，老板怎么拍板？老板往往是信息最少的，但是你必须用你的经验和数据拍板。索罗斯说我所有的决定都是用胃作出来的，如果我胃疼，这个决定就不是好的决定，因为大量的直觉是无法描述的。在默知识之前，大家是否认直觉的，认为直觉是神秘主义，但事实上它非常有道理。一旦我们了解了神经元的工作原理就知道是非常有道理的。

哈耶克是奥地利著名的经济学家，他对计划经济是批判的，他说供需知识是默知识。乔布斯从来不做市场调查，他的市场调查就是早上出门前对着镜子看自己。为什么？在iPhone出来之前，你做市场调查，问iPhone需要什么功能，这是调查不出来的。我在硅谷待了30年，在乔布斯之前有很多风险投资公司血本无归。哈耶克说因为这些供需知识是说不清道不明的，所以它无法记录，因为无法记录，所以无法集中。因为计划经济的前提就是要把供需的数据集中在中央计划委员会的大计算机里面。

说完了明知识和默知识，我们现在终于可以来讨论什么叫暗知识。

明知识就是可以表达的知识，默知识就是不可表达但可感受的。如果我把这个画成一个象限，很自然地就会发现有没有一种既不可感受，又不可表达的知识？正好机器学习就填补了这个空白。

去过死海的人一躺下马上就能感受到浮力定律，浮力定律是可以表达的。但是量子力学离我们很远，所以就很难理解。这就是为什么到今天相对论和量子力学是最难理解的。默知识就是只可意会、不可言传的知识。人类的感官是有限的，我们听不到超声波，看不到红外线，有大量的东西是人类感受不到的，但是机器就可以接收到。

这三类的知识是什么关系呢？如果用一座冰山来表示，明知识就是水面上的冰山一角，默知识就是水面下的整个冰山，暗知识就是整个海洋。

为什么人类能表达的东西这么少？原因就是人类的明知识受舌头说话的速度限制，眼睛、耳朵能接受的信息远远大于舌头。这些信息进入到我们的大脑以后，在大脑中形成的连接数目也远远大于我们能表达的数目，这就是我们所说的语言是非常贫乏的。这就是波兰尼发现默知识所说的“我们能说出来的永远比我们知道的要少。”

暗知识的概念是不是哲学概念呢，和我们的生活有关系吗？关系太大了。上海交大的两个教授做研究，他们给机器看了2800张人脸图像，有好人、有罪犯。这个研究引起了全世界巨大的争议，谷歌的科学家，美国斯坦福大学的教授都写文章批判，他们批判的道理是人是有自由意志的，哪怕我是小偷，我在下手偷东西的那一刻也可以改变我的想法，我今天不偷了，你怎么能说长相就决定谁是罪犯呢？

以色列就有一家公司做这种研究，并且准备把它应用在以色列的海关上，看谁是恐怖分子。如果它真能以80%的概率筛选出来恐怖分子的话，要不要在海关用这样的东西？它能保护人民的生命安全，但也有可能冤枉好人，这对人类是巨大的挑战。

我们大家知道社会积分，假设到处都是摄像头，你从生下来就被摄像头抓取下来，机器自动给你打分，你的积分就这么低，为什么这么低分？答案是不知道，机器打的，没道理，不可解释。同样，当人类大规模协调行动时，像诺曼底登陆这种多变量的战斗中，敌我双方力量的对比以及天气，任何一个将军都是拍脑袋，都是以经验来做绝对的决策。但是机器可以把这么多的变量分析得非常清楚，最后可以给出一个比人更准的结论，不要在诺曼底登陆，在卡拉斯登陆，你听不听它的？

前一段时间马云提出大数据可以让新计划经济变为主流，刘强东也说AI可以让共产主义在我们这一代实现。当然大家有很多争论，马云说大家错误理解了他，他说的新计划经济不是老的计划经济。但是无论如何，这样的说法是很多人觉得有道理的。我们来看一下是不是有道理，哈耶克批判计划经济说因为默知识在人的脑袋里面，供需知识在脑袋里面，没法集中。

但今天不一样了，比如我是剁手党，我只要在淘宝上买一定时间以后，淘宝对我的数据积累，对我的了解可能就会超过我自己。用户的习惯是可以收集整理的，这个东西也很容易集中起来，是不是就可以导致新的计划经济呢？

如果我们今天要生产一个茶杯，我有办法把全中国需要的所有茶杯都收集起来，它是不是就能够导致计划经济呢？这个茶杯可以做成不同的形状，这个茶杯可以改进质量，这个茶杯可以用不同材料来做，这个茶杯可以降低价格。也就是说即使对一个现有的需求，仍然需要企业家去做创新，不断地改进质量，改进品种，降低成本。这点是靠谁来做的？这是计划做不出来的，只能靠每个企业家做出决定，去冒风险。对于未知的需要，对于iPhone、自动驾驶汽车这样的东西更不可能是计划出来的。

如果我们把已知和未知、需求和供给画成两个轴的话，在已知的需求方面，大数据、AI的确能发挥作用，因为毕竟在生活中有些东西是不变的。但是在供给方面，它仍然是无法代替企业家分散创新的。

对于未知的东西，大数据、AI根本毫无能力。你把经济看成是一个静态需求拉动的，还是动态的供给推动的，如果你认为是供给推动的，是由创业家、企业家用冒险精神把一个新产品做出来，冒着失败的风险把它做出来，如果经济是这样的结构，大数据、AI都没有用，它永远没有办法替代企业家的创业精神。

大家经常讨论有一天机器会不会统治人类，变成通用的人工智能？如果机器要统治我们，有一个前提就是机器能产生自我意识。至少在今天基于神经网络的机器很难，为什么？因为这个机器是一个确定性的机器，它里面没有随机。我们知道人类的意识有可能是几十万年过程当中演化出来的，就像生命的突然出现是一种复杂系统的涌现。机器产生意识是非常小概率的事件。

神经网络是模仿人类大脑而产生的，为什么它在很多方面能超过我们？人类的大脑神经元是非常低效、粗糙、经常犯错的，它的传播速度每秒钟只能激发200次，每秒钟只能传播几十米。而在芯片里面的电子神经元每秒钟可以激发上亿次，它以光速传播。也就是今天芯片的电子神经元的速度是人脑的几百万倍，而且它不出错。最重要的一点，人工神经网络每一个系数是可以提取出来的，也就是说它的知识是可以被共享的，而人脑的知识是不能共享的。

暗知识，就是机器认知的时代，这个时代的特点，无处不在的传感器记录着世界状态。大家今天谈物联网，但是没有提到物联网的本质是什么，物联网的本质就是把大量的周围环境信息，生产、生活，包括人体自己的信息收集起来，让机器发现其中隐蔽的相关性，这种相关性细微到人类根本无法察觉，发现出来以后就可以用于改进我们的生产生活。所以物联网最本质的是这一点。

人类的知识，未来和机器知识相比是沧海一粟。但无论这个机器下棋多厉害，它仍然不懂符号，没有情绪，也不会产生自我意识，所以它永远是人类的工具。但这个工具是一次历史级的工具，它很可能会超过蒸汽机，超过电，甚至超过互联网。

刚才是我过去两年所有的思考，加上我在硅谷的投资实践，包括我的投资经验都写成了《暗知识》这本书，在下周会上市，谢谢大家。