手机浏览器扫描二维码访问
一秒记住【xiaoyanwenxue.com】精彩无弹窗免费!“罗辑思维荐书集锦(套装共24册)(.shg.tw)”!
第六章暗知识神迹——机器能否超越人类
导读
AI的作用将不止于颠覆商业,还会有更深刻和长期的影响。本章负责开脑洞,理解了本章就能知道下一代该如何做好准备。这一章也可以直接跳进来读,但最好能先读前两章。
我们在上一章描述了AI在短期内会对商业和生活造成的影响,但我们很难想象更长期(30~50年)的影响。虽然预测长远的未来很难,但是如果能深刻理解AI的本质,就能对未来的方向有感觉。2007年苹果手机的发布开启了移动互联网的一波巨浪,当时对移动互联网有两种不同的观点。一种观点认为移动互联网和个人电脑互联网有完全不同的性质,会出现全新的杀手级应用。另一种观点(主要是个人电脑互联网的部分大佬)认为手机无非是个人电脑的延伸,比原来的网站、搜索和游戏等多了一块显示屏幕而已。笔者是中国最早从事移动互联网的专业人士,基于手机和个人电脑的本质区别在于手机的定位功能,笔者曾经预测未来杀手级应用一定和定位功能有关,而且不会是当时大家都能想到的找加油站、订餐馆这样的“浅层定位应用”,也一定会产生新的巨头。果不其然,出行类的应用成为移动互联网的杀手级应用,创造出了Uber、滴滴出行这样的个人电脑互联网巨头之外的新的移动互联网巨头。
基于深度学习的AI本质
数据之间相关性的发现和记忆
读过第三章的读者能体会到神经网络最本质的特点是发现并记忆数据中的相关性。例如,看了很多汽车的图片后就会发现汽车都有四个轮子。人的大脑对图片这类直观的数据间的相关性也能发现一部分并记住,这就是默知识。但当数据量很大,又不直观时,例如股票市场的数据、复杂系统(例如人体、核电站)内部的数据,人就不行了。而神经网络却应付自如,一眼就能发现数据之间的关系并记住,这就是暗知识。下回再遇到类似的数据,马上就能做出判断。随着神经网络的规模增大(神经元数目和神经元之间的连接数目),机器能够处理人根本无法企及的大规模的复杂数据。
海量记忆基础上的细微差别的识别
机器学习需要大量的数据,主要是让机器“看到、记住”数据中呈现出的各种模式。有点像小孩玩万花筒,数据就是装入万花筒中的彩色玻璃碎片,不停地转动玻璃棱镜就是不同的算法(对应神经网络中不同的连接)。一组有限的数据中埋藏着无数排列组合出来的图样。因为机器的记忆比人的记忆准确,而且量大,机器可以每秒转几亿次万花筒,很快就能看完并且记住所有的图样。所以机器学习可以发现数据中隐藏的所有细微区别。
基于以上原理,机器学习适合做极其复杂的决策,例如制定像健康保险这样极其复杂的公共政策,策划诸如诺曼底登陆这样包含大量变量的军事行动。
这两个AI的本质其实也正是暗知识的两个特点。基于以上两个特点,我们看看未来会出现哪些远超人类的颠覆性的超级应用。
科研加速
一个科学研究的过程可以分为以下几个步骤。
(1)提出问题或选择要解决的问题。
(2)学习研究关于这个问题已经发表的研究文献。
(3)根据研究文献和研究者的经验提出假设。
(4)设计验证假设的实验。
(5)进行实验和整理实验数据。
(6)根据实验结果判断假设是否成立。
(7)如果假设不成立,返回第(2)步或第(3)步,提出新的假设。
在这个流程中最花时间的有三个环节:研究文献、做实验和整理数据。在这三个环节中,机器学习都可以部分甚至全部取代人。获取相关的文献,阅读、理解并总结已经成为科研的瓶颈之一。根据渥太华大学的研究,自从1965年以来共有5000万篇科学文章发表,现在每年新发表的文章是250万篇。关于某个能够抑制癌细胞的蛋白质的论文就达到70000篇。一个科学家即使一天读10篇文献,每个工作日都读,一年也只能读2500篇,所以大部分的研究结果都会被束之高阁。使用AI可以通过自然语言理解找到相关的所有文献。例如一个叫作Iris(艾瑞斯)的AI软件可以这样做科研:首先从一个关于这个研究题目的演讲开始。这个演讲通常是本领域的一位著名科学家做的几十分钟的概述性报告,例如TED(美国著名讲坛)大会的演讲。Iris先使用自然语言处理算法分析演讲的脚本,挖掘从开放渠道获取的学术文献,查找到与讲座内容相关的关键论文,然后将相关的研究论文分组并进行可视化,Iris目前可以达到70%的准确率,下一步是用人工帮助标注文献使机器匹配精度增加。当机器能够理解文献的内容和结构时,至少可以帮助科学家总结出在一个科研领域中已经提出的问题,已经提出过的假设及其验证,已经做过的实验和结果。机器甚至能根据文章的逻辑自洽性对文章结果提出疑问。用机器阅读文献的一个重要作用是能够对前人的工作一览无余,不至于做许多重复性的工作。
今天的科研越来越依赖于实验,而实验的准备、操作和数据整理经常耗时耗力。机器学习可以大大加快实验进程。2001年的诺贝尔物理奖颁发给了美国的埃里克·康奈尔(EricCornell)等三位实验物理学家。他们的成果是用激光器和磁场创造出了自然界不存在的物质的第四种状态:玻色-爱因斯坦凝聚态。物质在自然界的三种状态根据温度不同分别是固态、液态和气态。当温度降低至非常接近绝对零度时(实验上永远无法达到绝对零度),物质就会进入凝聚态(一种气态的、超流性的物质状态)。凝聚态物质有很多特性,例如对地球磁极和引力场极为敏感,光线在该物质中会延迟,等等。基于印度科学家玻色的计算,爱因斯坦于1924年预测了这种物质的存在以后,科学家一直想在实验室验证出来。1995年,这三位科学家经过多年的实验,用一套非常复杂的实验装置终于制造出了物质的凝聚态。图6.1是这个实验的示意图,透镜内有一小块物质,透镜外有许多激光束。激光打在物质上可以约束物质内分子的运动,从而降低物质的温度。图6.2是实验设备的核心部分,图6.3是实验设备的全貌。可以看出,这套实验装置非常复杂,可以设置的参数非常多,如果每一种参数的排列组合都去试,到宇宙终结可能都试不出来。而人有许多直觉可以大大加快实验。获奖的三位物理学家摸索了很多年才终于造出了凝聚态。2016年5月17日,来自澳大利亚新南威尔士大学和澳大利亚国立大学的研究团队使用机器学习从头开始操作这样的实验(反复设置调整实验设备的各种参数直到产生凝聚态物质),机器学习竟然不到一个小时就成功制造出了这种凝聚态物质。该团队希望通过进一步借助AI以更快的速度构建更大的这类物质。
图6.1凝聚态设备示意图:不同方向的激光束约束分子运动造成凝聚态物质(腔体内)
图片来源:https:plato.stanford.eduentriesphysics-experiment。
图6.2凝聚态实验设备的核心部分
图片来源:https:plato.stanford.eduentriesphysics-experiment。
图6.3凝聚态实验设备全貌
图片来源:https:plato.stanford.eduentriesphysics-experiment。
科学实验的第三个环节是收集整理数据,这更是AI的优势。其实在科学界目前还有一个瓶颈就是研究论文的审核,要发表的论文太多,能有水平和时间对其进行审核的人太少。机器学习可以大大加快这个过程,例如可以检查该论文是否抄袭或者和已经发表的结果有冲突等。
科学研究中最难被机器取代的是提出假设,但是IBM的一个团队宣称他们的系统可以做到。也就是说,他们的AI可以通过挖掘学术文献自动产生科学假设。而且,宣称他们的算法可以用来做出新的科学发现。他们的目标是将文本挖掘与可视化和分析结合起来,以便识别事实,并提出“新的、有趣的、可以测试的、可能是真实的”假设。
人类过去500年来的进步主要依靠科学技术的进步,而且这种进步还在加速。随着AI的发展,科学发现可能会加速,这意味着技术进步会进一步加快,反过来又会加快科学的进步。例如量子计算依赖于材料科学的进展,一旦量子计算取得突破,计算能力就可能比现在提高几个数量级,AI能力的提高又会进一步加快科学进展和加速实验速度,如此循环下去。
另外一个加速是用AI改进AI。谷歌和Facebook都开始研究自动机器学习,通过强化学习的模型,让机器不仅不断地调整参数,而且能够选择不同的神经网络模型。在很多情况下自我学习的性能都可以和人设计出来的性能相比,机器有时还会选择人类想不到的模型,甚至有人开始探索如何在机器学习里模仿人类的想象和创新。2017年底,谷歌推出由AI自主“孕育”出的“子AI”,该“子AI”被取名为“NASNet”,研究人员在ImageNet图像分类和COCO目标识别两个数据集上,对NASNet进行了测试,在验证集上的预测准确率达到了82.7%,比之前公布的人工智能产品的结果好1.2%,效率也提高了4%。目前这些研究还处在早期阶段。一旦这类循环加速技术成熟,就会使技术迅速达到一个新的高度。
科学的本质是受控实验。人类通过控制一组变量(例如物理实验中的物体位置和受力等,化学实验的温度和压力等)来测量另外一些变量(例如物理实验中物体的速度,化学实验中的气体体积)的变化。科学定律就是可控变量和测量变量之间的关系。当人类完全掌握了某一类关系后,就可以通过制造仪器把原来的测量变量变为可控变量,用增大的可控变量集再来继续发现它们和新的测量变量的关系,这就是科学进步的本质,所以仪器就是某一类科学定律的物化。科学的进展完全依赖于能否完全掌握某个科学定律并且把该定律变成仪器。所以科学的进展可以分为三个步骤。
(1)提出假设:某一组可控变量和另一组可测量变量可能的关系。
有人说,教练的任务是带领球队获得胜利,有人说,教练的任务是指导球员更加出色,有人说,作为教练的任务是让球队更加辉煌这些我都做到了,但是却还不够。而我要说的则是,作为教练,除了这些追求之外,最高的追求,是让足球运动,更加伟大。...
村里家徒四壁的穷兄弟花光积蓄买了一个丑媳妇,却是一个拥有穿越而来的杀手,从此只有不但把自己变成了最漂亮的媳妇,还带着相公发家致富,赚钱买地,成为豪绅。...
顾乐儿掉入海中被救起来意外发现自己竟然穿书了,还穿成一个作死女配。望着面前让人闻风丧胆的男主,顾乐儿痛定思痛美色虽可贵,生命价更高!她当众高调宣布我不喜欢苏白了,亦不会再纠缠他。本以为一别两宽各自安好,可是剧情画风却突变。某日午夜,男人一脸落寞抽着烟,你可知道暗恋是一个人的兵荒马乱?顾乐儿喝着酒,你装什么装?我还不知道你的尿性?嗨起来!男人起身压向她,好啊。后来外界传言苏爷的媳妇又野又狗,苏爷也被她带偏了,没有节操还不要脸!...
四年之前,家族被灭,林凡沦为家族余孽,机缘巧合成为上门女婿。为了复仇,他消失三年,浴血奋战,成为天下战神,傲世无双!战神归来,只为那个单纯善良的女孩苦等三年当我执起你的手,这天下便再无一人可欺你,辱你!!...
为了钱被逼嫁给一个只有五岁智商患有怪病,还死过五个老婆的男人,这个世界上没有谁比她更可悲了。偏偏她这位帅到极至的傻子老公在家里一点地位都没有,父母冷落他,兄弟姐妹欺负他,就连佣人都敢使唤他。当她刚想认命接受现实的时候,却意外怀孕了,孩子不是她那傻子老公的!家法难逃,世俗难奈,在她陷入万般绝境的时候,拯救她的居然是孩子的亲生父亲,那位冷酷帅气的一夜男人,而他的真实身份既然是最不起眼的他各种巧合,各种真相,各种震憾,究竟,谁才是她的真老公!!...
她和初恋同时落水,他选择救初恋,因为他欠初恋一条命,从那以后,她学会游泳。初恋公司失火,生死不明,他弃她生日去找初恋,因为性命攸关,从那以后,她知道原来他还兼职消防员。初恋不能生育,他要她捐赠子宫,因为他不要小孩,她留着子宫没用擦!简直欺人太甚!她甩他一脸离婚协议书,我什么都不要,包括你!再次相见,他对她死...