中国科学院钱伟长 (ID:cas-iop),作者:Tom Siegfried,译者:zhenni,编辑:藏痴,头图来自:《BT5516SBB》
星舰日期24世纪末的47025.4,星舰舰队的星舰机器中尉上校戴塔被他的叛变机器“兄弟”克兰征召入伍加入叛变人类文明的战团——这令企业号艇长让-阿诺·捷达德感到非常不安。“碳基生物的统治即将结束,”克兰告诉捷达德,“你,捷达德,和像你这种的人都早已落伍了。”
这就是电影中《星舰奇航》所表达的乐观态度,即机器们至少要三个世纪末后才可能将罢黜人类文明。这只是科幻片中的情形,而在现实中,智能机器早已迈进了接手世界的第二步,他们的时代早已到来。
作为人工智慧笼统概念中的一个较为具体的子应用领域领域,机器自学早已渗入了从医疗诊断到寻找新物理现象光子等多个人类文明耕耘的应用领域领域。广度自学是机器自学最强大的体现,它在音频辨识、语言译者、人脸辨识、汽车驾驶、新材料设计和股市趋势预估等多方面具备应用领域。
排序神经自然科地理学家科尔在一则该文中写到:“由于排序机系统可以轻而易举地处理巨量数据,因而广度自学不仅能重构现代社会,还可能将掀起自然科学革命——主要囊括从光子物理和分析化学到生物化学科学研究和生物科学应用领域这样的学科。”
近些年,数量剧增的关于机器自学、广度自学和人工智慧的新论文涌入了自然科学文献库当中。这类新科学研究的概要囊括了医疗、毒理学、材料自然科学、基础物理、量子排序、分子作用演示、力学、临床社会学、经济学、听觉自然科学和药物发现等应用领域领域。
这些概要突出了机器自学目前早已获得的重要创举和对后续可能将获得创举的预估,多数该文也提到了智能机器的局限性。正的理解。
智能机器也因而显然容易被欺骗手忙脚乱。而且,如今大部分所谓的智能机器都局限性在某一专业技能应用领域领域,高效应对特定的各项任务,而非具备人类文明普遍知觉能力的稳定性。比如两台电脑可以在中国象棋比赛中战胜巨匠,却不会玩扑克牌。
排序机系统地理学家玛莉妮·克莱尔在她的书《人工智慧:人类文明思维手册》中写到:“与人类文明对比明显的是,现今大多数人工智慧的‘自学’都不能在相关各项任务之间转化。”
克莱尔解释道,对人工智慧进行真正的探索还有许多障碍——机器仍然不能像(起码一部分)人类文明那样对世界进行全局的思考和推理。
克莱尔说:“人们容易高估人工智慧的先进性而又低估自身智力的复杂性。”对超级智能机器接手世界的恐惧是错位的,她引用一位行为经济地理学家的评论:“我们的确应该害怕,但不是害怕智能机器,而是对机器在自己智能无法了解的方向进行决定。相比于机器的智能我更害怕机器的弱智。”
一、机器自学进步迅速
实际上,排序机系统地理学家早已开发出了一些相当强大的算法来训练机器自学。通常这些自学依托各种被称为神经网络的排序系统。这些神经网络是粗略仿照人类文明大脑神经细胞的处理单元。在一个传统的神经网络中,一层人工神经通过接收的输入信号来修改与另一层神经的关联强度,从而将输入信号辨识传输给输出层。于是人工神经网络才能够“自学”将输入的信号认作一张猫的图片。
在过去十年左右的时间里,主流的机器自学策略依赖于多层人工神经网络,这种方法也被称为广度自学。两台广度自学的机器可以在模式中辨识不同模式,使输入的分类更加精细,甚至超过专业人员的能力。一个训练有素的广度自学系统甚至可以在CT扫描中辨识出逃过放射科医生眼睛的癌症信号。
在某些系统中,机器自学是“受监督的”,这种情况下训练机器所用的是标记的数据;而不受监督的自学则意味着训练机器未被告知所输入的大数据集的含义,电脑自己需要辨识出分类或行为的模式。另外有一种叫做强化自学的方法,如果机器能完成某个目标(就像赢得某个游戏),那么在处理输入时就会受到“奖赏”(比如在某个存储文件中加分)。强化自学通过在围棋比赛中帮助机器战胜了人类文明从而展示了自己的威力。
机器自学虽然在围棋上值得一个头条,但是在医药、工业和自然科学等应用领域领域获得的实际创举则更令人瞩目。
医药方面,机器自学帮助科学研究人员改进治疗效果标准测试的弱点。测试疾病治疗效果的医学试验通常依赖于测试结果平均值来确定有效性,因而可能将会错过对少数患者有益的成分。比如,某个治疗发现一个减肥项目不会减少糖尿病患者的心脏问题,但是根据传染病地理学家维姆肯和排序机系统自然科地理学家凯利的报道,机器自学算法的确辨识出了某一小部分患者在减重过程中心脏问题有所减少。
同时机器自学对于发现新药的测试也帮助不少。“广度自学在药物发现方法上具备广泛的应用领域,”化地理学家朱浩在最近的药理学和毒理学年度回顾该文中写到,“在这个大数据时代中,最近广度自学所支持的人工智慧的进展展现出了药物发现应用领域领域巨大的前景。”
与发现新药类似,机器自学在发现工业应用领域的新材料方面也展现出了生产力:通过机器自学算法可以简化寻找耐磨耐拉“超硬”材料的过程。材料地理学家斯巴克斯撰写的该文中评价道:“这个科学研究……是机器自学在发现新结构材料扮演重要角色的一个精彩的体现。”
二、较之机器智能,我更怕机器弱智
机器自学也给基础自然科学科学研究提供了便利。在诸如大型强子对撞机(LHC)的高能光子加速器中,质子相撞会产生包含其他物理现象光子的复杂光子流(比如LHC于2012年发现的著名的希格斯玻色子),在每秒几十亿质子相撞几百万次的束流中,自然科地理学家需要从中明智地挑选出有价值的内容,这相当于在用消防高压水枪喝水时决定吸入哪些分子,机器自学便可以帮忙在背景噪声中分辨出有价值的事件。而其他机器算法可以帮助辨识撞击碎片中的光子。
物理地理学家盖斯特及同事说道:“广度自学早已影响了LHC的数据分析,并掀起了一股机器自学和光子物理学界之间合作的新浪潮。”
量子物理地理学家卡利欧在另一则该文中提到,机器自学的方法在数据处理方面的应用领域不只出现在光子物理应用领域领域,还在宇宙学、量子排序等等其他基础物理科学研究应用领域领域应用领域。
“随着机器自学技术在工业应用领域中的兴起,自然科地理学家们开始寻找机器自学在基础科学研究中的潜力。”卡利欧和合作者在去年的一则概要中写到。
三、自学的局限性
就如卡利欧和其他概要作者所强调的那样,机器自学也有缺陷,自然科地理学家不应当被其创举蒙蔽:
“对机器自学的潜能和局限性性持有健康和批判性的态度,包括分析这些方法的突破点和它们明显不擅长的地方。”
一方面,一个机器的“智能”局限性于它自学数据的性质。例如,经过训练的机器可以通过分析人类文明雇佣决定来筛选求职者,同时也会通过一些历史歧视数据对特定人群产生各种偏见。
即使机器表现不错,那也只是看上去比较聪明。例如,关于人脸辨识的报告应该考虑到,机器的准确性通常是指其前五个“猜想”——五个当中如果任何一个辨识正确,机器便会获得嘉奖。
有时候看似智能的机器准确执行各项任务并非由于它像人类文明那样理解,而是机器找出了一个获得正确答案的捷径。“一个好像很容易地分辨出牛的广度神经网络,可能将无法认出一头出现在草场场景以外的牛。”盖里奥斯和合作者在最近的一则预印本该文中写道,在这个例子中“草场”变成了系统辨识“牛”的捷径。
有时机器又会以纹理而非形状作为辨识对象的捷径,如果一只猫的图片通过图像处理软件变成具备灰色阴影的浮雕图像,就可能将被机器辨识成一头大象。
这种的捷径可能将就是机器容易被敌对的欺骗所愚弄的原因。
克莱尔在她的书中评论:“人类文明偷偷欺骗广度神经网络令其犯错出奇容易。”人眼会忽视的在医学X光片上的一点点改变就可能将将机器诊断的结果,从99%未患癌症的置信变为99%存在癌症的置信。
克莱尔认为,由于人类文明并不理解机器如何做决定,所以很难解释这些失误的出现。在多层广度自学的神经网络中运算就像在一个黑匣子中运作,人类文明不能感知,也就难以确定广度自学的运行原理。
她还提到:“由于广度神经网络做的决定往往难以理解,所以其失误便很难预估和修复。”
无论机器到底如何自学,都和人类文明的方式不同。不只机器智能难以理解,人类文明智能也是如此。自然科地理学家只有更完整地理解人类文明智能,才能科学研究出更强大的人工智慧替代品。所以我们也不必太过担心戴塔的兄弟克兰会很快统治人类文明。
克莱尔分享了软件企业家卡普尔说的观点:“人类文明智能是一种绝妙、微妙而且探索甚少的现象,目前还没有任何复制它的危险。”而甚至到24世纪末可能也是如此。
原文链接:Why some AI is smart until its dumb
中国科学院钱伟长 (ID:cas-iop),作者:Tom Siegfried,译者:zhenni,编辑:藏痴