人工智能伦理(AI Ethics)概述

人工智能(Artificial Intelligence, AI)作为新一轮科技革命和产业变革的重要驱动力量,正逐步向人类社会各个领域渗透,对经济发展、社会进步、国际政治格局等诸多方面产生重大而深远的影响。人工智能技术的快速发展和广泛应用,推动了经济社会向智能化的加速跃升,为人类生产生活带来了诸多便利。然而,在人工智能应用广度和深度不断拓展的过程中,也不断暴露出一些风险隐患(如隐私泄露、偏见歧


本文简要介绍南方科技大学计算机科学与工程系姚新教授团队最近在国际期刊IEEE Transactions on Artificial Intelligence上发表的题为“An Overview of Artificial Intelligence Ethics”论文内容,给读者提供一个人工智能伦理领域的概览,以便有兴趣的读者后续在AI伦理方面展开探索研究。

【论文信息】:Changwu Huang, Zeqi Zhang, Bifei Mao and Xin Yao, “An Overview of Artificial Intelligence Ethics,” in IEEE Transactions on Artificial Intelligence (Early Access), 2022, doi: 10.1109/TAI.2022.3194503.


【说明】:以下内容源自论文”An Overview of Artificial Intelligence Ethics”。为了缩短篇幅,在翻译过程中做了大量删减,只保留了原论文的主要核心内容,省略了许多具体描述,有努力持续更新AI伦理相关的信息和动态。



1. 引言




人工智能伦理(有些文献中也称作机器伦理[9])是一个研究人工智能伦理问题[10]的新兴的跨学科领域。人工智能伦理所涉及的内容比较广泛。根据文献[11],人工智能伦理所研究的内容可以大体分为两个方面:人工智能伦理学(Ethics of AI)和伦理人工智能(Ethical AI)。其中,人工智能伦理学主要研究与人工智能相关的伦理理论、指导方针、政策、原则、规则和法规。伦理人工智能主要研究如何遵循伦理规范来设计和实现行为合乎伦理的人工智能[11]。人工智能伦理学是构建伦理人工智能(或使人工智能按伦理规范行事)的先决条件,它涉及伦理或道德价值观和原则,这些价值观和原则决定了伦理道德上的对与错。有了适当的人工智能伦理价值观和原则,才可以通过一些方法和技术来设计或实践伦理人工智能。


2. 论文的主要内容







图1 人工智能伦理主要涉及的内容.

3. 人工智能伦理问题和风险




图2 基于AI特征、人为因素和社会影响的分类(文献[11]中对AI伦理问题的分类).

图3 基于AI和人类脆弱性的分类(文献[29]中对AI伦理问题的分类).

图4 基于算法、数据、应用以及长期和间接风险的分类(文献[38]中对AI伦理问题的分类).

图5 基于AI部署应用的分类(文献[51]中对AI伦理问题的分类).




图6 我们所提出的人工智能伦理问题的分类.












图7 人工智能系统的一般生命周期[75,76].


表1 人工智能生命周期每个阶段的伦理考虑.

4. 人工智能伦理指南和原则



Jobin 等人[12]在2019年对当前的AI伦理原则和指南进行了调查和分析。他对来自不同国家或国际组织发布的84个AI伦理文件进行了分析。Jobin等人[12]分析发现目前所发表的AI伦理指南在五个关键原则上达成了广泛共识,即透明度、公正和公平、非恶意、责任和隐私等。然而,在过去的两年多里,许多关于人工智能伦理的新指南和建议已经发布,使得Jobin的论文已经过时,因为许多重要文件没有被包括在内。例如,2021年11月24日,联合国教科文组织通过了《人工智能伦理建议书》,这是有史以来第一个关于人工智能伦理的全球协议[79]。为了更新和丰富对人工智能伦理准则和原则的调研,在论文[12]的基础上,我们收集了许多新发布的人工智能伦理指南或准则文件。最后,共收集了146个人工智能伦理指南文件。


图8 2015年至2021年每年发布的人工智能伦理相关文件数量.

图9 不同类型的发行人发布的指南所占的百分比.



表2 从146个AI伦理指南文件中凝练出的关键伦理准则.

5. 人工智能伦理问题的解决路径


图10 人工智能伦理问题的解决路径.



表3 三种人工智能伦理设计范式及其特点比较(摘自文献[101]).

技术手段旨在开发新技术(尤其是机器学习技术),以消除或减轻当前AI的缺点,规避相应的伦理风险。例如,对可解释机器学习的研究旨在开发新的方法来解释机器学习算法的原理和工作机制,以满足透明或可解释性原则。公平机器学习研究使机器学习能够做出公平决策或预测的技术,即减少机器学习的偏见或歧视。近年来,人工智能学界为解决人工智能伦理问题做出了积极的努力。例如,ACM自 2018 年以来举办了年度ACM FAccT会议,AAAI和ACM自2018年起开始举办AAAI/ACM Conference on Artificial Intelligence, Ethics, and Society (AIES),第31届国际人工智能联合会议和第23届欧洲人工智能会议(IJCAI-ECAI 2022)提供关于“AI for good”的special track。


表4 解决五项关键原则的技术方法总结.

表5 人工智能伦理相关的法律法规.

6. 人工智能伦理的评估方法



测试是用于评估人工智能系统伦理道德能力的典型方法。通常,在测试系统时,需要将系统的输出与基本事实或预期输出进行比较[100]。针对人工智能伦理的测试,研究人员提出了道德图灵测试(Moral Turing Test, MTT)[144]以及专家/非专家测试(Experts / Nonexperts Test)。



图10 形式化验证过程(此图是根据文献[147]重新创建的).



2014年,澳大利亚计算机协会(Australian Computer Society, ACS)制定了ASC专业行为准则(ASC Professional Code of Conduct),供所有信息通信技术(ICT)专业人士遵循。

2018年,ACM更新了ACM道德和职业行为准则(ACM Code of Ethics and Professional Conduct),以应对自1992年以来计算行业的变化[149]。

IEEE Global Initiative on Ethics of Autonomous and Intelligent Systems [150]项目批准了IEEE P7000™标准系列[151]正在开发中。

由ISO和IEC组成的联合委员会ISO/IEC JTC 1/SC 42 [152],正在负责AI领域的标准化工作,致力于制定一系列标准,这其中也涉及了AI伦理问题。





