机器学习的重新思考:人工智能如何学习“失忆”?

2023-05-26 0 712

机器学习的重新思考:人工智能如何学习“失忆”?

译者丨Samuel Greengard

校对丨安德烈

机器自学早已成为各个领域的宝物辅助工具,常被用以构筑系统,协助人们发现那些容易忽视的技术细节,并远距重大决策。尽管早已取得了华丽的结果,但是也有很多伤痛,例如怎样在早已成形的数学模型中修正、删去这类组件或者统计数据历史记录?

有研究者表示,在绝大多数情况下,修正往往意味著再次体能训练,但仍然难以防止列入形迹可疑统计数据。那些统计数据可能将来自系统日志、影像、顾客信息系统之类。尤其是欧洲GDPR出台,对数学模型忘却功能提出了更高的要求,企业如果不该办法Sonbhadra面临合规性行政处罚。

的确,全然再次体能训练的付出比较高,也不可能将化解敏感统计数据难题。因此,我们难以断定再次体能训练的数学模型可以全然精确、有效。

为了化解那些难题,学者们表述了一类“机器自学中止术”(machine unlearning),通过降解统计资料库、调整演算法等专门针对控制技术,介导数学模型特异性失恋。机器自学中止术,简而言之,就是让体能训练好的数学模型忘却掉某一统计数据体能训练效用/特定模块, 以达到保护数学模型中暗含统计数据的目的。

1

冲破数学模型

机器自学或许有气质,原因在于它能借由巨大的统计数据,远远超过人类文明知觉范围的繁杂关系。同时,此项控制技术的Vellore性质,让研究者在修正数学模型时候,非常慎重,即便难以知道一个某一的统计数据点处于数学模型的别的边线,以及难以明晰该统计数据点怎样直接影响数学模型。

另外一类情况是:当统计数据停机值时,数学模型会提过特别牢,并对整体效用产生影响。

当前的统计数据隐私辅助工具可以在统计数据脱敏的情况下体能训练数学模型,也可以在统计数据不出本地的情况下联合体能训练。或许可以将敏感统计数据替换成空值,引入噪声掩蔽敏感统计数据。但那些都难以从根本上化解难题。甚至,替代元素并保留关键统计数据的差异隐私控制技术也不足以化解特异性忘却难题。例如它只能在单个案件或少数几个案件中发挥作用,在那些案件中,虽然不需要再次体能训练,但会有“敏感”的人要求从统计资料库中删除统计数据。随着越来越多的删除请求陆续到来,该框架的“忘却数学模型”很快就会瓦解。

因此,隐私控制技术和机器自学中止术在化解难题的层面,并不能等同。

匿名难以验证和差分隐私控制技术的统计数据删除难题不仅是理论难题,而且会产生严重的后果。研究人员早已断定,人们总是有能力从所谓的通用演算法和数学模型中提取敏感统计数据。例如2020年时候,研究者发现,从GPT-2中可以获得包括个人身份和受版权保护的信息等体能训练统计数据。

机器学习的重新思考:人工智能如何学习“失忆”?

2

特异性忘却

让机器自学数学模型获得特异性忘却的能力,需要化解两个关键难题:

1.理解每个统计数据点怎样机器自学数学模型;

2.随机性怎样影响空间。例如需要弄清,在这类情况下,统计数据输入中相对较小的变化为何会产生不同的结果。

该方向的最初研究出现在在2019年。当时,Nicolas Papernot提出将机器自学的统计数据分割成多个独立的部分,通过建立众多的迷你统计数据,从而实现只对某一组件进行删除和再体能训练,然后插回完整的统计数据集中,生成功能齐全的机器自学数学模型。

机器学习的重新思考:人工智能如何学习“失忆”?

具体操作过程是:先将体能训练统计数据分成多个不相交的切片,且一个训练点只包含在一个切片中;然后,在每个切片上单独体能训练数学模型;随后,合并切片,成功删除统计数据元素。因此,当一个体能训练点被要求忘却时,只需要再次体能训练受影响的数学模型。由于切片比整个体能训练集更小,就减少了忘却的付出。

该方法被Nicolas Papernot命名为SISA(Sharded, Isolated, Sliced, and Aggregated ),对比全然重体能训练和部分重体能训练的基线, SISA实现了精确性和时间开销的权衡。在简单自学任务中, 在统计数据集Purchase上是4.63x, 在统计数据集 SVHN上是2.45x。

同时,译者也承认,虽然这个概念很有前途,但也有局限性。例如,通过减少每个切片的统计数据量,会对机器自学产生影响,并且可能Sonbhadra产生质量较低的结果。此外,此项控制技术并不总是像宣传的那样奏效。

目前,机器自学忘却术的研究仍处于初级阶段。随着研究人员和统计数据科学家深入了解删除统计数据对整体数学模型的影响,成熟的辅助工具也会出现,其目标是:机器自学框架和演算法允许研究者删除一条历史记录或单个统计数据点,并最终得到一个“全然忘却“相关统计数据的有效数学模型。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务