数据挖掘技术与调节

2023-06-01 0 602

原文刊登于《科学技术哲学研究》第 35 卷,第 1 期,2018 年 2 月

数据挖掘技术与调节

摘 要: 数据挖掘技术所构成的数据自然界为人类存在提供了新的境遇,人类对时间和空间体验、及对自我存在方式、认同方式等在数据自然界中被赋予了新的特质;同时,数据挖掘技术在构成数据自然界的过程中推进了对世界所有之物或现象呈现的深度、广度与精细化等,并以一种更新的形式调节着人类视觉、听觉等, 进而带来了人类对世界诠释的新维度; 当数据挖掘技术以参与的形式进入到世界的构建与诠释的时候,其已经开启了技术伦理学的内化之路。

关键词: 数据挖掘技术; 调节; 人; 世界

数据挖掘技术与调节数据挖掘技术与调节

数据挖掘( Data Mining,DM) 技术是大数据的核心,我们所看到的数据或曰数据世界是基于数据挖掘技术而形成的,且这种数据以不同于物理世界对人类所涉身世界的影响方式而影响着人类所涉身的世界。从存在论的维度来看,人类所存在于其中的世界已经异于传统的自然界或物理世界,一种新的存在境遇已经构成;从认识论的维度来看,人类所面临的世界的本质已经不再是传统意义的物质概念可以囊括的,同时,人类认知、感知世界的方式被改变了,伦理学的视域也发生了转换。因此,需要对数据挖掘技术予以哲学反思。而作为对技术进行哲学解读的一个重要范畴——“调节”拓宽了关于技术本质的分析,因此,本文将基于调节的视域展开对数据挖掘技术的解读。

数据挖掘技术与调节数据挖掘技术与调节

一、调节

在对技术本质的追问中,人、技术与世界的关系这一论域是一个永恒的主题。而在此中,技术调节有着重要位置,因为我们的日常生活正处于技术的调节之中。现如今,哲学、社会学、设计界等均有对其的研究。

数据挖掘技术与调节

伴随技术哲学中经验转向的出现,对技术、人及视角有所改变,“开始聚焦于具体的技术和问题,试图发展情境化的、少决定论的技术理论或者开始借用 STS 的研究”,即开始走向技术自身,基于技术自身来揭示技术的本质。在走向技术自身的哲学分析中,从调节来分析人、技术与世界的关系为技术本质的揭示提供了一条有效的进路。而“马丁·海德格尔对工具在人与世界之间的日常关系的经典分析”则“是解读技术调节的一个良好开端”。

数据挖掘技术与调节

调节强调人与技术、世界以及技术与技术、人与技术意向等的构成性。反观哲学界, 关于技术调节的研究路径,主要有辩证法传统、先验、经验、现象学67和后现象学等。其中, 以马克思为代表的辩证法传统,对技术、权力与资本之间的相互关系置于辩证法的传统之中予以了经验的和思辨的系统分析, 也因此马克思被誉为“将权力、资本主义和技术彻底理论化第一人”; 以胡塞尔、海德格尔、梅洛-庞蒂等学者为代表的先验路径,以先验的方式剖析技术调节。其主要特征是宏大叙事和批判性。他们提出并分析了调节范畴的先验形式基础,如胡塞尔的意识意向性、海德格尔的形式指引、梅洛-庞蒂的知觉意向性等调节理论的先验表达形式; 以拉图尔、伯格曼等学者为代表的经验路径,如伯格曼聚焦于技术装置,分析了技术对人类实践的塑性功能; 拉图尔、卡普兰等学者基于社会学理论的经验路径,分析了技术调节的维度; 以伊德为代表的后现象学路径试图克服先验路径的宏大与经验路径的琐碎,用身体性代替意识,从知觉范畴构建起人、技术与世界的四种关系。

数据挖掘技术与调节

“近年来,哲学、社会学以及心理学等路径已经巨大的价值,但他们都仅仅说明了技术调节的某个方面”,如“后现象学( 伊德 1990; 维贝克2008) 和行动者网络理论( 拉图尔 2005a) 已经全面详细地解释了人与世界的关系是如何被技术调节, 从而打破了传统的哲学界关于主体与客体、社会与自然,以及人与技 术 的 二 分。此 外,安 德 鲁 · 芬 伯 格 (1991,2002) 用其‘技术批判理论’阐述了技术和社会的互相依赖。所有这些‘居间’大大帮助了我们对我们与技术关系的理解。但这些理论未能明确地讨论我们的‘互为存在’的这种日益增强的技术调节。”新兴技术的涌现,如人工智能、增强现实、数据挖掘等对人类生存境遇的影响已经超越了技术作为背景模式而已然进入到了前景模式与背景模式的并存,这更使得关于技术本质的探究更为迫切。同时,也正是这些新技术的特质的出现,关于技术调节的研究更需要进一步的推进。

数据挖掘技术与调节

因此,对调节的研究需要走出批判性的、怀旧的、决定论式的经典技术哲学传统,“调节哲学的核心观点是技术在人与现实之间的关系中发挥着积极的调节作用。在不重提技术决定社会的经典技术恐惧,也不将技术视为仅有工具作用的前提下,技术调节才可能被研究。它聚焦于技术和社会的相互塑形”; 但这还需要从经验和概念两个方面展开对调节过程的分析。基于此,学者们对先验路径、经验路径以及后现象学等路径展开批判与超越。其中,荷兰 学 者 们 的 研 究 极 具 特 色。如 维 贝 克 ( Peter Paul) 将伊德的知觉调节和拉图尔的行动调节予以整合,并将调节与设计结合在一起; 特亚令·斯威斯特拉 ( Tsjalling Swierstra )、卡汀娜·威尔伯斯(Katinka Waelbers) 借助技术调节展开对人类美好生活建构途径的解读等。

数据挖掘技术与调节

那么,数据挖掘技术调节了什么? 进行了何种调节呢?

数据挖掘技术与调节

二、数据挖掘技术与存在

近年来,数据挖掘技术对人类社会产生了极大的影响。从狭义来看, 数据挖掘“作为知识发现过程,它通常包括数据清理、数据集成、数据选择、数据交换、模式发现、模式评估和知识表现”;从广义来看,“数据挖掘技术是从大量数据挖掘有趣模式和知识的过程”。无论是狭义还是广义的数据挖掘技术,在其对数据进行处理的过程中, 一方面, 将自然界的事物进行数据化。如此, 人类存在的世界被转换为一种新的样式; 另一方面,又产生着自然界中不存在的虚拟数据, 即开始形成“数据自然界”,此时的“数据自然界”已经超越了对自然界的数据化转换,而是构成了一种新的自然界。

数据挖掘技术与调节

因此,就人类存在的境遇而言,在人类的存在场所中,自然界依然存在,但一种新的自然界即由数据挖掘技术所形成的这种自然界已经成为人类栖息的场所之一。即除了传统意义上的自然界之外,还有由数据挖掘技术对“原始”自然界的数据化处理后所呈现的世界与数据挖掘技术所带来的新的数据世界一起共同构成了人类存在场所, 而这种存在场所恰恰是在被数据挖掘技术调节之后呈现出来的,因为即使是所谓的“数据的这种‘原始性’都是数据被‘加工过的’结果。数据从来都不是‘先于事实的’,反而是被仔细收集的、制造的且关键还是被调节过的”。事实上,就数据挖掘技术而言,其对数据的处理既可以是随意的,也可以是有选择的。选择就意味着数据挖掘技术可通过数据处理过程,如数据收集与预处理、挖掘结果的解释与评估等可以有意地隐藏一些东西,这也正是数据挖掘技术对人类存在的一种调节。

数据挖掘技术与调节

就人类存在的方式而言,数据自然界为人类提供了有别于传统意义上的一种存在方式。存在的轨迹以数据的方式呈现,存在的历史以数据库的方式呈现,数据库系统甚至成为存在汇聚的场所。如果说: “从遗传到非遗传的过渡是第一在场的疑难,也是过去第一时间出离的疑难,正如继续一个从未在场的,呈现一个不继续任何过去在场的在场——即不在场的在场———的过去”那么,数据挖掘技术所带来的不在场的在场则不仅仅如此, 甚至在某种意义上,数据挖掘技术通过对数据的隐蔽、清洗等对某事、某物或某现象学予以调节,使其透明性退场,进而一方面将在场的转换为不在场的。如图像数据挖掘技术对图像中信息的有关处理; 另一方面,将不在场的转换为在场。如通过对某人身体数据的采集,商场可以为不在场的某人提供在场的服务。商场可以通过将某人的相关数据导入到某个系统,基于某种软件显示其与某物的契合度、匹配度等,这种交互的模式让某人产生了在场的感觉。

数据挖掘技术与调节

此外,数据挖掘技术还调节着人自身存在的认同。如: “刷存在感”一词就透露出人对自身存在认同的一种新方式; 点击率等被视为自身被认同的一个重要考量。在这里, 对人类自身存在的认同被转换成了对数据的认同。

数据挖掘技术与调节

但数据挖掘技术对人类存在的调节不仅仅在于构建了一种新的存在( 虚拟存在) 场所,增加了一种新的存在方式与对人类存在认同的方式,还在于在数据挖掘技术构建人类新的存在场所的过程与新的存在方式的构成中, 还有更深层次的调节。这种更深层次的调节来自数据挖掘技术自身的动态性、开放性或参与性。如,数据挖掘技术在被使用的过程中又形成了新的数据挖掘过程及其技术产物,这种形成包含数据挖掘技术基于某种算法而带来的新的数据,也包含人自身参与到数据挖掘技术使用过程之中而与数据挖掘技术一起带来的新的数据。这种形成是在以一种动态的方式展示着、塑性着人类存在的场所,且这种形成也彰显了数据挖掘技术自身与人类存在之间呈现出某种互为存在性。如,在人类知觉体验被数据挖掘技术调节的同时,出现了“我可能是在我与被感知物体一致、我不再处在客观世界中、客观世界没有告诉我任何东西的情况下进行感觉的”现象,也出现了想象、虚构等被人类通过数据挖掘技术得以呈现并进入存在的现象。

数据挖掘技术与调节

三、数据挖掘技术与世界的诠释

当人类对海量数据进行通过数据挖掘技术进行处理的时候,数据本身是被人类加工的对象。在这种处理中,某些数据被透明化, 某些数据被模糊化。因为数据挖掘旨在从大量数据中发现有用的令人感兴趣的信息,因此, 如在数据收集与预处理过程中,根据数据挖掘任务的具体需求,从相关数据源中抽取与任务相关的数据集作为目标数据, 如消除噪声、遗漏数据、消除重复数据、数据类型转化等。而这个过程也是对数据进行透明化和模糊化的过程,即人类借助对数据处理工作的完成对世界的某种诠释,也正是在这个过程中, 对世界进行了透明性与模糊性的调节,将一些不可见的显现,将一些本来可见的消除。

数据挖掘技术与调节

但“如果数据以某种方式受制于我们,那么,我们也受制于数据。”因为人类在将世界通过数据挖掘技术进行解读的时候,人类对世界的诠释也将受此牵连。“人类不是直接体验世界,而是通过一种调节技术来体验的,这种技术促进着人与世界之关系的形成。双筒望远镜、温度计以及空调都在或通过来获得新的评估现实的方法或通过为体验创建新语境的方法来帮助人类形成新的体验。”在伊德的理论体系中,人类通过对技术的诠释来达到解读世界的目的。如通过汽车仪表盘所显示的数据,感知汽车的状况、自身的行为、汽车所在的场景等,并通过这些数据调节行动。在此场景中,技术或技术器物所呈现的数据是人类对世界诠释的一种表征,同时,人类也在借助这种表征展开自身对世界的诠释。因此,人类对世界的诠释与其说是人类通过自然界来获取数据, 倒不如说数据为人类了解自然界提供了新的可能。当驾驶员使用车载导航的时候,其所看到的车载导航所呈现的图景来自数据可视化技术对世界的诠释,是世界被数据化的一种虚拟呈现,驾驶员对世界的感知与此紧密联系在一起,并促进着驾驶员对环境的诠释。与此同时,对世界的诠释还与操作者或使用者对技术的熟悉程度有关。以数据可视化技术之一的感测桌( Sense Table)为例,它“利用现实的物体、投影和知觉反馈将一系列很难通过诸如数学描述和方程等方式来领悟的复杂现象予以显现”,但并不是所有的学生看到的都是一样的,“一个人的知觉的透明性程度取决于一系列因素”,对工具的熟悉程度就是其中的一个因素。当学生通过感测桌并与感测桌一起面向世界,让世界呈现的时候,感测桌调节了人与世界的关系,调节着人对世界的诠释, 并且在这种调节中,还涉及人对该技术的熟悉度。

数据挖掘技术与调节

如果说“透镜技术产生了一种新的、有中介的人类视觉的形式。望远镜以一种新的方式成了人类知觉的中介”。数据挖掘技术与透镜技术、望远镜等技术或技术器物一样为人类对世界的认知提供了新工具,拓宽了人类诠释世界的视野,为新科学知识的构建提供了可能,带来了人类认识论的变革,但透镜技术、望远镜等主要是对世界中所存在之现象的揭示,但数据挖掘技术对世界的诠释不仅仅停留在对世界所有之物或现象呈现的深度、广度与精细化等推进,而且数据挖掘技术以一种更新的形式对人类视觉、听觉等进行调节,并构建着人类对世界诠释的新维度。一方面, 经验或体验以数据的形式而存在,对世界感知的方式越来越多地从数据的世界中也在逐渐减少,亲身体验既可以是对自然界的直接体验,也可以是对数据自然界的体验; 另一方面,数据自然界为亲身体验构建场所,并塑造、增强亲身体验。“我”的出场或者“我的身体”的出现在数据挖掘技术所呈现的世界中变得更具多样性。

数据挖掘技术与调节

锤子“将异质的时间重叠在一起,其中之一时间是古代行星,锤子中还有用来做把手的橡木的时间痕迹,锤子还有10年的时间痕迹,因这把锤子来自将其制造出来用于市场交易的德国工厂”,同样,这把简陋锤子把空间汇聚在一起: “亚耳丁森林、鲁尔矿区、德国某工厂,在波旁大街每周三的折扣工具车中,最后在某个笨拙的星期日修理匠的工作坊那里”。数据挖掘技术所具有的动态性、事实性、虚拟性等使得其对时间与空间的意义已经超越拉图尔对锤子所做的分析。从对时间诠释的维度来看,“在每一个注视运动中,我的身体把一个现在、一个过去和一个将来连接在一起,我的身体分泌时间,更确切地说,成了这样的自然场所”,在数据自然界中,时间被置于其中,“我的身体”“我”也被置于其中,“我”对时间的意义或者时间于“我”的意义可以从数据中获得。“我”的过去被以数据的形式留存,并且这种留存将对“我”的未来构成导引; 从对空间诠释的维度来看,“我”在数据自然界中,空间既可能被消解,也可能被创建。如果说“对于景象的定向,重要的不是作为客观空间里的物体的我实际所处的身体,而是作为可能活动系统的我的身体,其现象‘地点’是由它的任务和它的情境确定的一个潜在身体。哪里有要做的事情,我的身体就出现在哪里。”作为可能活动系统的我的身体在数据自然界中,在 与 其 所 存 在 的 情 景 的 融 合 之 中,“我”没有了原始的知觉状态,“我”对空间的感知是被调节过的知觉,进而对世界的诠释也被调节。

数据挖掘技术与调节

四、数据挖掘技术与伦理的调节

数据挖掘技术以数据构成世界的方式调节着人

类存在以及人类对世界的诠释, 面对“现代技术事实上已经形成了一种新的特殊情况”“这种情况要求伦理思想做出努力”。在技术伦理学所做的努力中,有关于新技术所带来的新问题的伦理探究,也有对现有主流伦理学框架的批判、质疑与超越。

数据挖掘技术与调节

就数据挖掘技术而言, 伴随其在个性化搜索引擎、会计、银行系统等的诸多应用, 与其相关的伦理问题也随之而至, 这些问题期待伦理学的应对。如某人在使用网络进行搜索的过程中, 其所产生的数据也在被无形地收集和使用,一方面,为了满足人们对搜索结果的满意度与精确度的要求, 基于数据挖掘技术的个性化搜索引擎为此提供了可能; 但另一方面,个性化搜索引擎是基于用户的个性化信息被收集,被存放在个性化信息库之中,来对搜索结果予以调节。在这个过程中,用户的信息被收集、二次使用,用户从使用者的角色被调节为被使用者的角色,用户在线的行为可通过对数据的关联、聚类与分类等而做出对用户未来行为的预测或预判。而这种预判或预测几乎是在用户不知情的情况下而进行的,且其涉及用户的隐私。基于网络数据挖掘的个性化搜索引擎,用户获悉自身想到的信息,即信息的知情权,但当具体的搜索结果和个人隐私冲突的时候,这里体现的是隐私权和知情权之间的冲突、信息保存与持有、保护与泄露之间的冲突等。这些冲突是伦理学需要迎接的新挑战,同时,这些挑战也是伦理学发展的新机遇。如,近几年来,被遗忘权( the right to be forgotten) 的出现就是源自对欧洲国家与谷歌之间关于数据信息相关权力争执的伦理思考; 对基于数据所做出的决策的问责而出现的关于伦理主体、责任主体的探讨等。

数据挖掘技术与调节

但在对数据挖掘技术进行伦理学反思的过程中,关于由该技术以及由该技术所引发的伦理问题的探讨,不能仅仅将数据挖掘技术视为被反思的对象,研究其所带来的伦理问题,该技术还是伦理学构建的一个要素。“数据并非仅仅是简单地在‘这里’等着被我们去搜集、储存和分析,数据一直是在特定的历史、文化和经济环境中被想象和创造的。”在这种想象和创造的过程中,人的作用是毋庸置疑的,但“数据自身却被忽视了,”因此,需要走向数据技术自身。

数据挖掘技术与调节

传统的技术伦理学常常聚焦于技术所引发的伦理问题,但如今技术已不仅仅站在伦理的对立面上,技术既能引发伦理问题, 同时也能对伦理进行导引与规约。维贝克等学者基于技术在主体性与客体性构成中的调节作用,提出了技术伦理学的内在路径,力图突破传统伦理学的技术外部主义立场,走出以批判的方式来对技术的伦理学予以反思的路径, 发展一条内部的伦理学。技术对人的道德行为予以调节,技术以参与的方式进入到了伦理问题的解决之中,伦理出现了由外部评估技术走向技术从内部参与的内化现象。

数据挖掘技术与调节

事实上,数据挖掘技术以构建数据自然界的方式重塑了伦理学存在的场所, 而这种重塑需要人类重新思考技术在伦理学中的位置。在数据挖掘技术构建数据自然界的时候,在能呈现的、所呈现的以及应呈现的之间进行权衡、抉择与取舍,而所呈现的一切是基于人与技术共同参与之中的相互调节。在关于数据挖掘技术研究的五组主要问题中,“怎样使用数据挖掘技术才能有益于社会? 怎样才能防止它被滥用? 数据的不适当披露和使用、个人隐私和数据保护权的潜在违反” 等被列入其中。在数据挖掘技术飞速发展过程中, 当其带来了关于隐私的伦理纷争时,与此相关的技术也渐次出现。数据挖掘技术的开发者们通过加密算法对原始数据进行加密的加密技术,通过数据清洗、数据屏蔽、数据交换、数据泛化、随机干扰等数据扰乱技术来进入到对伦理的调节之中。在某种意义上, 伦理观念被内化到技术之中,技术也因其履行某种伦理的功能而被授予了伦理的意蕴。

数据挖掘技术与调节数据挖掘技术与调节

闫宏秀,博士, 2003年毕业于复旦大学哲学系,并于同年进入上海交通大学,现为上海交通大学科学史与科学文化研究院副教授,现担任上海自然辩证法研究会理事、上海中青年技术哲学论坛发起人、负责人、中国自然辩证法研究会技术哲学专业委员会常务理事等。曾于2015年6月至2016年6月由留基委全额资助赴牛津大学访问一年。

研究方向:技术哲学、设计哲学、技术社会学。

邮箱:hxyan@sjtu.edu.cn)

数据挖掘技术与调节数据挖掘技术与调节数据挖掘技术与调节

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务