资料库商业模式与本体论

资料库的外部结构与商业模式

资料库系统分割为四个抽象化级

采用者级资料库：采用者级资料库相关联Seyches商业模式，是最吻合采用者的二级资料库，是采用者能看见和采用的资料库，又称为采用者快照。基本上概念级资料库：基本上概念级资料库相关联于基本上概念商业模式，介乎采用者级和力学级间，是大部份采用者快照的最轻补集，是资料库管理员可看见和采用的资料库，又称为 DBA（DataBase Administrator，资料库管理员）快照。力学级资料库。力学级数据库相关联于内商业模式，是资料库的上层则表示，它叙述统计数据的前述储存组织机构，是最吻合于力学储存的级，又称为外部快照。

资料库系统的二级商业模式

基本上概念商业模式：基本上概念商业模式（商业模式、方法论商业模式）借以叙述整座资料库中资料库的方法论外部结构，叙述现实生活当今世界中的虚拟或其物理性质与联络，表述历史记录、统计操作方式符、统计数据的准确性不动点及历史记录间的联络，是统计操作方式符值的架构。外商业模式：外商业模式（子商业模式、采用者商业模式）借以叙述采用者看见或采用的那部份统计数据的方法论外部结构，采用者依照外商业模式用统计数据操作方式句子或插件去操作方式资料库中的统计数据。内商业模式。内商业模式是整座资料库的最上层则表示，有别于力学层，它假定XC610PA是两个无穷的非线性门牌号内部空间。内商业模式表述的是储存历史记录的类别、储存域的则表示和储存历史记录的力学次序，提示元、检索和储存方向等统计数据的储存组织机构。

二级自主性

力学自主性。力学自主性是指采用者的插件与储存在硬盘上的资料库中的统计数据是互相分立的。当统计数据的力学储存发生改变时，插件不须要发生改变。方法论自主性。方法论分立性是指采用者的插件与资料库中的方法论外部结构是互相分立的。当统计数据的方法论外部结构发生改变时，插件不须要发生改变。

统计数据源

基本上概念统计数据源

依照采用者的看法来对统计数据和重要信息可视化，主要就用作资料库结构设计。基本上结构设计模式主要就用虚拟—别列济（Entity-Relationship Approach）则表示，因此也称 E-R 数学模型。

基本上统计数据源

依照排序机系统的看法来对统计数据和重要信息可视化，主要就用作 DBMS 的实现。基本上统计数据源是资料库系统的核心和基础。

关系代数

关系代数的基本上运算主要就有并、交、差、笛卡尔积、选择、投影、连接和除法运算

并：排序两个关系在集合理论上的补集，即给出关系 R 和 S（两者有相同元/列数），R∪S 的元组包括 R 和 S 大部份元组的集合。差：排序两个关系的区别的集合，即给出关系 R 和 S（两者有相同元/列数），R-S的元组包括 R 中有而 S 中没有的元组的集合。交：排序两个关系集合理论上的交集，即给出关系 R 和 S（两者有相同元/列数），R∩S 的元组包括 R 和 S 相同元组的集合。显然，R∩S = R-(R-S) 和 R∩S = S-(S-R)成立笛卡尔积：排序两个关系的笛卡尔乘积，令 R 为有 m 元的关系，S 为有 n 元的关系，则 R×S 是 m+n 元的元组的集合，其前 m 个元素来自 R 的两个元组，而后 n 个元素来自 S 的两个元组。投影：从两个关系中抽取指明的属性（列）。选择：从关系R中抽取出满足给定限制条件的历史记录。θ连接：θ连接从两个关系的笛卡儿积中选取属性间满足一定条件的元组除：设有关系 R(X，Y)与关系 S(Z)，Y 和 Z 具有相同的属性个数，且相关联属性出自相同域。关系 R(X，Y)÷S(Z)所得的商关系是关系 R 在属性 X 上投影的两个子集，该子集和 S(Z)的笛卡尔积必须包含在 R(X，Y)中，记为 R÷S，其具体排序公式为：

统计数据的规范化

关系数学模型满足的确定约束条件称为本体论，依照满足不动点的级别不同，本体论由低到高分为 1NF（第一本体论）、2NF（第二本体论）、3NF（第三本体论）、BCNF（BC 本体论）、4NF（第四本体论）等。

第一本体论

1NF 是最高的规范化要求。如果关系 R 中大部份属性的值域都是简单域，其元素（即属性）不可再分，是属性项而不是属性组，那么关系数学模型 R 是第一本体论的第二本体论

如果两个关系 R 属于 1NF，且大部份的非主属性都完全依赖于主属性，则称之为第二本体论第三本体论

如果两个关系 R 属于 2NF，且每个非主属性不传递依赖于主属性，这种关系是 3NF

反规范化

资料库中的统计数据规范化的优点是减少了统计数据冗余，节约了储存内部空间，相应方法论和力学的 I/O 次数减少，同时加快了增、删、改的速度，但是对完全规范的资料库查询，通常须要更多的连接操作方式，从而影响查询速度。因此，有时为了提高某些查询或应用的性能而破坏规范规则，即反规范化（非规范化处理）。

常见的反规范化技术包括：

增加冗余列

增加冗余列是指在多个表中具有相同的列，它常用来在查询时避免连接操作方式增加派生列

增加派生列指增加的列能通过表中其他统计数据排序生成。它的作用是在查询时减少排序量，从而加快查询速度。重新组表

重新组表指如果许多采用者须要查看两个表连接出来的结果统计数据，则把这两个表重新组成两个表来减少连接而提高性能。分割表

有时对表做分割能提高性能。表分割有两种方式，水平分割和垂直分割

资料库结构设计

资料库设计的过程是将资料库系统与现实生活当今世界密切地、有机地、协调一致地结合起来的过程。资料库的结构设计质量与结构设计者的知识、经验和水平密切相关。作为资料库应用系统的重要组成部份，资料库结构设计的成败往往直接关系到整座应用系统的成败。

资料库结构设计的方法

基于 3NF 的资料库结构设计方法是资料库结构设计的外部结构化结构设计方法，其基本上思想是在需求分析的基础上，识别并确认资料库商业模式中的全部属性和属性间的依赖，将它们组织机构成两个单一的关系数学模型，然后再分析商业模式中不符合 3NF 的不动点，用投影和连接的办法将其分解，使其达到 3NF 条件。

结构设计企业商业模式结构设计资料库方法论商业模式结构设计资料库力学商业模式（储存商业模式）评价力学商业模式资料库实现

资料库结构设计的基本上步骤

分步结构设计法遵循自顶向下、逐步求精的原则，将资料库结构设计过程分解为若干互相分立又互相依存的阶段，每一阶段采用不同的技术与工具，解决不同的问题，从而将问题局部化，减少了局部问题对整体结构设计的影响。在分步结构设计法中，通常将资料库的结构设计分为需求分析、基本上概念外部结构结构设计、方法论外部结构结构设计和资料库力学结构设计 4 个阶段，如下图所示。

需求分析

需求分析是资料库结构设计过程的第一步，是整座资料库结构设计的依据和基础。需求分析的目标是通过对单位的重要信息需求及处理要求的调查分析得到结构设计资料库所必需的统计数据集或其互相联络，形成需求说明书，作为后面各结构设计阶段的基础。

这一阶段的任务是：

a.确认需求、确定结构设计目标

b.分析和收集统计数据

c.整理文档（需求说明文档/需求说明书）

基本上概念外部结构结构设计

基本上概念外部结构结构设计阶段所涉及的重要信息不依赖于任何前述实现时的环境，即排序机的硬件和软件系统。基本上概念外部结构结构设计的目标是产生两个采用者易于理解的，反映系统重要信息需求的整体资料库基本上概念外部结构。基本上概念外部结构结构设计的任务是，在需求分析中产生的需求说明书的基础上依照一定的方法抽象化成满足应用需求的采用者的重要信息外部结构，即通常所称的基本上结构设计模式。基本上概念统计数据源的作用是：提供能够识别和理解系统要求的架构；为资料库提供两个说明性外部结构，作为结构设计资料库方法论外部结构，即方法论数学模型的基础。

方法论外部结构结构设计

资料库方法论外部结构结构设计的任务就是把基本上概念外部结构结构设计阶段结构设计好的基本上 E-R 图转换为与具体机器上的 DBMS 产品所支持的统计数据源相符合的方法论外部结构。这一阶段是资料库外部结构结构设计的重要阶段。

资料库力学结构设计

资料库在前述的力学设备上的储存外部结构和存取方法称为资料库的力学外部结构。资料库力学结构设计是利用已确定的方法论外部结构及 DBMS 提供的方法、技术，以较优的储存外部结构、统计数据存取方向、合理的统计数据储存位置及储存分配，结构设计出两个高效的、可实现的力学资料库外部结构。

事务管理

资料库系统运行的基本上工作单位是事务，事务相当于操作方式系统中的进程，是采用者表述的两个资料库操作方式序列，这些操作方式序列要么全做要么全不做，是两个不可分割的工作单位。

事务具有以下特性：原子性（Atomicity）：资料库的方法论工作单位。一致性（Consistency）：使资料库从两个一致性状态变到另两个一致性状态。隔离性（Isolation）：不能被其他事务干扰。持续性（永久性）（Durability）：一旦提交，发生改变就是永久性的。

在多采用者共享系统中，许多事务可能同时对同一统计数据进行操作方式，称为“并发操作方式”，此时数据库管理系统的并发控制子系统负责协调并发事务的执行，保证资料库的准确性不受破坏，同时避免采用者得到不正确的统计数据。处理并发控制的主要就方法是采用封锁技术。它有两种类别：排他型封锁（X 封锁）和共享型封锁（S 封锁）。

排他型封锁（简称 X 封锁）

如果事务 T 对统计数据 A（能是统计操作方式符、历史记录、统计数据集，乃至整座资料库）实现了 X 封锁，那么只允许事务 T 读取和修改统计数据 A，其他事务要等事务 T 解除 X 封锁以后，才能对统计数据 A 实现任何类别的封锁。X 封锁只允许两个事务独锁某个统计数据，具有排他性。共享型封锁（简称 S 封锁）

如果事务 T 对统计数据 A 实现了 S 封锁，那么允许事务 T 读取统计数据 A，但不能修改统计数据 A，在大部份 S 封锁解除之前绝不允许任何事务对统计数据 A 实现 X 封锁。