使用UML设计数据库应用(1)_UML

使用UML设计数据库应用(1)

发表于：2007-06-11来源：作者：点击数：标签：

1. 介绍许多人认为面向对象概念和关系型数据库相互不一致，并且不能结合。事实上完全相反！经过灵活的使用，一个关系型数据库能够为面向对象（OO）模型提供一套优秀的实现。同样的模型能够用来开发编程代码和建立关系型数据库结构。关系型数据库技术

1. 介绍

许多人认为面向对象概念和关系型数据库相互不一致，并且不能结合。事实上完全相反！经过灵活的使用，一个关系型数据库能够为面向对象（OO）模型提供一套优秀的实现。同样的模型能够用来开发编程代码和建立关系型数据库结构。

关系型数据库技术是意义深远的、强大的，但它比许多开发商使你相信的要难得多。单个表是简单易懂的、直观的，但是要彻底了解由数以百计的表组成（这是常见的）的应用是相当困难的。这正是OO模型有用之处。

OO模型使你深入地、连贯地思考问题。OO模型提供一种问题的超结构（superstructure）的思考方式，然后该方式能够用关系型数据库的更低层的组成块来实现。

本文章综合地讨论了关系型数据库技术，而不是集中于特定的产品上。我们将不讨论物理设计细节（例如存储分配和物理聚集），因为它们是依赖于产品的。

用关系型数据库实现UML模型有两个方面：映射结构（第2节）和映射功能（第3节）。第4节注解了面向对象到关系型数据库的扩展。第5节总结本文章。

2. 结构映射到表

UML对象模型在本质上只是一个扩展的实体-关系（ER）模型[ii]。用来设计数据库的ER模型的方式受到普遍接受，而我们将讲述一种近似的但更强大的方式－使用UML对象模型。OO模型的主要优势在于编程和数据库使用相同的模型工作。而且，作为考虑功能性的一种方式（第3节），我们强调OO模型的导航。这一节显示如何实现UML对象模型的主要构造。

2.1 标识（identity）

实现对象模型的第一步是处理标识。我们从定义几个术语开始。

候选键（candidate key）是一个或多个属性的组合，它唯一地确定某个表里的记录。一个候选键里的属性集必须是最小化的；除非破坏唯一性，否则属性不能从候选键删除。候选键里的属性不能为空。
主键（primary key）是一个特定选定的候选键，用来优先地参考记录。
外键（foreign key）是一个候选键的参考。外键必须包括每个要素属性的一个值，或者它必须全部为空。外键用来实现关联和泛化。

正常地你应该为每个表定义一个主键，尽管偶尔有例外。我们强烈建议所有的外键都只指向主键而不是其它的候选键。

定义主键有两种基本的方法：

基于存在的标识。你应该为每个类表加一个对象标识符属性，并将它设为主键。每个关联表的主键包括一个或更多的相关类的标识符。基于存在的标识符有作为单独属性的优势，占位小且大小相同。只要你的关系型数据库管理系统（RDBMS）支持，基于存在的标识符就没有性能的劣势。（多数RDBMS提供有效的基于存在的标识符的分配顺序号码。）唯一的劣势是基于存在的标识符在维护时内没有固有的意义。
基于值的标识。一些真实世界的属性的组合确定了每个对象。基于值的标识有不同的优势。主键对于用户有固有的意义，容易进行调试和数据库维护。在另一面，基于值的主键很难改变。一个主键的改变需要传播到许多外键。而一些对象没有自然的真实世界里的标识符。

我们推荐你在超过30个类的RDBMS应用里使用基于存在的标识。基于存在和基于值的标识都是所有RDBMS应用的可行选项。

2.2 域（属性类型）

属性类型是UML术语，对应于数据库著作里的域的术语。比起直接用数据类型，域提升到更一致的设计，并便利了应用的定位。

简单域很容易实现。你仅仅要定义相应的数据类型和大小。并且每个用了域的属性，你都必须为每个域约束加入一条SQL检查子句。简单域的一些例子是：名字（name），长字符（longString）和电话号码（phone-Number）。

一个枚举域把一个属性限制在一系列的值里。枚举域比简单域实现起来更复杂，图1显示了四个方法。

图1 枚举的实现方法。

实现方法	优势	劣势	建议
枚举字符。定义一条SQL检查约束，把该枚举限制在允许的值里。	简单。受控的方便搜索的词汇表。	大的枚举难以使用检查。约束难以编码。	我们正常地选择。
每个枚举值一个标记。为每个枚举的值定义一个布尔型属性。	回避命名的难处。	冗长－每个值一个属性。	当枚举值不是互相排斥的并且多个值可能同时地应用时使用。
枚举表。把枚举定义存储到一个表里。不是每个枚举一个表，也不是所有的枚举一个表。	高效地处理大的枚举。不用改变应用的代码就可以定义新的枚举值	偶尔使用时很麻烦。必须编写通用的软件来阅读枚举表和加强值。	适合大的枚举和没有结尾（open-ended）的枚举。
枚举编码。把枚举值编码作为有序的数字。	节省磁盘空间。有助于用多种语言处理。	大大地复杂化了维护和调试。	避免使用，除非你要用多种语言处理。

2.3 类

正常情况下，我们把每个类映射为一个表，每个属性映射为一个列。你可能因一个已产生的标识符（基于存在的标识符）、隐藏的关联（第2.4节）和通用鉴别器（第2.5节）需要一些另外的列。

2.4 关联

现在我们讨论关联的实现。我们已经把我们的陈述分为建议的映射（我们正常使用的映射），可选的映射（我们偶尔使用的映射）和不鼓励的映射（我们遇到的应该避免的错误）。我们所有的例子都采用基于存在的标识。

2.4.1 建议的映射

多对多关联。用一个单独的表（图2）来实现一个多对多关联。关联的主键是每个类的主键的合并。那些省略号（...）表示在模型里没有显示出来的属性。主键用黑体字体显示。
一对多关联。把一个外键隐藏在“多”表（图3）。角色名字成为外键属性名字的一部分。
零或一对一关联。把外键隐藏在“零或一”表（图4）。
其它一对一关联。把外键隐藏在任一表里。

图2 建议的实现：单独的多对多关联表。

共5页: 1 [2] [3] [4] [5] 下一页

原文转自：http://www.ltesting.net

软件测试 > 测试开发技术 > 软件测试开发语言 > UML >