【IT168 技术】在本章中,我们将研究什么会组成一个数据库系统,特别是PostgreSQL这样的现实世界中非常有用的关系数据库系统。我们将从电子表格开始,它和关系数据库有很多相同的地方,同时也有重大的局限性。我们将学习像PostgreSQL一样的关系数据库怎么拥有比电子表格强悍的很多功能。顺带,我们将继续我们的非正式的对SQL的研究。
电子表格软件,例如Microsoft Excel,被广泛应用于数据存储和查阅。它很容易用不同的方法排序数据,并通过眼睛直接观察数据的内容和模式。
不幸的是,人们经常一个很好的用于查看和操作数据的工具为一个存储和共享复杂的甚至是关键业务数据的工具。这两种需求通常相差甚远。
很多人都熟悉一种或多种电子表格软件,并能够按照一定的行列的规则组织一些数据。图2-1显示了一个示例一个保存客户数据的OpenOffice(电子表格。
当然,这样的信息容易被看到和修改。每个客户有单独的一行,而且客户的每段信息保存在一个单独的列中。一列和行的交集是一个单元格。
这个简单的电子表格包含需要在我们开始设计数据库时顺手记下的几个功能。例如,姓和名分别在不同的列,这使按性和名排序的时候更容易。
电子表格式一个了不起的主意,而且是一个可以解决很多类型问题的很好的工具。但是,就像你不会(或者至少不应该)尝试用牛刀杀鸡一样,有些时候电子表格你完成工具的恰当工具。
试想如果在一个有用成千上万客户的大公司将所有的客户信息保存在一张电子表格的主副本中将会怎样。在一个大公司,很可能很多人需要更新这个列表。虽然文件锁可以确保同一时间只有一个人可以修改这个列表,随着需要修改这个文件的人数的增多,他们需要花费更长的时间等待轮到自己修改这个列表。我们所想要的是让许多人同时读取,更新,添加和删除行,并让计算机确保没有冲突。显然,简单的文件锁定将不足以有效地处理这个问题。
电子表格的另一个问题是它们是绝对的二维的。假设我们还要存储每个客户的订单的细节。刚开始我们可以将订单细节紧贴着客户信息存放。当随着每个客户订单信息的增长,电子表格会变得越来越复杂。考虑到这样的结果,我们开始为每个客户添加一些基本订单信息。
不幸的是,它看上去不在那么优雅了。我们现在又变长的行,且没有容易的方法计算么个客户会占用多少。甚至,我们会达到每条记录允许的最大的列数。这就是我们在前面章节碰到的重复组的问题。在电子表格中的多表格会有点帮助,但他们不是解决这个问题的理想方法。
这是一个你怎样很容易超过电子表格的例子。一个熟人正尝试建立一个电子表格用来帮做小型生意的朋友存储信息。这个生意需要记录皮革项目,每个项目的价格不单依赖于生产它所需要的时间和劳动,同时还依赖于制造过程中所耗费的皮革的单位成本。物主需要购买不同批次的皮革,每个批次需的单价依赖于皮革的档次和购买时间。然后他们需要在他们制造皮革制品的时候在库存中使用先进先出的策略,通常皮革是按批购买的。我们的挑战是建立一个电子表格完成以下功能:
经过几天的努力,他们发现这种表面上简单的仓储管理需求出人意料的难以转换到一个电子表格。仓储记录多变的特征不适合电子表格的。梦见吃饺子