数据库技术演变与发展
作者:中国医药信息学会理事 王继中 发文时间:2004.12.02
摘要:随着信息技术的发展,采用两维表结构的数据库,已经无法保存大量的多媒体非结构化复杂数据,以及各类数据之间的关系。关系型数据库亟待突破。
信息技术平台的选择常常是建立或重新建立应用系统时的关键问题,而数据库正是其中需要做出选择的关键平台。
关系数据库管理系统曾处于技术主流而独领风骚,但是这种传统的数据库管理系统因采用两维数据模型,而存在着本身固有的约束和限制。难以适应当今迅速变化的业务需求,以及新技术发展。
关系型数据库的局限
随着信息技术的飞速发展,数据处理不仅在数量上要求越来越大,而且在质量上也要求越来越高,数据库所管理的数据已经发生了根本的变化。这一变化给数据库技术带来了巨大挑战,数据库管理的对象已不再仅限于文本数据等简单的数据类型,而需要描述和保存大量多媒体非结构化的复杂数据,以及数据间的关系。
此外,随着热门网站访问数量的激增,对数据库本身的存储机制、大量并发用户的使用需求、存储空间的使用效率、以及数据的完整性和安全性等方面都提出了更高要求。而这些都不是传统关系数据库中,使用二维表简单结构就可以满足的。
关系型数据库依据的是把数据表示为简单的两维模型,即表示为行与列的记录来进行存储处理。显然由于受到当时条件的限制,只是一种适合于对简单数据存储处理的技术,存在难以克服的局限性。
关系型数据库管理系统本身固有的局限性,表现在以下三个方面:
数据模型上的限制
关系数据库所采用的两维表数据模型,不能有效地处理在大多数事务处理应用中,典型存在的多维数据。其不可避免的结果是,在复杂方式下,相互作用表的数量激增,而且还不能很好地提供模拟现实数据关系的模型。
关系数据库由于其所用数据模型较多,还可能造成存储空间的海量增加和大量浪费,并且会导致系统的响应性能不断下降。而且,在现实数据中,有许多类型是关系数据库不能较好地处理的。
性能上的限制
为静态应用例如报表生成,而设计的关系型数据库管理系统,并没有经过针对高效事务处理而进行的优化过程。其结果往往是某些关系型数据库产品,在对GUI和Web的事务处理过程中,没有达到预期的效果。除非增加更多的硬件投资,但这并不能从根本上解决问题。
用关系数据库的两维表数据模型,可以处理在大多数事务处理应用中的典型多维数据,但其结果往往是建立和使用大量的数据表格,仍很难建立起能模拟现实世界的数据模型。并且在数据需要作报表输出时,又要反过来将已分散设置的大量的两维数据表,再利用索引等技术进行表的连接后,才能找到全部所需的数据,而这又势必影响到应用系统的响应速度。
扩展伸缩性上的限制
关系数据库技术在有效支持应用和数据复杂性上的能力是受限制的。关系数据库原先依据的规范化设计方法,对于复杂事务处理数据库系统的设计和性能优化来说,已经无能为力。此外,高昂的开发和维护费用也让企业难以承受。
除此之外,关系数据库的检索策略,如复合索引和并发锁定技术,在使用上会造成复杂性和局限性。
后关系型数据库浮出水面
随着信息技术的发展,在用关系数据库数据模型来处理复杂的数据类型、复杂的数据关系以及多种访问方法上,仍存在着诸多的能力限制。
虽然传统的关系数据库能很好地适合于处理相对简单的事务交易,但是却不能胜任来自不同表格的数据的处理。更多的数据库应用开发者认识到了关系数据库的限制,并开始寻找适合的替代方案。
但变革并不是很容易就可以实现的。在原有的两维表数据模型架构上,增加其它的功能并不能解决问题,有的开始尝试网络化的解决方案。
例如对于前几年出现的通用数据库和对象-关系数据库解决方案,专家们认为这些所谓的通用数据......