您的位置: 首页 > 信息化技术 > 信息化综述

数据库走入混合时代?

2006-8-7 来源:互联网周刊 作者:刘磊
在经历了层次型数据库和关系型数据库的时代以后,也许我们已经站在了混合型数据库时代的门口

  自从1970年E.F.Codd发表他那篇著名的关于关系模型的文章—“A Relational Model of Data for Large Shared Data Bank”,并从此开启了关系型数据库的时代之后,人们已经在以关系型数据库为主角的世界里待了将近四十年。而对于技术更新换代速度很快的IT业,这简直可以说是一潭死水—除了习以为常的商业竞争之外,已经很久没有让人兴奋的新技术出现。但现在,随着XML数据格式的盛行,IBM带着它的第三代数据库理想,以及“Viper”计划(DB29计划代号Viper,即毒蛇),呼啸着站到了世人面前。

  故纸堆的管理难题

  在数据只能以穿孔卡片的形式来保存的年代,人们对数据的管理还只停留在物理阶段,根本无法进行高效的存储和查询。直到1956年IBM生产出第一个磁盘驱动器(Model305RAMAC)之后,随机存储数据才得以实现,但此时依旧没有相应的软件能够对数据进行系统管理。

  直到1961年,通用电气公司开发成功的IDS(IntegratedDataStore,集成数据存储)是世界上第一个网状数据库管理系统(DBMS),也是第一个DBMS。此时的数据,以网状模型的形式存在着。但是由于它只能运行于通用电气的主机上,且数据库只有一个文件,所有的表必须通过手工编码生成,因此有着极大的局限性。

  所以,当面向对象的层次型数据模型开始受到关注,层次型数据库也随之出现。1966年IBM与其客户(北美洛克维尔公司和卡特彼勒公司)合作开发的层次型数据库IMS(InformationManagementSystem,信息管理系统)被应用来管理阿波罗计划繁琐的资料。当它作为IBM的产品正式发布之后,成为了当时最著名也是最典型的层次型数据库管理系统。数据库管理系统也进入了自己第一个相对成熟的年代。

  然而尽管层次数据库已经可以很好地解决数据集中和共享的问题,但是在数据独立性和抽象级别上的欠缺,使得新的数据模型再次酝酿出现。1970年,IBM研究员E.F.Codd提出了关系模型的概念,由此奠定了关系模型的理论基础。他的那篇著名论文也被认为是数据库系统历史上具备划时代意义的里程碑。在经过不断的发展和论证之后,更具备优势的关系型数据库终于替代层次型数据库成为了市场的主流。

  尤其是在1974年Ray Boyce和Don Chamberlin提出了SQL语言之后,数据库生命周期中的全部操作都可以借由SQL语言来实现,这无疑为关系数据库奠定了另一块里程碑。自那以后,关系型数据库作为数据库领域霸主的地位就一直没有动摇过,IBMDB2和Oracle的数据库,成为了这个一直延续到至的关系型数据库时代的王者。

  网络时代呼唤新模型

  然而随着网络时代的到来,数据不再仅仅是保存在企业内部的商业秘密,而是更多地被用来在企业间进行传输和交流。正如IBM院士王云博士所说:“关系型数据库在对数据进行结构化存储的时候表现良好,但在大量的信息传输和交流中产生的非结构化和半结构化数据,比如对针对某个现象进行描述的时候,关系模型便很难加以体现。”

  于是,随着网络时代人们交流的需要、企业间、企业内部信息交换的需要,XML(Extensible Mark up Language)作为新的标准化数据存储格式,在金融等许多行业成为事实上的数据交换标准,就连盖茨雄心勃勃的“WindowsLive”战略当中,新版的微软Office软件也将以XML格式存储文档。

  “然而传统的关系型数据库无法对XML数据进行处理。”中国人民大学信息学院的陈红教授说,“解决的办法有两个,一个是通过对现有的关系型数据库进行对XML的支持改进,另一个就是干脆以XML作为数据标准开发一个纯粹的XML数据库。”不过她也强调,开发一个新的、完全根据XML数据模型特性来设计的数据库,不仅困难而且将会不可避免地失去商业关系型数据库在数据存储方面的优势。

  混合的下一代?

  怎么办?几乎所有的数据库厂商都意识到了XML的重要性,也几乎所有厂商,包括Oracle和微软,都在去年就为自己的关系型数据库加上了对XML数据的支持。

  然而目前关系型数据库对XML数据的处理方式往往非常生硬—只有两种基本的数据库设计选项,即将每个XML文档完整地存储为一个大型对象,或者将它“撕开”,分散存储在多个表的多个列中。正像Storebrand高级企业架构师ThoreThomassen所抱怨的那样:“现有的支持技术就是XML‘切碎’技术。”用户们抱怨这样的处理方式不仅无法完整体现XML的层次结构,而且效率低下、不够灵活;文件系统尽管可以应付简单的任务,但是在需要处理大量文档时它们就表现不佳,并发性、恢复、安全和可用性等问题变得难以管理。

  在此情况下,“PureXML”技术就显得格外令人兴奋。正是利用这种技术,IBMDB29才能作为一种新的层次型和关系型数据的混合数据库,同时存储和查询XML数据和关系型数据,而不用进行数据转换。

  IBM中国开发中心总经理郑妙勤说:“DB2是业界第一款也是惟一一款可以使用行业标准接口的关系数据来管理‘PureXML’的数据库,以后用户不仅可以使用同一个......More↓↓↓

相关文章:
- 创建UG NX平台的“中国国家标准塑料模架”数据库  2006-08-01
- 如何选择知识管理系统的数据库平台  2006-06-09
- 应用Windchill PartsLink建立物资基础数据库  2006-06-09
- 数据挖掘工具  2006-05-21
- 应用工程数据库开发CAD/CAE集成系统  2006-05-06
- PDM与ERP集成中的BOM技术  2006-05-01
- OLE技术与CAD图库管理  2001-05-16
- 液压油缸CAD及参数化绘图  2001-06-02
- 分布式CAD集成系统平台的设计与实现  2001-07-24
 本月热点
本周热点
 
发布商链接