首页 > 代码库 > 数据管理技术的发展
数据管理技术的发展
本文基于万常选编著的《数据库系统原理与设计》,为个人笔记整理。着重讲解文件系统和数据库管理系统。
数据管理技术经历了人工管理、文件系统和数据库管理系统3个阶段。
一、人工管理系统
人工管理阶段的数据时面向应用程序的,一个数据集只能对应一个程序,程序与数据之间的关系如下图:
当多个应用程序涉及某些相同的数据时,必须由各自的应用程序分别定义和管理这些数据,无法共享利用,因此存在大量的冗余数据。
二、文件系统阶段
文件系统把数据组织成相互独立的文件,利用“按文件名访问,按记录进行存取”的管理技术,可以对文件进行修改、插入和删除。文件系统阶段程序与数据之间的关系如下如:
1、主要的特点
(1)文件系统实现了文件内的结构性,即一个文件内的数据是按记录进行组织的,这样的数据时有结构的,但是多个文件之间是相互独立的,无法建立全局的结构化数据管理模式;
(2)程序与数据之间由文件系统提供的存取方式进行转换,不必过多考虑物理细节。
2、弊端
(1)数据共享性差,数据冗余和不一致。数据冗余是指相同的数据在不同的地方(文件)重复存储。在文件系统中,一个(或一组)文件基本上对应一个应用程序,即文件仍是面向应用的,当不同的应用程序具有部分相同的数据时,也必须建立各自的文件,而不能共享相同的数据,因此数据的冗余量大。这样,不仅浪费存储空间,而且可能导致数据的不一致,即同一数据的不同副本不一致(修改其中一个而另一个不修改)。
(2)数据独立性差。若想对现有文件组再增加一些新的应用汇很困难,系统也不易扩充,因为,文件系统中的文件是为某一特定应用服务的,其逻辑结构对于该特定的应用程序优化的,一旦数据的逻辑结构改变,就必须修改应用程序以及文件结构的定义。
(3)数据孤立,数据获取困难。对于数据与数据之间的联系,文件系统仍缺乏有效的管理手段。
(4)完整性问题。数据的完整性是指数据的正确性、有效性和相容性,也称为一致性约束。如:修改某一项数据要在其他条件满足下进行。
(5)原子性问题。计算系统有时发生故障,一旦故障发生并被检测到,数据就应该恢复到故障发生前的状态。若修改某一项数据时,电脑故障,导致其他相同的数据未被修改,而故障之前修改过的已经修改了,导致数据不一致,这里修改相同数据的操作应该保证要么都不发生,要么都发生。
(6)并发异常问题。系统应该允许多个用户同时访问数据,在这样的环境中由于并发更新操作相互影响,可能会导致数据的不一致。
(7)安全性问题。针对不同的人访问级别应不一样。
三、数据库管理系统阶段
设计数据库管理系统的目的是为了有效地管理大量的数据,并解决文件处理系统中存在的问题。
与文件系统相比,数据库管理系统的特点:
(1)数据结构化
数据库管理系统实现数据的整体结构化,这是数据库的主要特征之一,也是数据库管理系统与文件系统的本质区别。整体结构化,一是指数据不仅仅是内部结构化,而是将数据以及数据之间的联系统一管理起来,使之结构化;二是在数据库中的数据不仅仅针对某一个应用,而是针对全组织的所有应用。
(2)数据的共享度高,冗余度低,易扩充
数据库管理系统从整体角度描述和组织数据,数据不再是面向某个应用,而是面向整个系统;由于数据时面向整个系统,这样不仅可以被多个应用共享使用,而且容易增加新的应用,这就使得数据库系统易于扩充。
(3)数据独立性高
物理独立性是指用户的应用程序与存储在磁盘上数据库中的数据时相互独立的;逻辑独立性是指用户的应用程序与数据库的逻辑结构相互独立,也就是,数据的逻辑结构改变了,应用程序也不用修改。
(4)数据由数据库管理系统统一管理和控制
数据库管理系统中的数据共享是允许并发操作的共享。
数据管理技术的发展