扩展数据库
① 使用智能代理扩展数据库应用程序
使用数据库客户端和数据库服务器之间的连接作为利用点。
顾名思义,智能数据库代理位于数据库客户端和数据库服务器(sql或NoSQL)之间。它可以观察和修改客户端和服务器之间的网络流量,而不必对任何一端进行任何更改,因为代理在网络协议级别工作。
代理的"智能"部分是它可以对此流量执行自定义逻辑,使您可以完全控制它。这使得代理成为所有数据库客户端的潜在控制点。
使用智能数据库代理通常有三个原因:
根据定义,代理可以看到进入和来自数据库的所有内容。通过观察这种流量可以学到很多东西。这用于入侵检测,商业智能,性能分析等...
还有其他方法可以观察数据库的活动,例如监视接口和日志监视,但它们通常需要对数据库的特殊访问权限,并且它们可能会给数据库带来一些负载。代理对数据库服务器没有影响,可以在没有对数据库的特殊访问权限的情况下放置,并且可以独立扩展。
大多数数据库系统都有一定程度的访问控制,但它们通常是在语义级别:您可以访问此数据,但不能访问该数据。但有时你需要拒绝某些请求的能力,因为它们效率低下,或者因为它们在一天中的错误时间出现,或者出于任何原因。
一个简单的应用是基本的查询控制,但它也可以包括拒绝某些连接,速率限制,重定向连接等...
由于数据库代理可以完全控制数据库客户端和数据库服务器之间的网络流量,因此它还可以修改此流量。
例如,可以重写低效的查询,以便在到达数据库之前提高效率。
同样,可以在返回数据库客户端的过程中动态修改结果集。这对于细粒度控制(如自定义数据屏蔽、数据分类强制实施等)特别有用。
智能数据库代理本身不是解决方案:它是一个使您能够创建解决方案的平台。每种情况都是独一无二的,但大多数用途都属于几个广泛的用例。
智能数据库代理最常见的用例是,当您需要更改应用程序与数据库交互的方式,但无法更改该应用程序时,通常是您无法控制的第三方应用程序或不再维护的应用程序。
这是最常见的用例,因为没有其他选择:要么就是那个,要么放弃应用程序。
实际上,这通常是一件相当简单的事情:您在代理中设置了一个过滤器来捕获某个请求并将其替换为另一个请求。在大多数情况下,替换请求在逻辑上等效于它所替换的请求,因为它需要产生应用程序可以使用的内容。例如,这可能意味着改写查询以提高效率或行为不同,或者更改数据库不再支持的语法或功能。
在某些情况下,您甚至可能更改请求,使其返回错误消息(例如,"此数据不可用"),空结果集,甚至是来自其他数据源的数据集。
这是请求修改的镜像。在某些情况下,您可能需要以修改请求难以或不可能的方式更改某些查询返回的数据。您可能需要更改大型结果集中的一个值,或者转换货币,或者以数据库不支持的方式屏蔽某些值。无论原因是什么,代理都使您能够灵活地在最原子级别更改查询结果。
有时,使用数据库的机制无法表达复杂的访问控制要求。您可能需要指定某些用户在某些时候只能获得对某些非常特定的数据项的某些访问权限,而大多数数据库根本不擅长于此 - 它假定是数据库客户端的工作。即使是支持它的数据库(例如具有细粒度访问控制的Oracle)也往往会使其变得痛苦且昂贵。
在此上下文中,代理可以为已知查询实现极其细粒度的访问控制,尽管它可能无法对任意查询执行此操作。
大多数应用程序以相对可预测的方式访问其数据库,因此您可以在一段时间内(记录阶段)记录请求,然后通过拒绝以前从未见过的任何请求(强制阶段)来锁定系统。使用智能数据库代理可以轻松完成此操作,具有足够的灵活性,可以适应任何非平凡的IT系统中预期的不可避免的异常和特性。
获得应用程序在数据库中正在执行的操作的可靠、实时视图可能非常困难。某些数据库提供了一个界面,可让您了解其活动,但它们往往侧重于监视和性能。代理可以轻松提取任何类型的相关数据库活动,并将其记录或发送到任何需要的地方。代理的卖点是,这可以在不对数据库进行任何特殊访问的情况下完成,而不会对数据库或客户端产生任何影响,并且对于所有数据库访问的子集也是如此。
代理的新兴用途包括在应用程序中有意识地利用它们,而不是在事后。如果有许多应用程序需要访问具有相同要求的同一数据库,并且您已经有一个代理,则将一些数据库访问逻辑转换为代理是有意义的。例如,可以标记特定查询,以便代理以在所有应用程序中保持一致的方式识别和修改它们。
在此上下文中,您可以将代理视为数据库的扩展:您是在知情的情况下访问扩展数据库,而不是数据库本身。
智能数据库代理是一个针对数据库流量运行逻辑的平台,因此您可以在需要时变得非常有创意。例如,您可以通过将来自多个源的数据网格化到单个结果集中来执行一些轻量级集成,或者动态生成测试数据,或者对数据进行动态加密和解密。看看当你给有创造力的人这种力量时,他们能做些什么总是很有趣的。
权力越大,责任越大。所有这些功能并不总是没有成本的。
数据库代理可以看到进入和来自数据库的所有内容,因此它可能是一个敏感点。控制代理的任何人都控制着通过它的应用程序:它应该变得像使用它的最安全的应用程序一样安全。
代理的额外复杂性也是需要考虑的。这是另一个必须规划、保护和管理的系统。此外,部署到代理的任何逻辑都必须经过管理、测试、源代码管理等。它很容易上手 - 典型的查询替换过滤器通常不超过几行代码 - 但是随着代理运行越来越多的逻辑,您将需要管理该逻辑。
最后,像任何其他工具一样,数据库代理可能会被滥用。
最常见的问题是推迟应用程序更新变得太容易了 - 只需让代理来处理它即可。在许多情况下,修改请求和响应的能力可以挽救生命,但它也可能失控。如果你发现自己在太多的筛选器中游泳,并且有不合理的查询重写和结果集编辑,则可能是时候考虑至少更新某些应用了。但是,由您来决定该数字何时变得不合理。
智能数据库代理可以成为许多IT项目的强大补充。一旦您意识到数据库客户端和数据库服务器之间的连接可以被打开和利用,各种有趣的可能性就会打开。
大多数人从使用数据库代理作为单点解决方案开始,通常是为了解决特定应用程序中的特定问题,但是一旦代理到位,它就可以成为一个很好的杠杆点。
② 如何安全扩展master 数据库空间
如何扩展master数据库空间master数据库只能扩展在master设备上.那么当master设备已经没有足够的空间可使用时,请按以下步骤操作:(此操作过程是以UNIX操作系统为例.SYBASE安装路径为/sybase)1.备份master数据库启动backup server,进入isql环境执行:1>mp database master to '/sybase/master.mp'2>goshutdown SQL/ASE Server1>shutdown2>go2.创建新的足够大的master设备$buildmaster -d -ssize(size以2K为单位)例:$buildmaster-d/sybase/data/master.dat -s1024003.修改RUN_servername文件编辑RUN_server_name文件,-d参数指向新建的设备名。4.单用户模式重启server$startserver -f RUN_servername -m5.执行installmaster脚本6.由备份文件装载master数据库1>load database master from '/sybase/master.mp'2>go7.修改sysdevices信息sp_configure 'allow updates', 1gobegin trangoupdate sysdevices set high = 102399 , phyname = 'e:\sybase\data\master_test.dat' where name = 'master'go(102399=200*512-1 master设备大小为200M)commit trango8.扩展master数据库1>alter database master on master设备名称=size(此值以M为单位)2>go例:alter database master on master=10将master数据库在master设备上扩展10M
③ 数据库文件扩展名
数据库的不同其扩展名也不同:
SQL的就是MDF
Access数据库的扩展名是mdb 。
MSSql数据库的扩展名是mdf 。
Paradox数据库的扩展名是DB 。
Oracle数据库的扩展名是DBF。
dBase数据库的扩展名是DBF 。
FoxPro数据库的扩展名是DBF 。
MS Works数据库的扩展名是wdb。
(3)扩展数据库扩展阅读:
程序数据库文件
PDB(Program Database File,程序数据库文件)文件物理结构在我们目前使用的掌上电脑中,Palm操作系统由于其功能强大、应用软件多等特点,占有很大的比例。PDB文件是Palm OS操作系统上数据文件类型。一般我们在使用Palm系统的电子书时都会遇到这种文件,一般用于电子书或手机电子书 pdb是Palm DataBase的缩写,Palm OS所用文件的扩展名为“.pdb”。还表示碳氧同位素标准样品以及可编程延迟模块,是DSP中的一种模块,可以用来计数和延时。
参考资料来源:网络-程序数据库文件
④ 为系统扩展数据库采用什么设计方法
数据库设计(Database Design)是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)。
在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。
一、数据库和信息系统
(1)数据库是信息系统的核心和基础,把信息系统中大量的数据按一定的模型组织起来,提供存储、维护、检索数据的
功能,使信息系统可以方便、及时、准确地从数据库中获得所需的信息。
(2)数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在。
(3)数据库设计是信息系统开发和建设的重要组成部分。
(4)数据库设计人员应该具备的技术和知识:
数据库的基本知识和数据库设计技术
计算机科学的基础知识和程序设计的方法和技巧
软件工程的原理和方法
应用领域的知识
二、数据库设计的特点
数据库建设是硬件、软件和干件的结合
三分技术,七分管理,十二分基础数据
技术与管理的界面称之为“干件”
数据库设计应该与应用系统设计相结合
结构(数据)设计:设计数据库框架或数据库结构
行为(处理)设计:设计应用程序、事务处理等
结构和行为分离的设计
传统的软件工程忽视对应用中数据语义的分析和抽象,只要有可能就尽量推迟数据结构设计的决策早期的数据库设计致力于数据模型和建模方法研究,忽视了对行为的设计
如图:
三、数据库设计方法简述
手工试凑法
设计质量与设计人员的经验和水平有直接关系
缺乏科学理论和工程方法的支持,工程的质量难以保证
数据库运行一段时间后常常又不同程度地发现各种问题,增加了维护代价
规范设计法
手工设计方
基本思想
过程迭代和逐步求精
规范设计法(续)
典型方法:
(1)新奥尔良(New Orleans)方法:将数据库设计分为四个阶段
S.B.Yao方法:将数据库设计分为五个步骤
I.R.Palmer方法:把数据库设计当成一步接一步的过程
(2)计算机辅助设计
ORACLE Designer 2000
SYBASE PowerDesigner
四、数据库设计的基本步骤
数据库设计的过程(六个阶段)
1.需求分析阶段
准确了解与分析用户需求(包括数据与处理)
是整个设计过程的基础,是最困难、最耗费时间的一步
2.概念结构设计阶段
是整个数据库设计的关键
通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型
3.逻辑结构设计阶段
将概念结构转换为某个DBMS所支持的数据模型
对其进行优化
4.数据库物理设计阶段
为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)
5.数据库实施阶段
运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果
建立数据库,编制与调试应用程序,组织数据入库,并进行试运行
6.数据库运行和维护阶段
数据库应用系统经过试运行后即可投入正式运行。
在数据库系统运行过程中必须不断地对其进行评价、调整与修改
设计特点:
在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起来将这两个方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两方面的设计
设计过程各个阶段的设计描述:
如图:
五、数据库各级模式的形成过程
1.需求分析阶段:综合各个用户的应用需求
2.概念设计阶段:形成独立于机器特点,独立于各个DBMS产品的概念模式(E-R图)
3.逻辑设计阶段:首先将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式;然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图(View),形成数据的外模式
4.物理设计阶段:根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式
六、数据库设计技巧
1. 设计数据库之前(需求分析阶段)
1) 理解客户需求,询问用户如何看待未来需求变化。让客户解释其需求,而且随着开发的继续,还要经常询问客户保证其需求仍然在开发的目的之中。
2) 了解企业业务可以在以后的开发阶段节约大量的时间。
3) 重视输入输出。
在定义数据库表和字段需求(输入)时,首先应检查现有的或者已经设计出的报表、查询和视图(输出)以决定为了支持这些输出哪些是必要的表和字段。
举例:假如客户需要一个报表按照邮政编码排序、分段和求和,你要保证其中包括了单独的邮政编码字段而不要把邮政编码糅进地址字段里。
4) 创建数据字典和ER 图表
ER 图表和数据字典可以让任何了解数据库的人都明确如何从数据库中获得数据。ER图对表明表之间关系很有用,而数据字典则说明了每个字段的用途以及任何可能存在的别名。对SQL 表达式的文档化来说这是完全必要的。
5) 定义标准的对象命名规范
数据库各种对象的命名必须规范。
2. 表和字段的设计(数据库逻辑设计)
表设计原则
1) 标准化和规范化
数据的标准化有助于消除数据库中的数据冗余。标准化有好几种形式,但Third Normal Form(3NF)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡。简单来说,遵守3NF 标准的数据库的表设计原则是:“One Fact in One Place”即某个表只包括其本身基本的属性,当不是它们本身所具有的属性时需进行分解。表之间的关系通过外键相连接。它具有以下特点:有一组表专门存放通过键连接起来的关联数据。
举例:某个存放客户及其有关定单的3NF 数据库就可能有两个表:Customer 和Order。Order 表不包含定单关联客户的任何信息,但表内会存放一个键值,该键指向Customer 表里包含该客户信息的那一行。
事实上,为了效率的缘故,对表不进行标准化有时也是必要的。
2) 数据驱动
采用数据驱动而非硬编码的方式,许多策略变更和维护都会方便得多,大大增强系统的灵活性和扩展性。
举例,假如用户界面要访问外部数据源(文件、XML 文档、其他数据库等),不妨把相应的连接和路径信息存储在用户界面支持表里。还有,如果用户界面执行工作流之类的任务(发送邮件、打印信笺、修改记录状态等),那么产生工作流的数据也可以存放在数据库里。角色权限管理也可以通过数据驱动来完成。事实上,如果过程是数据驱动的,你就可以把相当大的责任推给用户,由用户来维护自己的工作流过程。
3) 考虑各种变化
在设计数据库的时候考虑到哪些数据字段将来可能会发生变更。
举例,姓氏就是如此(注意是西方人的姓氏,比如女性结婚后从夫姓等)。所以,在建立系统存储客户信息时,在单独的一个数据表里存储姓氏字段,而且还附加起始日和终止日等字段,这样就可以跟踪这一数据条目的变化。
字段设计原则
4) 每个表中都应该添加的3 个有用的字段
dRecordCreationDate,在VB 下默认是Now(),而在SQL Server • 下默认为GETDATE()
sRecordCreator,在SQL Server 下默认为NOT NULL DEFAULT • USER
nRecordVersion,记录的版本标记;有助于准确说明记录中出现null 数据或者丢失数据的原因 •
5) 对地址和电话采用多个字段
描述街道地址就短短一行记录是不够的。Address_Line1、Address_Line2 和Address_Line3 可以提供更大的灵活性。还有,电话号码和邮件地址最好拥有自己的数据表,其间具有自身的类型和标记类别。
6) 使用角色实体定义属于某类别的列
在需要对属于特定类别或者具有特定角色的事物做定义时,可以用角色实体来创建特定的时间关联关系,从而可以实现自我文档化。
举例:用PERSON 实体和PERSON_TYPE 实体来描述人员。比方说,当John Smith, Engineer 提升为John Smith, Director 乃至最后爬到John Smith, CIO 的高位,而所有你要做的不过是改变两个表PERSON 和PERSON_TYPE 之间关系的键值,同时增加一个日期/时间字段来知道变化是何时发生的。这样,你的PERSON_TYPE 表就包含了所有PERSON 的可能类型,比如Associate、Engineer、Director、CIO 或者CEO 等。还有个替代办法就是改变PERSON 记录来反映新头衔的变化,不过这样一来在时间上无法跟踪个人所处位置的具体时间。
7) 选择数字类型和文本类型尽量充足
在SQL 中使用smallint 和tinyint 类型要特别小心。比如,假如想看看月销售总额,总额字段类型是smallint,那么,如果总额超过了$32,767 就不能进行计算操作了。
而ID 类型的文本字段,比如客户ID 或定单号等等都应该设置得比一般想象更大。假设客户ID 为10 位数长。那你应该把数据库表字段的长度设为12 或者13 个字符长。但这额外占据的空间却无需将来重构整个数据库就可以实现数据库规模的增长了。
8) 增加删除标记字段
在表中包含一个“删除标记”字段,这样就可以把行标记为删除。在关系数据库里不要单独删除某一行;最好采用清除数据程序而且要仔细维护索引整体性。
3. 选择键和索引(数据库逻辑设计)
键选择原则:
1) 键设计4 原则
为关联字段创建外键。 •
所有的键都必须唯一。 •
避免使用复合键。 •
外键总是关联唯一的键字段。 •
2) 使用系统生成的主键
设计数据库的时候采用系统生成的键作为主键,那么实际控制了数据库的索引完整性。这样,数据库和非人工机制就有效地控制了对存储数据中每一行的访问。采用系统生成键作为主键还有一个优点:当拥有一致的键结构时,找到逻辑缺陷很容易。
3) 不要用用户的键(不让主键具有可更新性)
在确定采用什么字段作为表的键的时候,可一定要小心用户将要编辑的字段。通常的情况下不要选择用户可编辑的字段作为键。
4) 可选键有时可做主键
把可选键进一步用做主键,可以拥有建立强大索引的能力。
索引使用原则:
索引是从数据库中获取数据的最高效方式之一。95%的数据库性能问题都可以采用索引技术得到解决。
1) 逻辑主键使用唯一的成组索引,对系统键(作为存储过程)采用唯一的非成组索引,对任何外键列采用非成组索引。考虑数据库的空间有多大,表如何进行访问,还有这些访问是否主要用作读写。
2) 大多数数据库都索引自动创建的主键字段,但是可别忘了索引外键,它们也是经常使用的键,比如运行查询显示主表和所有关联表的某条记录就用得上。
3) 不要索引memo/note 字段,不要索引大型字段(有很多字符),这样作会让索引占用太多的存储空间。
4) 不要索引常用的小型表
不要为小型数据表设置任何键,假如它们经常有插入和删除操作就更别这样作了。对这些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。
4. 数据完整性设计(数据库逻辑设计)
1) 完整性实现机制:
实体完整性:主键
参照完整性:
父表中删除数据:级联删除;受限删除;置空值
父表中插入数据:受限插入;递归插入
父表中更新数据:级联更新;受限更新;置空值
DBMS对参照完整性可以有两种方法实现:外键实现机制(约束规则)和触发器实现机制
用户定义完整性:
NOT NULL;CHECK;触发器
2) 用约束而非商务规则强制数据完整性
采用数据库系统实现数据的完整性。这不但包括通过标准化实现的完整性而且还包括数据的功能性。在写数据的时候还可以增加触发器来保证数据的正确性。不要依赖于商务层保证数据完整性;它不能保证表之间(外键)的完整性所以不能强加于其他完整性规则之上。
3) 强制指示完整性
在有害数据进入数据库之前将其剔除。激活数据库系统的指示完整性特性。这样可以保持数据的清洁而能迫使开发人员投入更多的时间处理错误条件。
4) 使用查找控制数据完整性
控制数据完整性的最佳方式就是限制用户的选择。只要有可能都应该提供给用户一个清晰的价值列表供其选择。这样将减少键入代码的错误和误解同时提供数据的一致性。某些公共数据特别适合查找:国家代码、状态代码等。
5) 采用视图
为了在数据库和应用程序代码之间提供另一层抽象,可以为应用程序建立专门的视图而不必非要应用程序直接访问数据表。这样做还等于在处理数据库变更时给你提供了更多的自由。
5. 其他设计技巧
1) 避免使用触发器
触发器的功能通常可以用其他方式实现。在调试程序时触发器可能成为干扰。假如你确实需要采用触发器,你最好集中对它文档化。
2) 使用常用英语(或者其他任何语言)而不要使用编码
在创建下拉菜单、列表、报表时最好按照英语名排序。假如需要编码,可以在编码旁附上用户知道的英语。
3) 保存常用信息
让一个表专门存放一般数据库信息非常有用。在这个表里存放数据库当前版本、最近检查/修复(对Access)、关联设计文档的名称、客户等信息。这样可以实现一种简单机制跟踪数据库,当客户抱怨他们的数据库没有达到希望的要求而与你联系时,这样做对非客户机/服务器环境特别有用。
4) 包含版本机制
在数据库中引入版本控制机制来确定使用中的数据库的版本。时间一长,用户的需求总是会改变的。最终可能会要求修改数据库结构。把版本信息直接存放到数据库中更为方便。
5) 编制文档
对所有的快捷方式、命名规范、限制和函数都要编制文档。
采用给表、列、触发器等加注释的数据库工具。对开发、支持和跟踪修改非常有用。
对数据库文档化,或者在数据库自身的内部或者单独建立文档。这样,当过了一年多时间后再回过头来做第2 个版本,犯错的机会将大大减少。
6) 测试、测试、反复测试
建立或者修订数据库之后,必须用用户新输入的数据测试数据字段。最重要的是,让用户进行测试并且同用户一道保证选择的数据类型满足商业要求。测试需要在把新数据库投入实际服务之前完成。
7) 检查设计
在开发期间检查数据库设计的常用技术是通过其所支持的应用程序原型检查数据库。换句话说,针对每一种最终表达数据的原型应用,保证你检查了数据模型并且查看如何取出数据。
⑤ 如何增加数据库的大小
修改数据文件的扩展性;
alterdatabasedatafile'文件路径';
给表空间增加新的数据文件;
altertablespace表空间名adddatafile'数据文件路径'size1000m;
在对象资源管理器中,连接到 SQL Server 数据库引擎实例,然后展开该实例。
展开“数据库”,右键单击要扩展的数据库,再单击“属性”。
在“数据库属性”中,选择“文件”页。
若要增加现有文件的大小,请增加文件的“初始大小 (MB)”列中的值。数据库的大小须至少增加 1 MB。
若要通过添加新文件增加数据库的大小,请单击“添加”,然后输入新文件的值。有关详细信息,请参阅如何向数据库中添加数据或日志文件 (SQL Server Management Studio)。
单击“确定”。
⑥ 数据库文件扩展名
数据库的不同其扩展名也不同:
SQL的就是MDF
Access数据库的扩展名是mdb 。
MSSql数据库的扩展名是mdf 。
Paradox数据库的扩展名是DB 。
Oracle数据库的扩展名是DBF。
dBase数据库的扩展名是DBF 。
FoxPro数据库的扩展名是DBF 。
MS Works数据库的扩展名是wdb。
(6)扩展数据库扩展阅读:
程序数据库文件
PDB(Program Database File,程序数据库文件)文件物理结构在我们目前使用的掌上电脑中,Palm操作系统由于其功能强大、应用软件多等特点,占有很大的比例。PDB文件是Palm OS操作系统上数据文件类型。一般我们在使用Palm系统的电子书时都会遇到这种文件,一般用于电子书或手机电子书 pdb是Palm DataBase的缩写,Palm OS所用文件的扩展名为“.pdb”。还表示碳氧同位素标准样品以及可编程延迟模块,是DSP中的一种模块,可以用来计数和延时。
参考资料来源:网络-程序数据库文件
⑦ 为什么gis数据库称为扩展的关系数据库
gis全称GeoDatabase,他的设计主要是针对标准关系数据库技术的扩展,它扩展了传统的点、线和面特征,为空间信息定义了一个统一的模型。在该模型的基础上,使用者可以定义和操作不同应用的具体模型,例如交通规划模型、土地管理模型、电力线路模型等。
1、GeoDatabase为创建和操作不同用户的数据模型提供了一个统一的、强大的平台。所以他被称为扩展的关系数据库。
⑧ 通俗解释“为什么数据库难以拓展”
要扩展数据库有四大挑战:搜索、并发性、一致性和速度。
假设你有一张清单,上面有10个人名。如果你想要查找某个人,只需要看一眼清单就行。
但如果清单上有100万个人名呢?这时,你就需要一些策略了。电话簿把人名按照字母顺序排列,这样你就可以略过不需要的部分了。这就是针对搜索问题的一种解决方案。
如果有100万人在同时使用这本电话簿呢?这就是并发性的问题。要么大家在市政厅排长队等待使用电话簿,要么把电话簿复印100万份——“主从复制”策略。如果你把这100万份复印件放到每个人的家里——“分布式”策略——你同样可以得到快速响应。
如果有人电话号码更换了呢?主从复制策略造成了一个问题:现在必须对100万本电话簿作出更改。而且它们还在被使用呢,何时才能进行更改呢?如果一本一本的更改,就可能造成数据一致性问题。如果全部回收并印发新的,就可能造成可用性问题。
如果每小时都有成百上千的人更换他们的电话号码呢?这时你就面临由于“资源争用”引起的严重的信息堵塞,这种堵塞还会导致“竞态条件”(不可预知的输出)和“死锁”(数据库的僵局)。
以上所有问题都有解决方案,但这些解决方案可能会非常复杂。比如,可以通过发放电话簿的附录(称为“修改日志”)而不是重新打印它们,不过你得时时刻刻检查你的附录。你可以按照修改日期发布电话簿的新版本,这样人们可以同一时间交换它们以获得更高的一致性,不过这样的话,电话簿就总会稍微有一点过时。
现在,把规模扩展到有上百万的用户使用,数十亿条数据分布式的存储在世界各地的数据中心中。
数据库基本目标是维护一种假象,即它只有一份拷贝,同一时间只有一个人在修改它,所有人看到的都是最新的数据,并且能立即响应。当数据库扩展到全球有上百万的人使用和修改上以万亿计的数据时,这个目标就无法达到了。
因此数据库设计的任务是使用环环相扣的算法技巧以尽可能的接近这一假象。
⑨ 向外扩展SQL Server系统的两个选项[1]
当我提到向外扩展数据库系统时 我实际上只是讨论对数据库系统进行分割或划分 以便你能利用那些部分 把它们分配到单独的数据库服务器上 这允许你在许多服务器间分散处理能力 以适应不断扩张的增长
但是 额外的特性和功能需要更高的复杂程度 一个向外扩展的数据库很难进行设计或管理 在你成功对一个数据库系统实行向外扩展之前 你必须解决许多困难的商业和技术难题
本文说明向外扩展数据库系统的两个选项 从而实现更高的可扩展性 水平数据划分和垂直数据划分
水平数据划分
使用水平数据划分 数据库结构在数据库实例方面没有变化 通常 数据库之间唯一的不同在于实例包含的数据不同
开发出中间层应用程序 使得实例间的数据得到适当维护 是这种解决方案的特点 可能很难决定如何在数据库实例间划分数据 数据分配方法十分关键 因为我们需要在不同服务器间比较平均地分散数据负载 不进行这种平均分割 你就无法取得向外扩展数据库的任何好处 因为查询或事务处理的大部分IO仍然只发生在一台服务器上
既然全部数据不再保存在一台服务器上 因此在必要时更难对所有数据执行查询 幸运的是 你可以建立分布式划分视图连接两个服务器实例间的数据 使得数据看起来就像保存在一台服务器上 有一些特殊的视图 它们利用连接的服务器和在数据表上建立的约束 有效地返回数据 就好像你只查询一台服务器上的数据一样
lishixin/Article/program/SQLServer/201311/22529