sqlserver分布式存储
在微软的大数据解决方案中,数据管理是最底层和最基础的一环。
灵活的数据管理层,可以支持所有数据类型,包括结构化、半结构化和非结构化的静态或动态数据。
在数据管理层中主要包括三款产品:SQLServer、SQLServer并行数据仓库和
Hadoop on Windows。
针对不同的数据类型,微软提供了不同的解决方案。
具体来说,针对结构化数据可以使用SQLServer和SQLServer并行数据仓库处理。
非结构化数据可以使用Windows Azure和WindowsServer上基于Hadoop的发行版本处理;而流数据可以使用SQLServerStreamInsight管理,并提供接近实时的分析。

1、SQLServer。去年发布的SQLServer2012针对大数据做了很多改进,其中最重要的就是全面支持Hadoop,这也是SQLServer2012与SQLServer2008最重要的区别之一。今年年底即将正式发布的SQLServer2014中,SQLServer进一步针对大数据加入内存数据库功能,从硬件角度加速数据的处理,也被看为是针对大数据的改进。
2、SQLServer并行数据仓库。并行数据仓库(Parallel Data Warehouse Appliance,简称PDW)是在SQLServer2008 R2中推出的新产品,目前已经成为微软主要的数据仓库产品,并将于今年发布基于SQLServer2012的新款并行数据仓库一体机。SQLServer并行数据仓库采取的是大规模并行处理(MPP)架构,与传统的单机版SQLServer存在着根本上的不同,它将多种先进的数据存储与处理技术结合为一体,是微软大数据战略的重要组成部分。
3、Hadoop on Windows。微软同时在Windows Azure平台和WindowsServer上提供Hadoop,把Hadoop的高性能、高可扩展与微软产品易用、易部署的传统优势融合到一起,形成完整的大数据解决方案。微软大数据解决方案还通过简单的部署以及与Active Directory和System Center等组件的集成,为Hadoop提供了Windows的易用性和可管理性。凭借Windows Azure上基于Hadoop的服务,微软为其大数据解决方案在云端提供了灵活性。
‘贰’ 为什么有的数据库系统比如oracle可以存储海量数据,而有的数据库如sqlserver 2000则不能
这和数据库本身的架构有关,例如集群这些都可以提升数据的存储,oracle对于分布式有优势,db2也可以,sql
server就比较逊了,毕竟针对的目标客户和数据库本身的定位有关,其实数据库设计也有关,如果你吧数据分散存储在不同小的数据库中也是可以实现海量数据的存储的啊,譬如淘宝的数据,通过mysql
这种小型的数据库,分散存储,集中管理,效果也是一样的啊
‘叁’ EDS怎样部署Sqlserver-sqlserver分布式部署
EDS怎样部署Sqlserver-sqlserver分布式部署
如果是ECS,您可以在Windows系统的ECS里安装SQL Server来使用喔。
如果是RDS,直接当现成的数据库来连接、存储就可以了喔。
‘肆’ 关于sql sever 的系统存储过程
存储过程分为三类:
系统存储过程:(System stored Procere)sp_开头,为SQLSERVER内置存储过程。
扩展存储过程:(Extended stored Procere),也就是外挂程序,用于扩展SQLSERVER的功能,以sp_或者xp_开头,以DLL的形式单独存在。
(系统存储过程和扩展存储过程都是在master数据库中。sp_开头的可是全局的,任何一个数据库都可以直接调用的。)
系统存储过程主要分为以下几类:
目录存储过程,例如:
sp_columns 返回当前环境中可查询的指定表或视图的列信息。
sp_tables 返回当前环境下可查询的对象的列表(任何可出现在 FROM 子句中的对象)。
sp_stored_proceres 返回当前环境中的存储过程列表。
复制类存储过程,例如:
sp_addarticle 创建项目并将其添加到发布中。此存储过程在发布服务器的发布数据库上执行。
安全管理类存储过程,例如:
sp_addrole 在当前数据库创建新的 Microsoft�0�3 SQL Server�6�4 角色。
sp_password 添加或更改 Microsoft�0�3 SQL Server�6�4 登录的密码。
分布式查询存储过程,例如:
sp_foreignkeys 返回引用主键的外键,这些主键在链接服务器中的表上。
sp_primarykeys 返回指定远程表的主键列,每个键列占一行。
扩展存储过程:
xp_sendmail 向指定的收件人发送邮件和查询结果集附件。
xp_startmail 启动 SQL 邮件客户端会话。
xp_cmdshell 以操作系统命令行解释器的方式执行给定的命令字符串,并以文本行方式返回任何输出。授予非管理用户执行xp_cmdshell 的权限。
用户定义的存储过程:(User-defined stored Procere),这个就是用户在具体的数据库中自己定义的,名字最好不要以sp_和xp_开头,防止混乱。
注意事项:
1.在存储过程中,有些建立对象的语句是不可使用的:create default,create trigger,create procere,create view,create rule.
2.在同一数据库中,不同的所有者可以建立相同名称的对象名。例如:a.sample,b.sample,c.sample三个数据表可以同时存在。如果存储过程中未指明对象的所有者(例如存储过程中的语句select * from sample,这句中的sample没有指明所有者),在执行的过程中默认的所有者查找顺序是:相应的存储过程的建立者->相应数据库的所有者。如果这个查找过程中没有把所有者确定下来,系统就要报错。
(这里我额外插一句:如果需要严密的数据操作,在任何操作中尽量加上所有者,例如leijun.sample)
3.在存储过程名称前边添加#或者##,所建立的存储过程则是“临时存储过程“(#是局部临时存储过程,##是全局临时存储过程)。
‘伍’ SqlServer是如何管理,分配存储空间的呢
Sql Server 区管理(GAM,SGAM)
大家都知道Sql Server 中数据文件存储的最小单位是页面(Page),但实际SQLSERVE并不是以页面为单位给数据分配空间的,Sql Server默认的存储分配单位是盘区(Extend)。这样做的主要原因是为了避免频繁的读写IO,提升性能。在表或其它对象分配存储空间,不是直接分配一个8K的页面,而是以一个盘区(Extend)为存储分配单位,一个盘区为8个页面(Size = 8*8K=64K)。
这样,对区得操作就会非常频繁,也要求Sql Server有自己的一套系统管理着数量众多的区。其中最突出的出一个问题,那就是在存储那些只有少量数据,不足8K的对象,如果也是分配给一个盘区,就会存在存储空间上的浪费,降低了空间分配效率。
为解决上述问题,SQLSERVER提供了一种解决方案,定义了两种盘区类型,统一盘区和混合盘区。
全局分配映射表 (GAM):统一盘区,GAM 页记录已分配的区。每个 GAM 包含 64,000 个区,相当于近 4 GB 的数据。GAM 用一个位来表示所涵盖区间内的每个区的状态。如果位为 1,则区可用;如果位为 0,则区已分配。
共享全局分配映射表 (SGAM):由多个对象共同拥有该盘区,SGAM 页记录当前用作混合区且至少有一个未使用的页的区。每个 SGAM 包含 64,000 个区,相当于近 4 GB 的数据。SGAM 用一个位来表示所涵盖区间内的每个区的状态。如果位为 1,则区正用作混合区且有可用页。如果位为 0,则区未用作混合区,或者虽然用作混合区但其所有页均在使用中。
在实际为对象分配存储盘区时,为了提高空间利用率,默认的情况下,如果一个对象一开始大小小于8个页面,就尽量放在混合盘区中,如果该对象大小增加到8个页面后,SQLSERVER会为这个对象重新分配一个统一盘区。
据区当前的使用情况,GAM 和 SGAM 中每个区具有以下位模式:
第0个bit为保留字节,始终为0
第1个bit表示该页面是否已分配,我们知道GAM页用来管理区是否已分配,但一个区包含8个页面,所以用该bit用来准确定位该区的某个页面是否已分配出去了。
第2个bit表示该页面是否混合分区的一个页面。
第3个bit表示该页面是否是一个IAM(索引分配映射)页面。
第4个bit表示该页面中是否包含幻影或已删除记录,这有助于SQL Server定期清理幻影或已删除记录。
第5~7个页面表示该页面的空间使用率情况。
‘陆’ sqlserver是分布式数据库吗
是的,
MS SQL Server 是中大型分布式关系型数据库。
Oracle ,DB2是超大型分布式关系数据库。
MySql是中小型分布式关系型数据库。
‘柒’ sql sever 的系统存储过程包括那些
sqlserver许多管理和信息活动可以通过系统存储过程执行。系统存储过程按这些分类分组
主要有SP开头和XP开头两种类型。具体的作用如下
sp开头的一般是Active
Directory
过程、目录过程、游标过程、数据库维护计划过程、分布式查询过程、全文检索过程、日志传送过程、OLE
自动化扩展存储过程、复制过程、安全过程、SQL
事件探查器过程、SQL
Server
代理程序过程、系统过程、Web
助手过程、XML
过程
xp开头的是常规扩展过程、SQL
Server
代理程序过程
不知道楼主看明白了,如果有什么明天可以补充问题。
‘捌’ sqlserver存储过程中使用链接服务器访问远程的存储过程
exec sp_configure 'show advanced options',1 --开启高级设置
reconfigure WITH OVERRIDE;
exec sp_configure 'Ad Hoc Distributed Queries',1--允许openrowset opendatasource访问
reconfigure WITH OVERRIDE;
exec sp_configure 'show advanced options',0 --关闭高级设置
reconfigure WITH OVERRIDE;
