sql创建全文索引
⑴ 关于MSsql 全文索引 某些词特别慢的问题
1. 执行计划中明明有使用到索引,为什么执行还是这么慢?
2. 执行计划中显示扫描行数为 644,为什么 slow log 中显示 100 多万行?
a. 我们先看执行计划,选择的索引 “INDX_BIOM_ELOCK_TASK3(TASK_ID)”。结合 sql 来看,因为有 "ORDER BY TASK_ID DESC" 子句,排序通常很慢,如果使用了文件排序性能会更差,优化器选择这个索引避免了排序。
那为什么不选 possible_keys:INDX_BIOM_ELOCK_TASK 呢?原因也很简单,TASK_DATE 字段区分度太低了,走这个索引需要扫描的行数很大,而且还要进行额外的排序,优化器综合判断代价更大,所以就不选这个索引了。不过如果我们强制选择这个索引缺纯(用 force index 语法),会看到 SQL 执行速度更快少于 10s,那是因为优化器基于代价的原则并不等价于执行速度的快慢;
b. 再看执行计划中的 type:index,"index" 代表 “全索引扫描”,其实和全表扫描差不多,只是扫描的时候是按照索引次序进行而不是行,主要优点就是避免了排序,但是开销仍然非常大。
Extra:Using where 也意味着扫描完索引后还需要回表进行筛选。一般来说,郑数得保证 type 至少达到 range 级别,最好能达到 ref。
在第 2 点中提到的“慢日志记录Rows_examined: 1161559,看起来是全表扫描”,这里更正为“全索引扫描”,扫描行数确实等于表的行数;
c. 关于伏丛咐执行计划中:“rows:644”,其实这个只是估算值,并不准确,我们分析慢 SQL 时判断准确的扫描行数应该以 slow log 中的 Rows_examined 为准。
4. 优化建议:添加组合索引 IDX_REL_DEVID_TASK_ID(REL_DEVID,TASK_ID)
优化过程:
TASK_DATE 字段存在索引,但是选择度很低,优化器不会走这个索引,建议后续可以删除这个索引:
select count(*),count(distinct TASK_DATE) from T_BIOMA_ELOCK_TASK;+------------+---------------------------+| count(*) | count(distinct TASK_DATE) |+------------+---------------------------+| 1161559 | 223 |+------------+---------------------------+
在这个 sql 中 REL_DEVID 字段从命名上看选择度较高,通过下面 sql 来检验确实如此:
select count(*),count(distinct REL_DEVID) from T_BIOMA_ELOCK_TASK;+----------+---------------------------+| count(*) | count(distinct REL_DEVID) |+----------+---------------------------+| 1161559 | 62235 |+----------+---------------------------+
由于有排序,所以得把 task_id 也加入到新建的索引中,REL_DEVID,task_id 组合选择度 100%:
select count(*),count(distinct REL_DEVID,task_id) from T_BIOMA_ELOCK_TASK;+----------+-----------------------------------+| count(*) | count(distinct REL_DEVID,task_id) |+----------+-----------------------------------+| 1161559 | 1161559 |+----------+-----------------------------------+
在测试环境添加 REL_DEVID,TASK_ID 组合索引,测试 sql 性能:alter table T_BIOMA_ELOCK_TASK add index idx_REL_DEVID_TASK_ID(REL_DEVID,TASK_ID);
添加索引后执行计划:
这里还要注意一点“隐式转换”:REL_DEVID 字段数据类型为 varchar,需要在 sql 中加引号:AND T.REL_DEVID = 000000025xxx >> AND T.REL_DEVID = '000000025xxx'
执行时间从 10s+ 降到 毫秒级别:
1 row in set (0.00 sec)
结论
一个典型的 order by 查询的优化,添加更合适的索引可以避免性能问题:执行计划使用索引并不意味着就能执行快。
⑵ 怎么MySql添加全文索引
使用索引是数据库性能优化的必备技能之一。在MySQL数据库中,有四种索引:聚集索引(主键索引)、普通索引、唯一索引以及我们这里将要介绍的全文索引(FULLTEXT INDEX)。
全文索引(也称全文检索)是目前搜索引擎使用的一种关键技术。它能够利用“分词技术“等多乎凳种算法智能分析出文本文字中关键字词的频率及重要性,然后按照一定的算法规则智能地筛选出我们想要的搜索结果。在这里,我们就不追根究底其底层实现原理了,现在我们来看看在MySQL中如何创建并使用全文索引。
在MySQL中,创建全文索引相对比较简单。例如,我们有一个文章表(article),其中有主键ID(id)、文章标题(title)、文章内容(content)三个字段。现在我们希望能够在title和content两个列上创建全文索引,article表及全文索引的创建SQL语句如下:
--创建article表
CREATE TABLE article (
id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
title VARCHAR(200),
content TEXT,
FULLTEXT (title, content) --在title和content列上创建全文索引
);
上面就是在创建表的同时建立全文索引的SQL示例。此外,如果我们想要给已经存在的表的指定字段创建全文索引,同样以article表为例,我们可以使用如下SQL语句进行创建:
--给现有的article表的title和content字段创建全文索引
--索引名称为fulltext_article
ALTER TABLE article
ADD FULLTEXT INDEX fulltext_article (title, content)
在MySQL中创建全文索引之后,现在就该了解如何使用了。众所周知,在数据库中进行模糊查询是使用LIKE关键字进行查询,例如:
SELECT * FROM article WHERE content LIKE '%查询字符串%'
那么,我们使用全文索引也是这样用的吗?当然不是,我们必须使用特有的语法才能使用全文索引进行查询。例如橡顷逗,我们想要在article表的title和content列中全文检索指定的查询字符串,可以如下编写SQL语句:
SELECT * FROM article WHERE MATCH(title, content) AGAINST('查询字符串')
强烈注意:MySQL自带的全文索引只能用于数据库引擎为MyISAM的数据表,如果是其他数据引擎,则全文索引不会生效。此外,MySQL自带的全文索引只能对英文进行全文检索梁卖,目前无法对中文进行全文检索。如果需要对包含中文在内的文本数据进行全文检索,我们需要采用Sphinx(斯芬克斯)/Coreseek技术来处理中文。本站将会在后续文章中对Sphinx以及Coreseek进行介绍。
备注1:目前,使用MySQL自带的全文索引时,如果查询字符串的长度过短将无法得到期望的搜索结果。MySQL全文索引所能找到的词的默认最小长度为4个字符。另外,如果查询的字符串包含停止词,那么该停止词将会被忽略。
备注2:如果可能,请尽量先创建表并插入所有数据后再创建全文索引,而不要在创建表时就直接创建全文索引,因为前者比后者的全文索引效率要高。
⑶ SQL数据库创建数据库(sql创建数据库)
1、选择开始菜单中→程序→【ManagementSQLServer2008】→【SQLServerManagementStudio】命令,打开【SQLServerManagementStudio】窗口,并使用Windows或SQLServer身份验证建立连接。
2、在【对携迟象资源管理器】窗口中展开服务器,然后选择【数据库】节点
3、右键单击【数据库】节点,从弹出来的快捷菜单中选择【新建数据库】命令。
4、执行上述操作后,会弹出【新建数据库】对话框。在对话框、左侧有3个选项,分别是【常规】、【选项】和【文件组】。完成这三个选项中的设置会后,就完成了数据库的创建工作,5、在【数据库名称】文本框中输入要新建数据库辩穗李的名称。例如,这里以“新建的数据库”。
6、在【所有者】文本框中输入新建数据库的所有者,如sa。根据数据库的使用情况,选择启用或者禁用【使用族埋全文索引】复选框。
7、在【数据库文件】列表中包括两行,一行是数据库文件,而另一行是日记文件。通过单击下面的【添加】、【删除】按钮添加或删除数据库文件。
8、切换到【选项页】、在这里可以设置数据库的排序规则、恢复模式、兼容级别和其他属性。
9、切换到【文件组】页,在这里可以添加或删除文件组。
10、完成以上操作后,单击【确定】按钮关闭【新建数据库】对话框。至此“新建的数据”数据库创建成功。新建的数据库可以再【对象资源管理器】窗口看到。
⑷ sql server 2008报错全文表或全文索引视图在其全文索引列中有多个 lcid
全文索引和查询概念(摘自SQL联机帮助)全文索引、查询和同步化最主要的设计要求是,在注册进行全文检索的所有表上都有一个唯一的全文键列(或者单列主键)。全文索引对使用的重要字及其所在位置进行跟踪。例如,假定有一个对DevTools表的全文索引。全文索引可能指出在Abstract列的第423个和第982个单词处找到了单词Microsoft,所在的行与ProctID6关联。该索引结构支持对所有包含被索引单词的项进行有效检索,以及高级检索操作,雀清如短语检索和邻近检索。为防止全文索引因包含很多对检索没有帮助的词而变得臃肿,a、and、is或the这类额外的词都忽略不计。例如,指定""与指定"proctsorderedringsummermonths"是一样的。有这两个字符串的行都会被返回。目录\Mssql\Ftdata\Sqlserver\Config下提供了多种语言的干扰词列表。在安装带有全文检索支持的Microsoft®SQLServer™时会创建这个目录,并同时安装干扰词文件。干扰词文件可以编辑。例如,高技术公司的系统管理员可以把单词computer添加到他们的干扰词表中去。(棚岁如果编辑干扰词文件,则必须在更改生效之前重新填充全文目录。)下表显示了干扰词文件及其相应的语言。干扰词文件语言-----------------------Noise.chs简体中文Noise.cht繁体中文Noise.dat语言中性Noise.deu德语Noise.eng英语(英国)Noise.enu英语(美国)Noise.esn西班牙语Noise.fra法语Noise.ita意大利语Noise.jpn日语Noise.kor韩文Noise.nld荷兰语Noise.sve瑞典语在处理全文查询时,检索引擎将满足检条件的行的键值返回给MicrosoftSQLServer。比如有一个SciFi表,其中Book_No列是主键列。Book_NoWriterTitle---------------------------------------------A025AsimovFoundation''sEndV109VerneMysteriousIsland假定想使用一个全文检索查询来查找包含单词Foundation的书名。在本例中,将从全文索引获得值A025和A027。然后SQLServer用这些键值和其它栏的信息响应该查询。下表显示了存储全文索引数据所使用的语言。这些语言基于SQLServer安装期间选择的Unicode排序规则区域设置标识符。Unicode排序规则区域设置标识符全文数据存储所用的语言------------------------------------------------------中文注音符号(台湾)繁体中文汉语拼音简体中文中文笔画简体中文中文笔画(台湾)繁体中文荷兰语荷兰语英语(英国)英语(英国)法语法语通用Unicode英语(美国)德语德语德文电话簿德语意大利语意大利语日语日语日语Unicode日语韩文韩文韩文Unicode韩文西班牙语(现代)西班牙语瑞典/芬兰语瑞典语此列表中没有的其它所有Unicode排序规则区域设置标识符值都映射到使用空格分隔单词的中性语言单词的断字符和词干分隔符。说明Unicode排序规则区域设置标识符设置用于所有可进行全文索引的数据类型(如char、nchar等)。如果为char、varchar或text类型列的排序次序设置的语言类顷和前型,不是Unicode排序规则区域设置标识符语言,那么在对char、varchar和text类型的列进行全文索引和查询时,仍然使用Unicode排序规则区域设置标识符值。创建全文索引(以索引image列为例,其他类型字段大致一样)标题全文索引image列,全攻略!作者pengdali[原作]关键字全文索引imagehttp://www.cnblogs.com/Elong/archive/2005/08/31/227001.htmlhttp://www.soooi.com/jsj/ShowArticle.asp?ArticleID=2526