MySQL进阶实战10,MySQL全文索引
一、全文索引
全文索引的目的是 通过关键字的匹配进行查询过滤,基于相似度的查询,而不是精确查询。
全文索引利用分词技术分析出文字中某关键字的频率和重要性,并按照一定的算法智能的筛选出我们想要的结果。
全文索引一般用于字符串中某关键字的查询,比如char、varchar、text,也支持自然语言全文索引和布尔全文索引。
二、使用全文索引
1、创建worker表,并创建全文索引
CREATE TABLE `worker` ( `id` int NOT NULL, `name` varchar(50) NOT NULL, `age` int NOT NULL, `address` varchar(100) NOT NULL, PRIMARY KEY (`id`), FULLTEXT INDEX `idx_fulltext`(`address`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
添加全文索引
alter table city add fulltext idx_fulltext(city)
删除全文索引
drop index idx_fulltext on city
2、插入10条记录
INSERT INTO worker (id, name, age, address) VALUES(1, 哪吒编程1, 18, 辽宁省大连市沙河口区中山路572号星海广场); INSERT INTO worker (id, name, age, address) VALUES(2, 哪吒编程2, 19, 辽宁省大连市甘井子区高能街1号); INSERT INTO worker (id, name, age, address) VALUES(3, 哪吒编程3, 20, 辽宁省大连市甘井子区燕邻街大连理工大学); INSERT INTO worker (id, name, age, address) VALUES(4, 哪吒编程4, 21, 辽宁省大连市中山区五五路35号); INSERT INTO worker (id, name, age, address) VALUES(5, 哪吒编程5, 22, 北京市东城区长安街); INSERT INTO worker (id, name, age, address) VALUES(6, 哪吒编程6, 23, 上海市浦东新区世纪大道1号); INSERT INTO worker (id, name, age, address) VALUES(7, 哪吒编程7, 24, 上海浦东陆家嘴,); INSERT INTO worker (id, name, age, address) VALUES(8, 哪吒编程8, 25, 上海市浦东新区世纪大道105号); INSERT INTO worker (id, name, age, address) VALUES(9, 哪吒编程9, 26, 广东省深圳市罗湖区建设路1003号); INSERT INTO worker (id, name, age, address) VALUES(10, 哪吒编程10, 27, 广东省深圳市南山区中山路12号);
3、使用全文索引
select * from worker where match(address) against(广东省深圳市)
查看执行计划
-
如果您的表格中没有足够的数据(例如1行),则全文搜索将无效; MySQL InnoDB 最短索引字符串默认为4,也就是只有达到4个字符才会生效;
三、自然语言的全文索引
自然语言的搜索引擎将计算每一个文档对象和查询的相关度。
相关度是基于匹配的关键词个数、在文档中出现的次数。出现次数越少的关键字,匹配时的相关度就越高,相反,非常常见的单词将不会搜索这类词语。
函数match() 将返回关键词匹配的相关度,是一个浮点数字。在一个查询中使用两次 match() 函数不会有额外的消耗,MySQL 会自动识别并只进行一次搜索。不过你将 match() 函数放到 order by 子句中, MySQL 将会使用文件排序。
在match()中指定的列必须和全文索引中指定的列完全相同,否则就无法使用全文索引。
四、布尔全文索引
在布尔全文搜索中,用户可以在查询中自定义某个被搜索的词语的相关性。
当编写一个布尔搜索查询时,可以通过一些前缀修饰符来定制查询。
- +行记录中必须包含此关键字;
- -行记录中必须不包含此关键字;
- >提高该词的相关性,查询的结果靠前
- <降低该词的相关性,查询的结果靠后
- *星号 通配符,只能接在词后面
select * from worker where match(address) AGAINST(上海市* in boolean mode);