MySQL索引的优化之LIKE模糊查询功能实现

2025-04-22 22:11:42 145
魁首哥

在使用mysql进行模糊查询时,like语句的性能可能会受到较大影响,尤其是在数据量较大的情况下。

但本质上,用like进行模糊查询,只有以下三种情况:

  • 前缀匹配:如果模糊查询是前缀匹配(如 like '%abc' ),mysql可以使用索引来加速查询。确保在相关列上创建了索引
  • 后缀匹配:对于后缀匹配(如like 'abc%'),mysql无法使用普通的b-tree索引。可以考虑使用反向索引(reverse index)或全文索引(full-text index)
  • 中间匹配:对于中间匹配(如like '%abc%'),mysql也无法使用普通的b-tree索引。全文索引或搜索引擎(如elasticsearcha)可能是更好的选择。

一、前缀匹配优化

前缀匹配(如like 'abc%')可以使用b-tree索引,因此性能较好。确保在相关列上创建索引

示例:

-- 创建表
create table users (
    id int primary key auto_increment,
    username varchar(255) not null
);
​
-- 插入数据
insert into users (username) values ('john_doe'), ('jane_doe'), ('alice'), ('bob'), ('john_smith');
​
-- 创建索引
create index idx_username on users(username);
​
-- 前缀匹配查询
explain select * from users where username like 'john%';
  • 执行计划分析
    • 如果使用了索引,explain结果中的key列会显示idx_username,表明查询使用了索引
    • type会显示range,表示使用了索引范围扫描

二、后缀匹配优化

后缀匹配(如like '%abc'),无法直接使用b-tree索引,可以通过反转字符串并创建索引来优化

示例:

-- 添加反转列
alter table users add column reversed_username varchar(255);
​
-- 更新反转列数据
update users set reversed_username = reverse(username);
-- reverse('hello') 的结果是 'olleh'
​
-- 创建反转列索引
create index idx_reversed_username on users(reversed_username);
​
-- 后缀匹配查询(转换为前缀匹配)
explain select * from users where reversed_username like reverse('doe') + '%';
  • 执行计划分析
    • 查询反转后的列时,explain结果中的key列会显示idx_reversed_username,表明使用了索引
    • type列会显示range,表示使用了索引范围扫描

三、中间匹配优化

中间匹配(如like '%abc%')无法使用b-tree索引。可以考虑使用全文索引或外部搜索引擎

示例(使用全文索引)

-- 创建全文索引
create fulltext index idx_username_fulltext on users(username);
​
-- 全文索引查询
explain select * from users where match(username) against('doe');
  • 执行计划分析:
    • explain结果中的key列会显示idx_username_fulltext,表明使用了全文索引
    • type列会显示fulltext,表示使用了全文索引

四、覆盖索引优化

如果查询只需要返回索引列,可以使用覆盖索引(covering index),避免回表操作

示例:

-- 创建覆盖索引
create index idx_username_covering on users(username, id);
​
-- 覆盖索引查询
explain select username from users where username like 'john%';

五、减少查询范围

通过其他条件缩小查询范围,减少模糊查询的数据量

示例:

-- 假设有一个注册时间列
alter table users add column registered_at datetime;
​
-- 插入数据
update users set registered_at = now() - interval floor(rand() * 365) day;
​
-- 缩小查询范围
explain select * from users 
where registered_at > '2023-01-01' 
and username like 'john%';
  • 执行计划分析
    • explain结果中的key列会显示idx_username,表明使用了索引
    • rows列的值会减少,表明查询范围缩小

六、避免通配符开头

尽量避免在like语句中使用通配符开头(如%abc),因为这种查询无法使用索引

示例:

-- 不推荐的查询
explain select * from users where username like '%doe';
​
-- 优化后的查询(使用全文索引)
explain select * from users where match(username) against('doe');
  • 执行计划分析
    • 不推荐的查询中,type列会显示all,表示全表扫描。
    • 优化后的查询中,type列会显示fulltext,表示使用了全文索引。

七、使用外部搜索引擎

对于复杂的模糊查询需求,尤其是大数据量场景,可以使用外部搜索引擎(如elatsticsearch)

示例

  • 将数据同步到elasticsearch。
  • 使用elasticsearch进行模糊查询。

八、分区表优化

如果数据量非常大,可以使用分区表(partitioning),来较少每次查询需要扫描的数据量

示例:

-- 创建分区表
create table users_partitioned (
    id int primary key auto_increment,
    username varchar(255) not null,
    registered_at datetime
) partition by range (year(registered_at)) (
    partition p0 values less than (2020),
    partition p1 values less than (2021),
    partition p2 values less than (2022),
    partition p3 values less than (2023),
    partition p4 values less than maxvalue
);
​
-- 插入数据
insert into users_partitioned (username, registered_at) 
select username, registered_at from users;
​
-- 分区表查询
explain select * from users_partitioned 
where registered_at > '2023-01-01' 
and username like 'john%';
  • 执行计划分析
    • explain结果中的partitions列会显示查询涉及的分区,表明查询只扫描了部分数据。

九、缓存结果

如果模糊查询的结果不经常变化,可以将查询结果缓存起来,减少数据库的查询压力

示例:

  • 使用redis缓存查询结果
  • 设置缓存的过期时间,确保数据的时效性

总结

通过以上方法,可以显著优化mysql中like模糊查询的性能。根据具体的业务需求和数据特点,选择合适的优化策略:

  • 前缀匹配:使用普通索引。
  • 后缀匹配:使用反转索引。
  • 中间匹配:使用全文索引或外部搜索引擎。
  • 大数据量:使用分区表或外部搜索引擎。
  • 高频查询:使用缓存。

注:了解mysql-match ... against工具参考mysql-match ... against工具

到此这篇关于mysql--索引的优化--like模糊查询的文章就介绍到这了,更多相关mysql like模糊查询内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

分享
海报
145
上一篇:SQL Server查看当前连接数和最大连接数具体方法代码 下一篇:MySql match against工具详细用法

忘记密码?

图形验证码