我爱海鲸

B站视频相关-5-mysql

我爱海鲸 2025-11-29 09:40:10 暂无标签

简介面试、mysql

1、【Java面试】B站最好的MySQL性能优化面试回答，三分钟搞定面试官！_哔哩哔哩_bilibili

# MySQL性能优化全方位指南：从普通到高手的进阶之路

## 引言

你是否在面试中也会被问到过MySQL优化相关的问题呢？

MySQL作为一种免费开源的关系型数据库，深受各大互联网公司的喜爱。因此，它也成为了技术面试官最常问的面试题之一。相信很多小伙伴也曾被MySQL相关的一些面试题弄得手足无措。

今天我们就通过**普通人与高手**的形式，带大家深入了解MySQL的性能优化技巧。让我们来看一下对于面试官问"MySQL性能优化的理解"，普通人和高手是如何回答这个问题的。

## 一、普通人的回答

**普通人的回答：**

MySQL的性能优化主要是对于SQL语句的整个执行的优化。一般来说我们在这种实际开发过程中，我们会去针对一个像**慢SQL**。慢SQL一般会像我们用**Druid**的话，可以去检测的，或者说我们去把那些慢SQL去抓取到，然后去通过这种分析引擎，去分析整个SQL的执行的一个效率和它的整个执行情况，然后可以根据它的整个的这种索引使用，或者说它的查询的数据量，然后再做针对性的一个优化。

其他的话就是说在应用中我们还可能会用到**分库分表**去对数据量比较大的表去做拆分。其他的就没有了。这就是我对于MySQL理解的，就是在工作过程中所用到的MySQL性能优化的一些点。

**问题分析：**

普通人的回答主要存在以下问题：
- 只关注SQL层面的优化，视野较窄
- 缺乏系统性的优化思路
- 没有从多个维度全面考虑优化方案

## 二、高手的回答

**高手的回答：**

MySQL性能优化我认为可以分为**四个部分**：

1. **硬件和操作系统层面的优化**
2. **架构设计层面的优化**
3. **MySQL程序配置的优化**
4. **SQL执行的优化**

下面我分别对这四个做一个详细的说明。

## 三、硬件和操作系统层面的优化

### 3.1 硬件层面

从硬件层面来说，影响MySQL性能因素主要是：
- **CPU**：多核CPU可以提升并发处理能力
- **内存**：足够的内存可以减少磁盘IO
- **磁盘**：SSD比机械硬盘性能更好
- **网络**：网络带宽和延迟影响数据库访问

### 3.2 操作系统层面

从操作系统层面来说呢，应用文件系统、操作系统的网络配置都会影响到MySQL的性能。

**优化要点：**
- **文件系统**：选择合适的文件系统（如ext4、xfs）
- **网络配置**：优化TCP/IP参数
- **IO调度器**：选择合适的IO调度算法

### 3.3 优化职责

这部分的优化一般是由**DBA**或者**运维工程师**去完成。

在硬件基础资源的优化中，我们重点应该关注的是：
- 服务本身所承载的体量
- 提出合理的指标要求
- 避免出现资源浪费的现象

## 四、架构设计层面的优化

MySQL是一个**磁盘IO访问非常频繁**的关系型数据库，在高并发和高性能的场景中，MySQL数据库必然会承受巨大的并发压力。

在此时呢，我们优化的方式主要可以分为几个部分：

### 4.1 搭建MySQL主从集群

**单个MySQL服务**，通过**读写分离**的方案可以去避免读写冲突导致的性能问题。

**主从架构的优势：**
- **读写分离**：主库负责写，从库负责读
- **负载均衡**：多个从库分担读请求
- **高可用**：主库故障时可以切换到从库

### 4.2 引入分库分表机制

**分库：**
- 通过分库可以降低单个服务所承载的IO压力
- 将数据分散到多个数据库中

**分表：**
- 通过分表的方式可以去降低单表数据量
- 提高单表的查询和写入性能

**分库分表的策略：**
- **水平分表**：按数据范围或哈希值分表
- **垂直分表**：按业务模块分表
- **分库**：按业务或数据量分库

### 4.3 引入缓存层

针对**热点数据**，我们可以引入更为高效的**非关系型数据库**，比如说像：
- **Redis**：内存数据库，适合缓存热点数据
- **MongoDB**：文档数据库，适合存储非结构化数据

它们可以很好地缓解MySQL的访问压力，同时还能提升系统的整体性能。

## 五、MySQL程序配置优化

### 5.1 配置文件

MySQL是一个经过互联网大厂检验过的生产级别的成熟数据库。对于MySQL数据库本身的优化，一般可以通过MySQL配置文件**my.cnf**来完成。

### 5.2 常见配置项

**1. 最大连接数**

比如说，MySQL 5.7版本默认的最大**连接数**是151个，这个值可以在my.cnf中去修改：

```ini
max_connections = 500
```

**2. binlog日志**

binlog日志，默认是不开启，我们也可以在这个文件中去修改开启：

```ini
log-bin = mysql-bin
binlog_format = ROW
```

**3. 缓存池（Buffer Pool）**

缓存池buffer pool，默认大小的配置：

```ini
innodb_buffer_pool_size = 4G
```

### 5.3 配置原则

而这些配置一般是和用户的安装环境以及使用场景有关系，因此这些配置官方只会提供一个默认的配置。具体的情况还是得有使用者去根据实际情况去修改。

### 5.4 配置修改的注意事项

关于配置项的修改需要关注两个层面：

**第一个是配置的作用域**，它可以分为：
- **会话级别**：只对当前会话生效
- **全局范围**：对所有会话生效

**第二个是是否支持热加载**，因此针对这两个点，我们需要注意的是：

1. **全局参数的设定**对已经存在的会话是无法生效的
2. **会话参数的设定**随着会话的销毁而失效
3. **全局的统一配置**建议配置在默认配置文件中，否则重启服务会导致配置失效

## 六、SQL执行优化

SQL优化又可以分为三个步骤：

### 6.1 慢SQL的定位和排查

**第一个，慢SQL的定位和排查。**

我们可以通过**慢查询日志**和慢查询日志工具分析，得到有问题的SQL列表。

**开启慢查询日志：**

```sql
-- 开启慢查询日志
SET GLOBAL slow_query_log = 'ON';

-- 设置慢查询阈值（单位：秒）
SET GLOBAL long_query_time = 2;

-- 查看慢查询日志位置
SHOW VARIABLES LIKE 'slow_query_log_file';
```

**分析工具：**
- **mysqldumpslow**：MySQL自带的慢查询分析工具
- **pt-query-digest**：Percona Toolkit提供的分析工具

### 6.2 执行计划分析

**第二个，是执行计划分析。**

针对慢的SQL，我们可以使用关键字**EXPLAIN**来去查看当前SQL的执行计划。

可以重点关注以下字段：
- **type**：访问类型（ALL、index、range、ref等）
- **key**：使用的索引
- **rows**：扫描的行数
- **Extra**：额外的执行信息

从而去定位该SQL执行慢的根本原因，再去**有针对性地**进行优化。

**EXPLAIN使用示例：**

```sql
EXPLAIN SELECT * FROM users WHERE age > 30;
```

**执行计划关键指标：**
- **type = ALL**：全表扫描，性能最差
- **type = index**：索引扫描
- **type = range**：范围扫描
- **type = ref**：索引查找
- **type = const**：常量查找，性能最好

### 6.3 Show Profile工具

**第三个，使用Show Profile工具。**

**Show Profile工具**是MySQL提供的可以用来分析当前会话中SQL与其资源消耗情况的工具。可以用于SQL调优的测量。

**使用步骤：**

1. **开启Profile：**

```sql
-- 在当前会话中，默认情况下Show Profile是关闭状态
SET profiling = 1;
```

2. **执行SQL：**

```sql
SELECT * FROM users WHERE age > 30;
```

3. **查看Profile结果：**

```sql
-- 查看所有SQL的Profile
SHOW PROFILES;

-- 查看具体SQL的详细Profile
SHOW PROFILE FOR QUERY 1;

-- 查看CPU、IO、内存等资源消耗
SHOW PROFILE CPU, BLOCK IO, MEMORY FOR QUERY 1;
```

打开之后会保存最近15次的运行结果。针对运行慢的SQL，通过Profile工具进行详细分析，可以得到SQL执行过程中所有资源的**开销**，比如说：
- **IO开销**：磁盘IO操作
- **CPU开销**：CPU计算时间
- **内存开销**：内存使用情况

## 七、常见SQL优化规则

看完高手的回答之后，相信各位对于MySQL性能优化有了一定的理解。最后我再给各位小伙伴总结一些常见的SQL优化的一些规则：

### 7.1 基于索引进行数据扫描

**第一个，SQL的查询一定要基于索引来进行数据扫描。**

- 避免全表扫描
- 为常用查询字段建立索引
- 合理使用复合索引

### 7.2 避免索引列上使用函数或运算符

**第二个，避免索引列上使用函数或者运算符，这样会导致索引失效。**

**错误示例：**

```sql
-- 索引失效
SELECT * FROM users WHERE YEAR(create_time) = 2023;
SELECT * FROM users WHERE age + 1 > 30;
```

**正确示例：**

```sql
-- 索引有效
SELECT * FROM users WHERE create_time >= '2023-01-01' AND create_time < '2024-01-01';
SELECT * FROM users WHERE age > 29;
```

### 7.3 LIKE查询优化

**第三个，WHERE查询条件的LIKE，一定要把百分号放在右侧。**

**错误示例：**

```sql
-- 索引失效
SELECT * FROM users WHERE name LIKE '%张%';
SELECT * FROM users WHERE name LIKE '%张';
```

**正确示例：**

```sql
-- 索引有效
SELECT * FROM users WHERE name LIKE '张%';
```

### 7.4 联合索引的最左前缀原则

**第四个，使用索引扫描，联合索引中的列从左到右，命中的越多越好。**

**示例：**

```sql
-- 假设有联合索引 (name, age, city)

-- 可以使用索引
SELECT * FROM users WHERE name = '张三';
SELECT * FROM users WHERE name = '张三' AND age = 30;
SELECT * FROM users WHERE name = '张三' AND age = 30 AND city = '北京';

-- 不能使用索引（不满足最左前缀）
SELECT * FROM users WHERE age = 30;
SELECT * FROM users WHERE city = '北京';
```

### 7.5 使用索引完成排序

**第五个，尽可能使用索引来完成排序，避免使用文件排序的方式。**

**错误示例：**

```sql
-- 文件排序（Using filesort）
SELECT * FROM users ORDER BY age;
```

**正确示例：**

```sql
-- 使用索引排序
SELECT * FROM users WHERE name = '张三' ORDER BY age;  -- 如果有(name, age)索引
```

### 7.6 避免使用SELECT *

**第六个，查询语句里面，我们尽量少用星号，而是用具体有效的列来代替。**

**错误示例：**

```sql
SELECT * FROM users WHERE age > 30;
```

**正确示例：**

```sql
SELECT id, name, age FROM users WHERE age > 30;
```

**优势：**
- 减少网络传输
- 减少内存使用
- 提高查询效率

### 7.7 小结果集驱动大结果集

**最后一个，永远要用小的结果集，去驱动大的结果集。**

**错误示例：**

```sql
-- 大表驱动小表
SELECT * FROM large_table l 
JOIN small_table s ON l.id = s.id;
```

**正确示例：**

```sql
-- 小表驱动大表
SELECT * FROM small_table s 
JOIN large_table l ON s.id = l.id;
```

**原理：**
- 小结果集作为驱动表，可以减少循环次数
- 提高JOIN操作的效率

## 八、优化思路总结

### 8.1 四个层面的优化

1. **硬件和操作系统层面**：由DBA和运维负责
2. **架构设计层面**：主从集群、分库分表、缓存层
3. **MySQL程序配置**：my.cnf配置文件优化
4. **SQL执行优化**：慢SQL定位、执行计划分析、Profile分析

### 8.2 优化流程

```
发现问题
    ↓
定位问题（慢查询日志、监控）
    ↓
分析问题（EXPLAIN、Show Profile）
    ↓
制定方案（索引优化、SQL重写、架构调整）
    ↓
实施优化
    ↓
验证效果
    ↓
持续监控
```

### 8.3 优化原则

- **系统化思考**：从多个维度全面考虑
- **数据驱动**：基于监控数据和执行计划优化
- **循序渐进**：先优化影响最大的问题
- **持续改进**：建立监控机制，持续优化

## 九、总结

MySQL性能优化是一个系统性的工程，需要从多个维度来考虑：

1. **硬件和操作系统层面**：提供良好的基础设施
2. **架构设计层面**：通过主从、分库分表、缓存等提升整体性能
3. **MySQL配置优化**：根据实际场景调整配置参数
4. **SQL执行优化**：通过慢SQL分析、执行计划、Profile工具优化SQL

**核心思想：**
- 不要只关注SQL层面的优化
- 要从系统全局的角度思考问题
- 根据实际业务场景选择合适的优化方案
- 建立完善的监控体系，持续优化

通过系统性的优化思路，我们才能从"普通人"成长为"高手"，在面试中给出让面试官满意的答案。

2、当面试官问你：如何保证MySQL数据库的高可用性？这样回答才厉害_哔哩哔哩_bilibili

# MySQL高可用性架构设计：主从集群实战指南

## 引言

今天给大家分享的是一位去美团面试过的同学遇到的面试题：**如何保证MySQL数据库的高可用性？**

我们先来从背景了解一下为什么要做高可用。

对于MySQL数据库大家并不陌生，在**单机**环境下我们通常是这样**部署**MySQL的。但是这种部署方式往往会存在**单点故障**。

所以在生产环境中，我们不得不去考虑MySQL的高可用性问题。

## 一、什么是高可用？

### 1.1 高可用的定义

高可用的英文是**High Availability**，英文简称是**HA**。

高可用就是描述一个系统正常时段的**正常运行时间**。我们通常用**多少个九**来去描述系统的可用性。

### 1.2 可用性指标

举个例子，假设一个系统的可用性达到了**四个九**，也就是**99.99%**。那么意味着系统平台的高可用性是最低的一个。

**四个九的可用性意味着：**
- **平均每年的不可用时长**：52.6分钟
- **平均每个季度的不可用时长**：13.15分钟
- **每个月的不可用时长**：4.38分钟
- **每周不可用的时长**：1.01分钟

### 1.3 可用性等级对照表

下面这个表描述的是九的个数和不可用时长的对照关系：

| 可用性等级 | 可用性百分比 | 年不可用时长 | 月不可用时长 | 周不可用时长 |
|----------|------------|------------|------------|------------|
| 一个九 | 90% | 36.5天 | 72小时 | 16.8小时 |
| 两个九 | 99% | 3.65天 | 7.2小时 | 1.68小时 |
| 三个九 | 99.9% | 8.76小时 | 43.2分钟 | 10.08分钟 |
| 四个九 | 99.99% | 52.6分钟 | 4.32分钟 | 1.01分钟 |
| 五个九 | 99.999% | 5.26分钟 | 25.9秒 | 6.05秒 |
| 六个九 | 99.9999% | 31.5秒 | 2.59秒 | 0.605秒 |

### 1.4 高可用的目标

所以，要保证MySQL的高可用性，也就是要去**减少MySQL数据库的不可用时长**。

## 二、导致MySQL不可用的因素

那导致MySQL不可用时长增加的因素有哪些呢？

### 2.1 主要因素

1. **机器的资源耗尽**
   - CPU使用率过高
   - 内存不足
   - 磁盘空间不足
   - IO瓶颈

2. **单点故障**
   - 服务器宕机
   - 数据库服务异常
   - 硬件故障

3. **人为操作**
   - 误删除数据
   - 错误的配置修改
   - 不当的维护操作

4. **网络问题**
   - 网络中断
   - 网络延迟过高
   - 网络分区

### 2.2 核心问题

在这些原因中，**单点故障是导致MySQL不可用的最大问题**。

所以，如何去解决MySQL单点故障就变得非常关键。

## 三、MySQL主从集群方案

### 3.1 基本架构

最简单的方式是，我们可以搭建MySQL的**主从集群**，如下图所示。

这张图就是MySQL**一主一从**的集群搭建方案：

```
┌─────────────┐         ┌─────────────┐
│  MySQL 主库A │────────▶│  MySQL 从库B │
│  (Master)   │  复制   │  (Slave)    │
└─────────────┘         └─────────────┘
     ▲                        ▲
     │                        │
  写请求                    读请求
```

- 所有的**写请求**都会落到MySQL主库A上，我们称MySQL主库A为**主节点（Master）**
- 所有的**读请求**可以落到MySQL从库B上，我们称MySQL从库B为**从节点（Slave）**

### 3.2 集群方案变体

当然，关于MySQL集群可以有很多种实现方案，比如：
- **双主**：两个主节点互为主从
- **一主多从**：一个主节点，多个从节点
- **多主多从**：多个主节点，多个从节点

但这些方案，我们都可以理解为是**一主一从**架构的变形。

### 3.3 架构关注点

我们以**一主一从**的架构为例，分析一下这个方案有哪些值得我们去关注的点。

#### 3.3.1 请求转发

**首先是请求的转发，如何去保证所有写请求都落到MySQL主库A上，所有的读请求都落到MySQL从库B上？**

这里可以使用一些路由方案，比如说像：
- **Sharding-JDBC**：Java应用层的分库分表中间件
- **MyCat**：数据库中间件，支持读写分离
- **ProxySQL**：高性能的MySQL代理
- **MaxScale**：MariaDB的数据库代理

**读写分离的实现方式：**

```java
// 伪代码示例
@Transactional
public void createOrder(Order order) {
    // 写操作，路由到主库
    orderMapper.insert(order);
}

public Order getOrder(Long id) {
    // 读操作，路由到从库
    return orderMapper.selectById(id);
}
```

#### 3.3.2 数据一致性保障

**其次是关于主从节点的数据一致性保障。**

大家可以想象一个业务场景，比如说在双十一的时候，大家买了一台电脑，按照上面的一个描述，**写请求**会写入到MySQL主库A中，接着你想要去查询一下订单信息。

我们会落到MySQL从库B中。由于数据没有同步，会导致查询不到这个订单信息，因此这里需要增加一些主从节点的数据同步方案。

## 四、主从同步实现原理

### 4.1 同步流程概述

那么如何把主库中的数据复制到从库呢？我们给大家画了这样一个图，大家可以结合这个图来分析一下。

```
┌─────────────────────────────────────────────────────────┐
│                     主库 (Master)                        │
│                                                          │
│  写请求 → 数据变更 → binlog日志文件                        │
│                          │                              │
│                          │ DUMP线程                      │
│                          ▼                              │
└─────────────────────────────────────────────────────────┘
                          │
                          │ 传输binlog
                          │
┌─────────────────────────────────────────────────────────┐
│                     从库 (Slave)                         │
│                                                          │
│  IO线程 → Relay Log (中继日志)                            │
│                          │                              │
│                          │ SQL线程                       │
│                          ▼                              │
│                    执行SQL语句                            │
│                    完成数据同步                           │
└─────────────────────────────────────────────────────────┘
```

### 4.2 详细步骤

当**写请求**落到主库的时候会产生一个**数据变更**，并且会写入一个叫**binlog**的日志文件中。

有了binlog，实际上只需要把binlog传输到指定的**从库**，然后从库根据binlog文件的内容，解析并执行binlog中的**SQL语句**就可以完成数据的同步。这种重新执行我们称为**重放（Replay）**。

那么主从同步的实现步骤分析一下：

#### 步骤1：从库IO线程连接主库

**第一个就是从库通过IO线程连接到主库，并且向主库要对应的binlog文件。**

- 从库启动IO线程
- IO线程连接到主库
- 请求获取binlog文件

#### 步骤2：主库DUMP线程发送binlog

**第二步，主库通过DUMP线程获取binlog文件并发送给从库。**

- 主库启动DUMP线程
- DUMP线程读取binlog文件
- 将binlog内容发送给从库的IO线程

#### 步骤3：从库写入Relay Log

**第三步是，从库会把主库发送过来的binlog写入到Relay Log中，也就是中继日志。**

- 从库IO线程接收binlog数据
- 将binlog数据写入Relay Log文件
- Relay Log作为临时存储，用于后续重放

#### 步骤4：从库SQL线程读取Relay Log

**第四步呢，从库中的SQL线程会读取Relay Log中的内容。**

- 从库启动SQL线程
- SQL线程读取Relay Log文件
- 解析Relay Log中的SQL语句

#### 步骤5：执行SQL完成同步

**最后一步是执行Relay Log中的内容，也就是相当于把主库中的数据复制到了从库。**

- SQL线程执行解析出的SQL语句
- 完成数据同步
- 更新同步位置信息

### 4.3 配置实现

当然，大家不要把MySQL**主从复制**想得太复杂。实际上在MySQL中，我们只需要一些非常简单的配置就能够实现。

**主库配置（my.cnf）：**

```ini
[mysqld]
# 启用binlog
log-bin=mysql-bin
server-id=1
binlog-format=ROW
```

**从库配置（my.cnf）：**

```ini
[mysqld]
server-id=2
relay-log=mysql-relay-bin
read-only=1
```

**从库连接主库：**

```sql
CHANGE MASTER TO
  MASTER_HOST='主库IP',
  MASTER_USER='repl',
  MASTER_PASSWORD='password',
  MASTER_LOG_FILE='mysql-bin.000001',
  MASTER_LOG_POS=154;

START SLAVE;
```

## 五、主从架构中的问题

OK，聊到这里，我们已经有能力去解决MySQL中的单点故障的一些问题了。

但是呢，在**主从架构**的实际落地中，还有很多问题要考虑：

### 5.1 主节点故障处理

**主节点挂了怎么办？**

- 如何检测主节点故障？
- 如何快速切换到从节点？
- 如何保证切换过程中数据不丢失？

### 5.2 主节点选举

**怎样在从节点中去选择主节点？**

- 多个从节点时，如何选择新的主节点？
- 选举算法如何保证一致性？
- 如何避免脑裂问题？

### 5.3 节点感知

**如何让其他的从节点去感知到新的主节点？**

- 如何通知其他从节点主节点变更？
- 如何更新从节点的配置？
- 如何保证配置的一致性？

### 5.4 数据复制异常

**如果数据复制发生的异常怎么处理？**

- 如何处理网络中断导致的复制延迟？
- 如何处理数据冲突？
- 如何保证数据最终一致性？

### 5.5 完整方案的必要性

只要把这些问题都考虑清楚了，才能够真正搭建一个完整的MySQL主从高可用的集群。

## 六、高可用解决方案

当然，这些问题一定会有对应的解决方案。比如说：

### 6.1 PXC (Percona XtraDB Cluster)

- **特点**：基于Galera的MySQL集群方案
- **优势**：多主架构，同步复制，强一致性
- **适用场景**：对一致性要求极高的场景

### 6.2 MMM (Master-Master Replication Manager for MySQL)

- **特点**：MySQL双主复制管理工具
- **优势**：自动故障转移，监控和切换
- **适用场景**：双主架构的高可用方案

### 6.3 MHA (Master High Availability)

- **特点**：MySQL主从高可用管理工具
- **优势**：自动故障检测和切换，数据一致性保证
- **适用场景**：一主多从架构的高可用方案

### 6.4 InnoDB Cluster

- **特点**：MySQL官方提供的高可用解决方案
- **优势**：基于Group Replication，自动故障转移
- **适用场景**：MySQL 8.0+的官方高可用方案

### 6.5 其他方案

- **Galera Cluster**：多主同步复制集群
- **MaxScale**：数据库代理和路由
- **ProxySQL**：高性能MySQL代理
- **Keepalived + VIP**：虚拟IP漂移方案

## 七、高可用架构设计原则

### 7.1 设计原则

1. **消除单点故障**：通过冗余和集群避免单点
2. **快速故障检测**：及时发现故障并处理
3. **自动故障转移**：减少人工干预，提高恢复速度
4. **数据一致性**：保证数据不丢失、不重复
5. **可扩展性**：支持水平扩展

### 7.2 监控和告警

- **性能监控**：CPU、内存、磁盘、网络
- **复制监控**：复制延迟、复制状态
- **故障告警**：及时通知运维人员
- **日志分析**：分析错误日志，定位问题

### 7.3 备份和恢复

- **定期备份**：全量备份和增量备份
- **备份验证**：定期验证备份的可用性
- **恢复演练**：定期进行恢复演练
- **灾难恢复**：制定灾难恢复预案

## 八、总结

保证MySQL高可用性需要从多个维度来考虑：

1. **理解高可用**：明确可用性指标和业务需求
2. **识别风险**：分析导致不可用的因素
3. **架构设计**：采用主从集群消除单点故障
4. **数据同步**：实现可靠的主从复制机制
5. **故障处理**：解决主节点故障、选举、感知等问题
6. **选择方案**：根据业务场景选择合适的高可用方案

**核心思想：**
- 高可用不是一蹴而就的，需要系统性的设计和持续优化
- 不同的业务场景需要不同的高可用方案
- 监控、备份、演练是高可用架构的重要组成部分

通过系统性的高可用设计，我们可以将MySQL的可用性提升到99.99%甚至更高，满足生产环境的需求。

3、【Java面试】面试被问：Redis和Mysql如何保证数据一致性，如何高分回答？_哔哩哔哩_bilibili

# Redis和MySQL数据一致性保证：从普通到高手的解决方案

## 引言

今天我们来分享一道一线互联网公司的高频**面试题**：

> **Redis和MySQL如何去保证数据的一致性？**

这个问题难倒了不少工作五年以上的**Java程序员**。难得不是问题的本身，而是解决这个问题的思维模式。

下面我们来看看普通人和高手对这个问题的回答。

## 一、普通人的回答

**普通人的回答：**

Redis和MySQL的数据一致性保证。MySQL的数据发生变化的时候，我需要同步去更新Redis。我们可以通过在修改MySQL里面的数据之后，可以用这种数据一致性的方式，说直接去同步去修改Redis，或者我可以发一个**异步消息**去通知Redis的数据修改。

**问题分析：**

普通人的回答主要存在以下问题：
- 只提到了同步更新的思路，但没有深入分析问题
- 没有考虑并发场景下的数据一致性问题
- 缺乏对极端情况的考虑
- 没有提到最终一致性的方案

## 二、高手的回答

### 2.1 架构背景

**高手的回答：**

一般情况下，Redis是用来实现应用和数据库之间的一个**读操作**的**缓存层**。它主要目的呢是去减少数据库的IO，还可以提升数据的IO性能。

**整体架构：**

```
应用程序
    ↓
    ├─ 读请求 → Redis缓存（命中则返回）
    │              ↓（未命中）
    │           MySQL数据库
    │              ↓
    │          写入Redis缓存
    │
    └─ 写请求 → MySQL数据库 → 更新/删除Redis缓存
```

当应用程序需要去读取某个数据的时候：
1. 首先会先尝试Redis里面去**加载**
2. 如果命中了，就直接返回
3. 如果没有命中，就直接从数据库里面查询
4. 查询到数据之后，再把数据**缓存**到Redis里面

### 2.2 数据一致性问题

在这样一个架构里面，会出现一个问题：**一份数据同时保存在数据库和Redis里面**。

当数据发生变化的时候，需要同时去更新Redis和MySQL。由于更新操作是有先后顺序的，并且它并不像MySQL中的多表事务操作可以满足ACID的特性，所以就会出现一个叫**数据一致性**的问题。

## 三、数据一致性问题的原因

### 3.1 问题根源

**核心问题：**
- Redis和MySQL是两个独立的存储系统
- 更新操作不是原子性的
- 无法保证两个操作的ACID特性
- 并发场景下会出现数据不一致

### 3.2 典型场景

**场景1：更新顺序问题**

```
时间线：
T1: 更新MySQL成功
T2: 更新Redis失败
结果：MySQL是新数据，Redis是旧数据，不一致
```

**场景2：并发访问问题**

```
线程A: 更新MySQL → 更新Redis
线程B: 读取Redis（在A更新Redis之前）→ 读取到旧数据
结果：数据不一致
```

## 四、解决方案分析

在这个情况下，能够选择的方法只有几种：

### 4.1 方案一：先更新数据库，再更新缓存

**流程：**

```
1. 更新MySQL数据库
2. 更新Redis缓存
```

**优点：**
- 实现简单
- 数据库是数据源，优先保证数据库正确

**缺点：**
- **如果缓存更新失败，就会导致数据库和Redis的数据是不一致的**
- 并发场景下可能出现数据不一致

**问题场景：**

```
时间线：
T1: 线程A更新MySQL（数据=100）
T2: 线程B更新MySQL（数据=200）
T3: 线程B更新Redis（数据=200）
T4: 线程A更新Redis（数据=100）
结果：MySQL=200，Redis=100，不一致
```

### 4.2 方案二：先删除缓存，再更新数据库

**流程：**

```
1. 删除Redis缓存
2. 更新MySQL数据库
```

**优点：**
- 如果缓存删除失败，下次读取会从数据库加载，保证一致性
- 避免了缓存更新失败的问题

**缺点：**
- 在极端情况下，仍然存在数据不一致的问题

**理想情况：**

如果是先删除缓存再更新数据库，理想情况下是应用下次访问Redis的时候发现Redis里面的数据是空的，那么就会从数据库加载保存到Redis里面，也许数据理论上是一致的。

**极端情况：**

但是在极端情况下，由于**删除Redis**和更新数据库这两个操作，并不是**原子操作**。所以在这个过程中，如果出现其他线程来**访问**，还是会存在数据不一致的问题。

**问题场景：**

```
时间线：
T1: 线程A删除Redis缓存
T2: 线程B读取Redis（未命中）→ 从MySQL读取旧数据（数据=100）
T3: 线程A更新MySQL（数据=200）
T4: 线程B写入Redis（数据=100）
结果：MySQL=200，Redis=100，不一致
```

### 4.3 方案三：延迟双删

**流程：**

```
1. 删除Redis缓存
2. 更新MySQL数据库
3.  sleep(延迟时间)
4. 再次删除Redis缓存
```

**优点：**
- 可以解决方案二的极端情况
- 通过延迟删除，确保缓存最终一致

**缺点：**
- 延迟时间难以确定
- 影响性能
- 仍然无法保证强一致性

### 4.4 方案对比

| 方案 | 优点 | 缺点 | 适用场景 |
|------|------|------|----------|
| 先更新DB，再更新缓存 | 实现简单 | 缓存更新失败导致不一致 | 对一致性要求不高的场景 |
| 先删除缓存，再更新DB | 避免缓存更新失败 | 极端情况下仍不一致 | 一般业务场景 |
| 延迟双删 | 解决极端情况 | 延迟时间难确定，影响性能 | 对一致性要求较高的场景 |

## 五、最终一致性方案

所以，如果需要在极端情况下，仍然去保证Redis和MySQL的数据一致性，就只能采用**最终一致性**的方案。

### 5.1 基于消息队列的最终一致性

**方案：基于RocketMQ的可靠性消息通信，来实现数据的最终一致性。**

**架构：**

```
应用程序
    ↓
更新MySQL数据库
    ↓
发送消息到RocketMQ
    ↓
消息消费者
    ↓
更新Redis缓存
```

**流程：**

1. 应用程序更新MySQL数据库
2. 发送消息到RocketMQ（保证消息可靠性）
3. 消息消费者消费消息，更新Redis缓存
4. 如果更新失败，消息会重试，直到成功

**优点：**
- 解耦数据库和缓存更新
- 通过消息队列保证可靠性
- 支持重试机制

**缺点：**
- 存在延迟，不是强一致性
- 需要额外的消息队列组件
- 系统复杂度增加

**实现示例：**

```java
// 伪代码示例
@Transactional
public void updateUser(User user) {
    // 1. 更新数据库
    userMapper.update(user);
    
    // 2. 发送消息到MQ
    messageProducer.send("user-update", user);
}

// 消息消费者
@RocketMQMessageListener(topic = "user-update")
public class UserUpdateListener implements MessageListener {
    @Override
    public void consume(Message message) {
        User user = JSON.parseObject(message.getBody(), User.class);
        // 更新Redis缓存
        redisTemplate.opsForValue().set("user:" + user.getId(), user);
    }
}
```

### 5.2 基于Canal的binlog同步

**方案：直接通过Canal组件，监控MySQL里面的binlog日志，把更新后的数据同步到Redis里面。**

**架构：**

```
MySQL数据库
    ↓
binlog日志
    ↓
Canal组件（监控binlog）
    ↓
解析binlog变更
    ↓
更新Redis缓存
```

**流程：**

1. Canal监控MySQL的binlog日志
2. 当MySQL数据发生变化时，binlog会记录变更
3. Canal解析binlog，获取变更数据
4. 将变更数据同步到Redis

**优点：**
- 完全解耦，应用程序无需关心缓存更新
- 基于binlog，数据变更都能捕获
- 不影响业务代码

**缺点：**
- 需要部署Canal组件
- 存在延迟，不是强一致性
- 需要处理binlog解析的复杂性

**实现原理：**

```java
// Canal客户端伪代码
public class CanalClient {
    public void process() {
        // 连接Canal
        CanalConnector connector = CanalConnectors.newSingleConnector(
            new InetSocketAddress("127.0.0.1", 11111), 
            "example", "", "");
        
        connector.connect();
        connector.subscribe(".*\\..*");
        
        while (true) {
            Message message = connector.getWithoutAck(100);
            List<Entry> entries = message.getEntries();
            for (Entry entry : entries) {
                if (entry.getEntryType() == EntryType.ROWDATA) {
                    RowChange rowChange = CanalEntry.RowChange.parseFrom(entry.getStoreValue());
                    // 解析变更数据
                    // 更新Redis缓存
                }
            }
            connector.ack(message.getId());
        }
    }
}
```

### 5.3 最终一致性的特点

因为这里是基于最终一致性来实现的，如果业务场景不能去接受数据的短期不一致性，那么就不能使用这样的方案来实现。

**最终一致性的特点：**
- **不是强一致性**：在短时间内，Redis和MySQL的数据可能不一致
- **最终会一致**：通过异步同步，最终数据会达到一致
- **适合大多数场景**：大多数业务场景可以接受短期不一致

**不适合的场景：**
- 金融支付场景（需要强一致性）
- 库存扣减场景（需要强一致性）
- 对数据一致性要求极高的场景

## 六、面试技巧

### 6.1 反问业务场景

在面试的时候，面试官喜欢就问各种没有场景化的纯粹的技术问题。比如说：

> "你这个最终一致性方案还是会存在数据不一致性的问题啊，那怎么解决呢？"

**先不用慌。技术是为了业务服务的。所有不同的业务场景对于技术的选择和方案的设计都是不同的。**

所以在这个时候可以**反问面试官具体的业务场景是什么？**

**示例回答：**

> "这个问题很好。我想先了解一下具体的业务场景：
> - 这个数据的一致性要求有多高？
> - 是否可以接受短期的数据不一致？
> - 数据变更的频率如何？
> - 对性能的要求是什么？
> 
> 因为不同的业务场景，我们选择的方案是不同的。比如：
> - 如果是用户昵称更新，可以接受短期不一致，使用最终一致性方案
> - 如果是库存扣减，需要强一致性，可能需要使用分布式事务或者直接操作数据库
> - 如果是商品信息展示，可以接受最终一致性，使用Canal同步方案"

### 6.2 核心思想

**一定要知道的是：一个技术方案不可能覆盖住所有的场景。**

**技术选型原则：**
- 根据业务场景选择合适的技术方案
- 没有银弹，没有完美的方案
- 需要在一致性、性能、复杂度之间权衡
- 优先考虑业务需求，再选择技术方案

## 七、方案选择指南

### 7.1 强一致性场景

**适用场景：**
- 金融支付
- 库存扣减
- 账户余额

**方案：**
- 使用分布式事务（如Seata）
- 直接操作数据库，不使用缓存
- 使用强一致性存储（如TiDB）

### 7.2 最终一致性场景

**适用场景：**
- 用户信息更新
- 商品信息更新
- 文章内容更新

**方案：**
- 基于消息队列的最终一致性
- 基于Canal的binlog同步
- 延迟双删

### 7.3 可接受不一致场景

**适用场景：**
- 统计数据
- 排行榜
- 热点数据

**方案：**
- 定期刷新缓存
- 设置缓存过期时间
- 简单的更新策略

## 八、最佳实践

### 8.1 设计原则

1. **优先保证数据库一致性**：数据库是数据源，优先保证数据库正确
2. **根据业务场景选择方案**：没有完美的方案，只有合适的方案
3. **考虑并发场景**：设计时要考虑多线程并发访问
4. **监控和告警**：建立监控机制，及时发现数据不一致

### 8.2 实施建议

1. **评估业务需求**：明确一致性要求
2. **选择合适方案**：根据场景选择方案
3. **设计降级策略**：缓存异常时的降级方案
4. **建立监控体系**：监控数据一致性
5. **定期演练**：定期进行故障演练

## 九、总结

Redis和MySQL数据一致性保证是一个复杂的问题，需要从多个维度来考虑：

1. **理解问题本质**：两个独立存储系统，无法保证原子性
2. **分析各种方案**：先更新DB、先删除缓存、延迟双删等
3. **选择合适方案**：根据业务场景选择强一致性或最终一致性
4. **反问业务场景**：面试时要反问具体场景，不要盲目回答

**核心思想：**
- 技术是为业务服务的，没有完美的技术方案
- 不同的业务场景需要不同的解决方案
- 需要在一致性、性能、复杂度之间权衡
- 大多数场景可以接受最终一致性

通过系统性的分析和合适的技术选型，我们可以为不同的业务场景选择最合适的数据一致性方案。

你好：我的2025

上一篇：B站视频相关-4-mq

下一篇：B站视频相关-6-mysql

B站视频相关-5-mysql

最近更新

最近更新

最近更新