数据库系列 | MySQL设计三范式和反范式

2023-03-10 01:13:37 来源：腾讯云

Part1概述

为了建立冗余较小、结构合理的数据库，设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。

(资料图)

范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库，必须满足一定的范式。

目前关系型数据库有六种范式，分别为：

第一范式（1NF）第二范式（2NF）第三范式（3NF）第四范式（4NF）第五范式（5NF）第六范式（6NF）

要求最低的范式是第一范式。第二范式在第一范式的基础上又进一步的添加了要求，其余范式依次类推。

一般说来，数据库只需满足第三范式就行了，而通常我们用的最多的就是第一范式、第二范式、第三范式，也就是接下来要讲的“三大范式”。

Part2第一设计范式

核心：确保每列保持原子性

第一范式是最基本的范式。如果数据库表中的所有字段值都是不可分解的原子值，就说明该数据库表满足了第一范式。

第一设计范式要求表中字段都是不可再分的，如果实体中的某个属性有多个值时，必须拆分为不同的属性。

通俗理解即一个字段只存储一项信息，如下图所示，其中联系方式可以拆分为手机、邮箱、固定电话，所以下图不符合数据表第一设计范式要求：

纠正之后符合第一设计范式要求的如下图所示:

Part3第二设计范式

第二设计范式要求表中必须存在业务主键，并且全部非主键依赖于业务主键，确保表中的每列都和主键相关。

第二范式（2NF）是在第一范式（1NF）的基础上建立起来的，即满足第二范式（2NF）必须先满足第一范式（1NF）。

第二范式（2NF）要求数据库表中的每个实例或行必须可以被惟一地区分，为实现区分通常需要我们设计一个主键来实现（这里的主键不包含业务逻辑）。

即满足第一范式前提，当存在多个主键的时候，才会发生不符合第二范式的情况。比如有两个主键，不能存在这样的属性，它只依赖于其中一个主键，这就是不符合第二范式。

通俗理解是任意一个字段都只依赖表中的同一个字段。（涉及到表的拆分）。如下图数据表字段中 id 即为业务主键：

Part4第三设计范式

满足第三范式（3NF）必须先满足第二范式（2NF），简而言之，第三范式（3NF）要求一个数据库表中不包含已在其它表中已包含的非主键字段。就是说表的信息如果能够被推导出来，就不应该单独的设计一个字段来存放（能尽量外键 join 就用外键 join）。很多时候我们为了满足第三范式往往会把一张表分成多张表。

即满足第二范式前提，如果某一属性依赖于其他非主键属性，而其他非主键属性又依赖于主键，那么这个属性就是间接依赖于主键，这被称作传递依赖于主属性。通俗解释就是一张表最多只存两层同类型信息。

如下图所示的商品表不符合第三设计范式：

如图所示，商品分类和分类描述字段冗余，每次添加相同分类商品都会使数据重复，浪费存储空间，可以将表拆分成如下三个表:

‍

遵循数据表设计三范式可以避免字段值的重复存储，提升存储效率，节省存储空间，将各个数据之间分的更细，增加表的冗余性，为后期维护和拓展打下坚实的基础。

高性能的 MySQL 数据库第一步就是从数据表合理设计开始的。