本文主要介绍了MySQL数据库的基本概念、结构、操作和查询，包括数据库管理系统、关系型数据库的概念及SQL语言的使用。文章详细阐述了SQL语句的分类，如DDL（数据定义语言）、DML（数据操作语言）和DQL（数据查询语言），并且涉及到数据库设计、事务处理和数据库优化等内容。此外，文章还强调了索引的作用及其对数据库性能的影响。整体上，这篇教程为MySQL的使用和管理提供了全面的指导。

1 概述

MySQL下载地址：https://dev.mysql.com/downloads/mysql/）
在终端连接MySQL服务器：mysql -u用户名 -p[密码] [-h数据库服务器IP地址 -P端口号]
或可在DataGrip或Idea（集成了DataGrip）的图形化界面中连接、操作MySQL数据库，如下图所示

数据库（DataBase，DB）：存储和管理数据的仓库。

数据库管理系统（DataBase Management System，DBMS）：操纵和管理数据库的大型软件。

关系型数据库（RDBMS）：建立在关系模型基础上，由多张相互连接的二维表组成的数据库。使用表存储数据，格式统一，便于维护；使用SQL语言操作，标准统一，使用方便，可用于复杂查询。

SQL（Structured Query Language，操作关系型数据库的编程语言）定义了一套操作关系型数据库的统一标准。

SQL语句可以单行或多行书写，以分号结尾
SQL语句可以使用空格/缩进来增强语句的可读性
MySQL数据库的SQL语句不区分大小写
注释：单行注释（-- 注释内容 或＃注释内容）、多行注释（/* 注释内容 */）

SQL语句分类	英文全称	中文名	说明
DDL	Data Definition Language	数组定义语言	用来定义数据库对象（数据库库，表，字段）
DML	Data Manipulation Language	数据操作语言	用来对数据库表中的数据进行增删改
DQL	Data Query Language	数据查询语言	用来查询数据库中表的记录
DCL	Data Control Language	数据控制语言	用来创建数据库用户、控制数据库的访问权限

mysql-server

demand-og

2 数据库设计——DDL

2.1 数据库操作

查询数据库

/* 查询所有数据库 */
show databases;
/* 查询当前数据库 */
select database();

使用数据库

use 数据库名;

创建数据库

create database [if not exists] 数据库名;

删除数据库

drop database [if exists] 数据库名;

方括号[]中内容表示可选；所有的database(s)可替换成schema(s)

2.2 表操作

table-op

设置create_time/update_time：用now()函数获取当前时间

创建表结构

create table 表名 (
    字段1 字段类型 [约束] [comment 字段1注释],
    字段2 字段类型 [约束] [comment 字段2注释],
    ...
    字段n 字段类型 [约束] [comment 字段n注释]
) [comment 表注释];

查询

/* 查询当前数据库所有表 */
show tables;
/* 查询表结构 */
desc 表名;
/* 查询建表语句 */
show create table 表名;

修改

/* 添加字段 */
alter table 表名 add 字段名 字段类型(长度) [comment 注释] [约束];
/* 修改字段类型 */
alter table 表名 modify 字段名 新字段类型(长度);
/* 修改字段名和字段类型 */
alter table 表名 change 旧字段名 新字段名 字段类型(长度) [comment 注释] [约束];
/* 删除字段 */
alter table 表名 drop column 字段名;
/* 修改表名 */
rename table 表名 to 新表名;

删除表结构

drop table [if exists] 表名;

2.2.1 约束

作用于表中字段上的规则，用于限制存储在表中的数据，保证数据库中数据的正确性、有效性和完整性。

约束	描述	关键字
非空约束	限制该字段值不能为null	`not null`
唯一约束	保证字段的所有数据都是唯一、不重复的	`unique`
主键约束	主键是一行数据的唯一标识，要求非空且唯一	`primary key`（`auto_increment` 自增）
默认约束	保存数据时，如果未指定该字段值，则采用默认值	`default` + 默认值
外键约束	让两张表的数据建立连接，保证数据的一致性和完整性	`foreign key`

2.2.2 数据类型

MySQL中的数据类型主要分为数值类型、字符串类型、日期时间类型，字符串和日期型数据应包含在引号中。

数值类型	大小	有符号范围`signed`	无符号范围`unsigned`	描述
tinyint	1	$(-128,\ 127)$	$(10,\ 255)$	小整数值
smallint	2	$(-32768,\ 32767)$	$(0,\ 65535)$	大整数值
mediumint	3	$(-8388608,\ 8388607)$	$(0,\ 16777215)$	大整数值
int	4	$(-2147483648,\ 2147483647)$	$(0,\ 4294967295)$	大整数值
bigint	8	$(-2^{63},\ 2^{63}-1)$	$(0,\ 2^{64}-1)$	极大整数值
float	4	`(-3.402823466e38, 3.402823466351e38)`	$0$ 和 `(1.175494351e-38, 3.402823466e38)`	单精度浮点数值，`float(n, m)`：整个数字长度为n，小数位为m
double	8	`(-1.7976931348623157e308, 1.7976931348623157e308)`	$0$ 和 `(2.2250738585072014e-308, 1.7976931348623157e308)`	双精度浮点数值，`double(n, m)`：整个数字长度为n，小数位为m
decimal	小数值（精度更高），`decimal(n, m)`：整个数字长度为n，小数位为m

字符串类型	大小	描述
char	0~255 bytes	定长字符串，`char(n)`：最多只能存n个字符，始终占用n个字符的空间，空间换时间
varchar	0~65535 bytes	变长字符串，`varchar(n)`：最多只能存n个字符，不足n个时按实际长度存储，时间换空间
tinyblob	0~255 bytes	不超过255个字符的二进制数据
tinytext	0~255 bytes	短文本字符串
blob	0~65535 bytes	二进制形式的长文本数据
text	0~65535 bytes	长文本数据
mediumblob	0~16 777 215 bytes	二进制形式的中等长度文本数据
mediumtext	0~16 777 215 bytes	中等长度文本数据
longblob	0~4 294 967 295 bytes	二进制形式的极大文本数据
longtext	0~294 967 295 bytes	极大文本数据

日期类型	大小(byte)	范围	格式	描述
date	3	1000-01-01 至 9999-12-31	`YYYY-MM-DD`	日期值
time	3	-838:59:59 至 838:59:59	`HH:MM:SS`	时间值或持续时间
year	1	1901 至 2155	`YYYY`	年份值
datetime	8	1000-01-01 00:00:00 至 9999-12-31 23:59:59	`YYYY-MM-DD HH:MM:SS`	混合日期和时间值
timestamp	4	1970-01-01 00:00:01 至2038-01-19 03:14:07	`YYYY-MM-DD HH:MM:SS`	混合日期和时间值，时间戳

3 数据库操作——DML

添加数据

/* 指定字段添加数据 */
insert into 表名 (字段名1, 字段名2) values (值1, 值2);    -- 指定的字段与值一一对应
insert into 表名 (字段名1, 字段名2) values (值1, 值2), (值1, 值2);  -- 批量添加数据
/* 全部字段添加数据 */
insert into 表名 values (值1, 值2, ...);
insert into 表名 values (值1, 值2, ...), (值1, 值2, ...); -- 批量添加数据

修改/更新数据

update 表名 set 字段名1 = 值1, 字段名2 = 值2, ... [where 条件];

删除操作（无法删除某一字段的值，可以使用UPDATE将字段的值置为NULL）

delete from 表名 [where 条件];

4 数据库查询——DQL

DQL

4.1 基本查询

/* 查询字段 */
select 字段1, 字段2, 字段3 from 表名;
select * from 表名;   -- 查询所有字段
/* 设置别名 */
select 字段1 [[as] 别名1], 字段2 [[as] 别名2] from 表名;  -- 可以省略关键字as；别名有空格则必须带引号
/* 去重查询 */
select distinct 字段列表 from 表名;

通配符(*)不直观，影响效率，实际开发中尽量少用

4.2 条件查询

where：根据条件筛选行

select 字段列表 from 表名 where 条件列表;

比较运算符	功能
`>`	大于
`>=`	大于等于
`<`	小于
`<=`	小于等于
`=`	等于
`!=`或`<>`	不等于
`between ... and ...`	在某个范围之内（闭区间）
`in (...)`	属于in之后的列表中的值之一
`like 占位符`	模糊匹配：`_`匹配1个字符，`%`匹配任意个字符（可以0个）。例：`name like '王__'`表示匹配name为王某某（两个下划线）
`is null`	为null

逻辑运算符	功能
`and`或`&&`	并且（多个条件同时成立）
`or`或`\\|\\|`	或者（多个条件任意一个成立）
`not`或`!`	非，不是

流程控制：

if函数：if(条件表达式, true取值, false取值)
case：(case 表达式 when 值1 then 结果1 [when 值2 then 结果2 ... ] [else result] end)

4.3 分组查询

group by：用于分组

聚合函数：将一列数据作为一个整体，进行纵向计算，如用select 聚合函数(字段列表) from 表名;可直接查询运算后的结果。null值不参与所有聚合函数运算。

常用的聚合函数	功能	语法说明
`count`	统计数量	`count(字段)`：统计该字段非null值数量 `count(*)`：统计所有行的数量，包括含null值的行（推荐） `count(常量)`：统计所有行的数量，包括含null值的行，效果同上
`max`	最大值	`max(字段)`
`min`	最小值	`min(字段)`
`avg`	平均值	`avg(字段)`，返回浮点数
`sum`	求和	`sum(字段)`

分组查询的字段列表一般为分组字段聚合函数，执行顺序：where > 聚合函数 > having 。

select 字段列表 from 表名 [where 条件] group by 分组字段名 [having 分组后过滤条件];

-- 例1：根据性别分组，统计男女员工的数量
select gender, count(*) from tb_emp group by gender;
-- 例2：先查询入职时间在'2015-01-01'以前的员工，并对结果根据职位分组，获取员工数量大于等于2的职位
select job, count(*) from tb_emp where entrydate <= '2015-01-01' group by job having count(*) >= 2;

having：与group by配对使用，仅用于筛选分组

where与having区别

执行时机不同：where是分组前进行过滤，不满足where条件，不参与分组；而having是分组后对结果进行过滤。

判断条件不同：where不能对聚合函数进行判断，而having可以。

4.4 排序查询

ASC：升序（默认）
DESC：降序

select 字段列表 from 表名 [where 条件] group by 分组字段名 [having 分组后过滤条件] order by 字段1 排序方式1, 字段2 排序方式2 ... ;

如果是多字段排序，当第一个字段值相同时，才会根据第二个字段进行排序。

应用：查询最值

【例】查询订单数最多的员工ID

select employeeID from employees order by count(customerID) desc limit 1;

4.5 分页查询

起始索引从0开始，计算式：起始索引$= ($页码$-1) \times$每页展示记录数

select 字段列表 from 表名 limit 起始索引, 查询记录数;

-- 例：从起始索引0开始查询员工数据，每页展示5条记录。
-- 1. 查询第1页员工数据（查询第1页时可省略起始索引0）
select * from tb_emp limit 5;
-- 2. 查询第2页员工数据
select * from tb_emp limit 5, 5;
-- 3. 查询第3页员工数据
select * from tb_emp limit 10, 5;

分页查询是数据库的方言，不同的数据库有不同的实现，MySQL中是LIMIT。

5 多表设计

项目开发中，在进行数据库表结构设计时，会根据业务需求及业务模块之间的关系，分析并设计表结构。由于业务之间相互关联，所以各个表结构之间也存在着各种联系，基本上分为三种：

一对多（多对一）
多对多
一对一

5.1 一对多

一对多关系中，"一"和"多"的双方常分别称为父表(主表)和子表（参考数据结构中的树）。

案例：部门与员工的关系。

-- 员工
create table tb_emp (
    id int unsigned primary key auto_increment comment 'ID',
    ...
    entrydate date comment '入职时间',
    dept_id int unsigned comment '归属的部门ID',       -- 关联的部门ID
    create_time datetime not null comment '创建时间',
    update_time datetime not null comment '修改时间'
) comment '员工表';

-- 部门
create table tb_dept (
    id int unsigned primary key auto_increment comment 'ID',
    name varchar(10) not null unique comment '部门名称',
    create_time datetime not null comment '创建时间',
    update_time datetime not null comment '修改时间'
) comment '部门表';

一对多

部门数据可以直接删除，然而还有部分员工归属于该部门下，此时就出现了数据的不完整、不一致问题。原因在于目前上述的两张表，在数据库层面并未建立关联，所以无法保证数据的一致性和完整性。

实现表与表之间关联的方法：外键

物理外键：使用外键约束foreign key定义外键关联另外一张表。在多的一方添加外键，关联另外一方的主键。
- 缺点
  1. 影响增、删、改的效率（需要检查外键关系）
  2. 仅用于单节点数据库，不适用与分布式、集群场景
  3. 容易引发数据库的死锁问题，消耗性能

-- 创建表时指定外键
create table 表名 (
    字段名 数据类型,
    ...
    [constraint] [外键名称] foreign key (外键字段名) references 主表 (字段名)
);

-- 建完表后，添加外键
alter table 表名 add constraint 外键名称 foreign key (外键字段名) references 主表(字段名);

逻辑外键：在业务层逻辑中，解决外键关联。可以避免物理外键的问题。

5.2 一对一

一对一关系多用于单表拆分，将一张表的基础字段放在一张表中，其他字段放在另一张表中，以提升操作效率。可以视为只有一个子表的特殊的一对多关系。

案例：用户与身份证信息的关系。
实现：在任意一方加入外键，关联另外一方的主键，并且设置外键为唯一的（UNIQUE）。

一对一

5.3 多对多

案例：学生与课程的关系，一个学生可以选修多门课程，一门课程也可以供多个学生选择。
实现：建立第三张中间表，中间表至少包含两个外键，分别关联两方主键

多对多

6 多表查询

6.1 概述

多表查询：从多张表中查询数据，分为连接查询（内连接、外连接）、子查询。

select * from tb_emp, tb_dept;  -- 该种方式使得两张表的数据两两组合，产生了大量无效数据

笛卡尔积：在数学中，两个集合（$A$ 集合和 $B$ 集合）的所有组合情况。

笛卡尔积

多表查询的目的就是消除笛卡尔积产生的无效数据，可以根据所设外键指定条件进行查询。指定字段时用表名.字段名格式。

select * from tb_emp, tb_dept where tb_emp.dept_id = tb.dept.id;

内外连接

6.2 内连接

内连接：相当于查询上图中 $A$、$B$ 交集部分数据

/* 隐式内连接 */
select 字段列表 from 表1, 表2 where 条件 ... ;
/* 显式内连接 */
select 字段列表 from 表1 [inner] join 表2 on 连接条件 ... ;

-- 例：查询员工的姓名及所属部门的名称（注：某些员工不属于任何部门，也某些部门无员工）
-- 1. 隐式内连接
select tb_emp.name, tb_dept.name from tb_emp, tb_dept where tb_emp.dept_id = tb_dept.id;
select e.name, d.name from tb_emp e, tb_dept d where e.dept_id = d.id;  -- 可先给表起别名，简化书写
-- 2. 显示内连接
select tb_emp.name, tb_dept.name from tb_emp inner join tb_dept on tb_emp.dept_id = tb.dept.id

6.3 外连接

外连接根据上图中集合位置可分为以下两类

左外连接：查询左表所有数据（包括两张表交集部分数据）
右外连接：查询右表所有数据（包括两张表交集部分数据）

/* 左外连接（更常用） */
select 字段列表 from 表1 left [outer] join 表2 on 连接条件 ... ;  -- 表1为左表
/* 右外连接（可改写为左外连接） */
select 字段列表 from 表1 right [outer] join 表2 on 连接条件 ... ; -- 表2为右表

-- 例1：查询员工表所有员工的姓名及所属部门的名称
select e.name, d.name from tb_emp e left join tb_dept d on e.dept_id = d.id;    -- 左外连接
-- 例2：查询部门表所有部门的名称及对应员工的名称
select e.name, d.name from tb_emp e right join tb_dept d on e.dept_id = d.id;   -- 右外连接

6.4 子查询

子查询/嵌套查询：SQL语句中嵌套的select语句，外部语句可为insert、update、delete、select（最常见）。根据子查询返回的结果可分为如下几类

标量子查询：子查询返回的结果为单个值（数字、字符串、日期等），是最简单的子查询。常用的操作符有=、!=、>、>=、<、<=。

-- 例1：查询部门表中教研部所有员工信息：1. 查询教研部的部门ID；2. 查询该ID的部门下的员工信息。
select * from tb_emp where dept_id = (select id from tb_dept where name = '教研部');
-- 例2：查询司马彰入职后的员工信息：1. 查询司马彰的入职时间；2. 查询在司马彰入职后的员工信息
select * from tb_emp where entrydate > (select entrydate from tb_emp where name = '司马彰');

列子查询：子查询返回的结果为一列（可以是多行）。常用的操作符有in、not in等

-- 例：查询教研部和咨询部的所有员工信息：1. 查询教研部和咨询部的ID；2. 查询这些ID的部门下的员工信息
select * from tb_emp where dept_id in (select id from tb_dept where name = '教研部' or name = '咨询部');

行子查询：子查询返回的结果为一行（可以是多列）。常用的操作符有=、!=、in、not in等

-- 例：查询与yohane的入职日期与职位都相同的员工信息：1. 查询yohane的入职日期与职位；2. 查询入职日期和职位与她都相同的员工信息
select * from tb_emp where (entrydate, job) = (select entrydate, job from tb_emp where name = 'yohane');
-- 优化写法

表子查询：子查询返回的结果为多行多列，常作为临时表使用。常用的操作符有in等

-- 例：查询入职日期是'2024-05-01'之后的员工信息，及其部门名称
select e.*, d.name from (select * from tb_emp where entrydate > '2024-05-01') e, tb_dept d where e.dept_id = d.id; -- e.*表示表e的所有信息

7 事务

事务是一组操作的集合，它是一个不可分割的工作单位。事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求，即这些操作要么同时成功，要么同时失败。
默认MySQL的事务是自动提交的，也就是说，当执行一条DML语句，MySQL会立即隐式的提交事务。

事务的控制：

/* 开启事务 */
start transaction;
begin;
/* 提交事务 */
commit;
/* 回滚事务 */
rollback;

事务的四大特性（ACID）：

原子性（Atomicity）：事务是不可分割的最小单元，要么全部成功，要么全部失败
一致性（Consistency）：事务完成时，必须使所有的数据都保持一致状态
隔离性（Isolation）：数据库系统提供的隔离机制，保证事务在不受外部并发操作影响的独立环境下运行
持久性（Durability）：事务一旦提交或回滚，它对数据库中的数据的改变就是永久的

8 数据库优化——索引

索引（index）是帮助数据库高效获取数据的数据结构。

优点
1. 提高数据查询的效率，降低效据库的I0成本。
2. 通过索引列对数据进行排序，降低致据排序的成本，降低CPU消耗。
缺点
1. 索引会占用存储空间。
2. 索引大大提高了查询效率，同时却也降低了insert、update、delete的效率。

MySQL数据库支持的索引结构有很多，如：Hash索引、B+Tree案引、Full-Text索引等。我们平常所说的案引，若无特别指明都是指默认的B+Tree结构组织的索引：

每一个结点可以存储多个key（有n个key，就有n个指针）
所有的数据都存储在叶子结点，非叶子结点仅用于索引数据
叶子结点形成了一条双向链表，便于数据的排序及区间范围查询

使用普通的二叉搜索树或红黑树作为索引结构的缺点：大数据量情况下，层级深，检索速度慢。

B+树

索引的常用操作如下

/* 为表的字段创建索引 */
create [unique] index 索引名 on 表名 (字段名, ...); -- 加上unique表示唯一索引
/* 查看索引 */
show index from 表名;
/* 删除索引 */
drop index 索引名 on 表名;

主键字段在建表时，会自动创建主键索引。

添加唯一约束时，数据库实际上会添加唯一索引。

9 其他

9.1 视图

创建视图：

create view 视图名 as ...(select语句)

KINA-0

Start having fun with KINA right now!

MySQL基础：SQL基本操作（DDL、DML、DQL…）

1 概述

2 数据库设计——DDL

2.1 数据库操作

2.2 表操作

2.2.1 约束

2.2.2 数据类型

3 数据库操作——DML

4 数据库查询——DQL

4.1 基本查询

4.2 条件查询

4.3 分组查询

4.4 排序查询

4.5 分页查询

5 多表设计

5.1 一对多

5.2 一对一

5.3 多对多

6 多表查询

6.1 概述

6.2 内连接

6.3 外连接

6.4 子查询

7 事务

8 数据库优化——索引

9 其他

9.1 视图

发表评论取消回复

2025 年 1 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

KINA-0

Start having fun with KINA right now!

1 概述

2 数据库设计——DDL

2.1 数据库操作

2.2 表操作

2.2.1 约束

2.2.2 数据类型

3 数据库操作——DML

4 数据库查询——DQL

4.1 基本查询

4.2 条件查询

4.3 分组查询

4.4 排序查询

4.5 分页查询

5 多表设计

5.1 一对多

5.2 一对一

5.3 多对多

6 多表查询

6.1 概述

6.2 内连接

6.3 外连接

6.4 子查询

7 事务

8 数据库优化——索引

9 其他

9.1 视图

发表评论 取消回复

发表评论取消回复