MySQL进阶

MySQL进阶
M-YoungBWeNMySQL进阶
取自黑马程序员,仅供学习。
在MySQL基础内容中,我们讲解了:
- 使用DDL语句来操作数据库以及表结构(数据库设计)
- 使用DML语句来完成数据库中数据的增、删、改操作(数据库操作)
我们今天还是继续学习数据库操作方面的内容:查询(DQL语句)。
查询操作我们分为两部分学习:
- DQL语句-单表操作
- DQL语句-多表操作
1. 数据库操作-DQL
1.1 介绍
DQL英文全称是Data Query Language(数据查询语言),用来查询数据库表中的记录。
查询关键字:SELECT
查询操作是所有SQL语句当中最为常见,也是最为重要的操作。在一个正常的业务系统中,查询操作的使用频次是要远高于增删改操作的。当我们打开某个网站或APP所看到的展示信息,都是通过从数据库中查询得到的,而在这个查询过程中,还会涉及到条件、排序、分页等操作。
1.2 语法
DQL查询语句,语法结构如下:
1 | SELECT |
我们今天会将上面的完整语法拆分为以下几个部分学习:
- 基本查询(不带任何条件)
- 条件查询(where)
- 分组查询(group by)
- 排序查询(order by)
- 分页查询(limit)
准备一些测试数据用于查询操作:
1 | create database db02; -- 创建数据库 |
1.3 基本查询
在基本查询的DQL语句中,不带任何的查询条件,语法如下:
-
查询多个字段
1
select 字段1, 字段2, 字段3 from 表名;
-
查询所有字段(通配符)
1
select * from 表名;
-
设置别名
1
select 字段1 [ as 别名1 ] , 字段2 [ as 别名2 ] from 表名;
-
去除重复记录
1
select distinct 字段列表 from 表名;
案例1:查询指定字段 name,entrydate并返回
1 | select name,entrydate from tb_emp; |
案例2:查询返回所有字段
1 | select * from tb_emp; |
*
号代表查询所有字段,在实际开发中尽量少用(不直观、影响效率)
案例3:查询所有员工的 name,entrydate,并起别名(姓名、入职日期)
1 | -- 方式1: |
案例4:查询已有的员工关联了哪几种职位(不要重复)
1 | select distinct job from tb_emp; |
1.4 条件查询
语法:
1 | select 字段列表 from 表名 where 条件列表 ; -- 条件列表:意味着可以有多个条件 |
学习条件查询就是学习条件的构建方式,而在SQL语句当中构造条件的运算符分为两类:
- 比较运算符
- 逻辑运算符
常用的比较运算符如下:
比较运算符 | 功能 |
---|---|
> | 大于 |
>= | 大于等于 |
< | 小于 |
<= | 小于等于 |
= | 等于 |
<> 或 != | 不等于 |
between … and … | 在某个范围之内(含最小、最大值) |
in(…) | 在in之后的列表中的值,多选一 |
like 占位符 | 模糊匹配(_匹配单个字符, %匹配任意个字符) |
is null | 是null |
常用的逻辑运算符如下:
逻辑运算符 | 功能 |
---|---|
and 或 && | 并且 (多个条件同时成立) |
or 或 || | 或者 (多个条件任意一个成立) |
not 或 ! | 非 , 不是 |
案例1:查询 姓名 为 杨逍 的员工
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
案例2:查询 id小于等于5 的员工信息
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
案例3:查询 没有分配职位 的员工信息
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
注意:查询为NULL的数据时,不能使用
= null
案例4:查询 有职位 的员工信息
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
案例5:查询 密码不等于 ‘123456’ 的员工信息
1 | -- 方式1: |
案例6:查询 入职日期 在 ‘2000-01-01’ (包含) 到 ‘2010-01-01’(包含) 之间的员工信息
1 | -- 方式1: |
案例7:查询 入职时间 在 ‘2000-01-01’ (包含) 到 ‘2010-01-01’(包含) 之间 且 性别为女 的员工信息
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
案例8:查询 职位是 2 (讲师), 3 (学工主管), 4 (教研主管) 的员工信息
1 | -- 方式1:使用or连接多个条件 |
案例9:查询 姓名 为两个字的员工信息
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
案例10:查询 姓 ‘张’ 的员工信息
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
1.5 聚合函数
之前我们做的查询都是横向查询,就是根据条件一行一行的进行判断,而使用聚合函数查询就是纵向查询,它是对一列的值进行计算,然后返回一个结果值。(将一列数据作为一个整体,进行纵向计算)
语法:
1 | select 聚合函数(字段列表) from 表名 ; |
注意 : 聚合函数会忽略空值,对NULL值不作为统计。
常用聚合函数:
函数 | 功能 |
---|---|
count | 统计数量 |
max | 最大值 |
min | 最小值 |
avg | 平均值 |
sum | 求和 |
count :按照列去统计有多少行数据。
- 在根据指定的列统计的时候,如果这一列中有null的行,该行不会被统计在其中。
sum :计算指定列的数值和,如果不是数值类型,那么计算结果为0
max :计算指定列的最大值
min :计算指定列的最小值
avg :计算指定列的平均值
案例1:统计该企业员工数量
1 | # count(字段) |
案例2:统计该企业最早入职的员工
1 | select min(entrydate) from tb_emp; |
案例3:统计该企业最迟入职的员工
1 | select max(entrydate) from tb_emp; |
案例4:统计该企业员工 ID 的平均值
1 | select avg(id) from tb_emp; |
案例5:统计该企业员工的 ID 之和
1 | select sum(id) from tb_emp; |
1.6 分组查询
分组: 按照某一列或者某几列,把相同的数据进行合并输出。
分组其实就是按列进行分类(指定列下相同的数据归为一类),然后可以对分类完的数据进行合并计算。
分组查询通常会使用聚合函数进行计算。
语法:
1 | select 字段列表 from 表名 [where 条件] group by 分组字段名 [having 分组后过滤条件]; |
案例1:根据性别分组 , 统计男性和女性员工的数量
1 | select gender, count(*) |
案例2:查询入职时间在 ‘2015-01-01’ (包含) 以前的员工 , 并对结果根据职位分组 , 获取员工数量大于等于2的职位
1 | select job, count(*) |
注意事项:
• 分组之后,查询的字段一般为聚合函数和分组字段,查询其他字段无任何意义
• 执行顺序:where > 聚合函数 > having
where与having区别(面试题)
- 执行时机不同:where是分组之前进行过滤,不满足where条件,不参与分组;而having是分组之后对结果进行过滤。
- 判断条件不同:where不能对聚合函数进行判断,而having可以。
1.7 排序查询
排序在日常开发中是非常常见的一个操作,有升序排序,也有降序排序。
语法:
1 | select 字段列表 |
-
排序方式:
-
ASC :升序(默认值)
-
DESC:降序
-
案例1:根据入职时间, 对员工进行升序排序
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
注意事项:如果是升序, 可以不指定排序方式ASC
案例2:根据入职时间,对员工进行降序排序
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
案例3:根据入职时间对公司的员工进行升序排序,入职时间相同,再按照更新时间进行降序排序
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
注意事项:如果是多字段排序,当第一个字段值相同时,才会根据第二个字段进行排序
1.8 分页查询
分页操作在业务系统开发时,也是非常常见的一个功能,日常我们在网站中看到的各种各样的分页条,后台也都需要借助于数据库的分页操作。
分页查询语法:
1 | select 字段列表 from 表名 limit 起始索引, 查询记录数 ; |
案例1:从起始索引0开始查询员工数据, 每页展示5条记录
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
案例2:查询 第1页 员工数据, 每页展示5条记录
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
案例3:查询 第2页 员工数据, 每页展示5条记录
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
案例4:查询 第3页 员工数据, 每页展示5条记录
1 | select id, username, password, name, gender, image, job, entrydate, create_time, update_time |
注意事项:
起始索引从0开始。 计算公式 : 起始索引 = (查询页码 - 1)* 每页显示记录数
分页查询是数据库的方言,不同的数据库有不同的实现,MySQL中是LIMIT
如果查询的是第一页数据,起始索引可以省略,直接简写为 limit 条数
1.9 案例
DQL的基本语法我们学习结束了,接下来我们就运用所掌握的DQL语句的语法来完成两个案例。
1.9.1 案例一
案例:根据需求完成员工管理的条件分页查询
分析:根据输入的条件,查询第1页数据
在员工管理的列表上方有一些查询条件:员工姓名、员工性别,员工入职时间(开始时间~结束时间)
- 姓名:张
- 性别:男
- 入职时间:2000-01-01 ~ 2015-12-31
除了查询条件外,在列表的下面还有一个分页条,这就涉及到了分页查询
- 查询第1页数据(每页显示10条数据)
基于查询的结果,按照修改时间进行降序排序
结论:条件查询 + 分页查询 + 排序查询
SQL语句代码:
1 | -- 根据输入条件查询第1页数据(每页展示10条记录) |
1.9.2 案例二
案例:根据需求完成员工信息的统计
分析:以上信息统计在开发中也叫图形报表(将统计好的数据以可视化的形式展示出来)
- 员工性别统计:以饼状图的形式展示出企业男性员人数和女性员工人数
- 只要查询出男性员工和女性员工各自有多少人就可以了
- 员工职位统计:以柱状图的形式展示各职位的在岗人数
- 只要查询出各个职位有多少人就可以了
员工性别统计:
1 | -- if(条件表达式, true取值 , false取值) |
if(表达式, tvalue, fvalue) :当表达式为true时,取值tvalue;当表达式为false时,取值fvalue
员工职位统计:
1 | -- case 表达式 when 值1 then 结果1 when 值2 then 结果2 ... else result end |
case 表达式 when 值1 then 结果1 [when 值2 then 结果2 …] [else result] end
2. 多表设计
关于单表的操作(单表的设计、单表的增删改查)我们就已经学习完了。接下来我们就要来学习多表的操作,首先来学习多表的设计。
项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系,基本上分为三种:
-
一对多(多对一)
-
多对多
-
一对一
2.1 一对多
2.1.1 表设计
需求:根据页面原型及需求文档 ,完成部门及员工的表结构设计
- 员工管理页面原型:(前面已完成tb_emp表结构设计)
- 部门管理页面原型:
经过上述分析,现已明确的部门表结构:
- 业务字段 : 部门名称
- 基础字段 : id(主键)、创建时间、修改时间
部门表 - SQL语句:
1 | # 建议:创建新的数据库(多表设计存放在新数据库下) |
部门表创建好之后,我们还需要再修改下员工表。为什么要修改员工表呢?是因为我们之前设计员工表(单表)的时候,并没有考虑员工的归属部门。
员工表:添加归属部门字段
1 | -- 员工表 |
测试数据:
1 | -- 部门表测试数据 |
员工表 - 部门表之间的关系:
一对多关系实现:在数据库表中多的一方,添加字段,来关联属于一这方的主键。
2.1.2 外键约束
问题
- 表结构创建完毕后,我们看到两张表的数据分别为:
现在员工表中有五个员工都归属于1号部门(学工部),当删除了1号部门后,数据变为:
1号部门被删除了,但是依然还有5个员工是属于1号部门的。 此时:就出现数据的不完整、不一致了。
问题分析
目前上述的两张表(员工表、部门表),在数据库层面,并未建立关联,所以是无法保证数据的一致性和完整性的
问题解决
想解决上述的问题呢,我们就可以通过数据库中的 外键约束 来解决。
外键约束:让两张表的数据建立连接,保证数据的一致性和完整性。
对应的关键字:foreign key
外键约束的语法:
1 | -- 创建表时指定 |
那接下来,我们就为员工表的dept_id 建立外键约束,来关联部门表的主键。
方式1:通过SQL语句操作
1 | -- 修改表: 添加外键约束 |
方式2:图形化界面操作
当我们添加外键约束时,我们得保证当前数据库表中的数据是完整的。 所以,我们需要将之前删除掉的数据再添加回来。
当我们添加了外键之后,再删除ID为1的部门,就会发现,此时数据库报错了,不允许删除。
外键约束(foreign key):保证了数据的完整性和一致性。
物理外键和逻辑外键
-
物理外键
- 概念:使用foreign key定义外键关联另外一张表。
- 缺点:
- 影响增、删、改的效率(需要检查外键关系)。
- 仅用于单节点数据库,不适用与分布式、集群场景。
- 容易引发数据库的死锁问题,消耗性能。
-
逻辑外键
- 概念:在业务层逻辑中,解决外键关联。
- 通过逻辑外键,就可以很方便的解决上述问题。
**在现在的企业开发中,很少会使用物理外键,都是使用逻辑外键。 甚至在一些数据库开发规范中,会明确指出禁止使用物理外键 foreign key **
2.2 一对一
一对一关系表在实际开发中应用起来比较简单,通常是用来做单表的拆分,也就是将一张大表拆分成两张小表,将大表中的一些基础字段放在一张表当中,将其他的字段放在另外一张表当中,以此来提高数据的操作效率。
一对一的应用场景: 用户表(基本信息+身份信息)
- 基本信息:用户的ID、姓名、性别、手机号、学历
- 身份信息:民族、生日、身份证号、身份证签发机关,身份证的有效期(开始时间、结束时间)
如果在业务系统当中,对用户的基本信息查询频率特别的高,但是对于用户的身份信息查询频率很低,此时出于提高查询效率的考虑,我就可以将这张大表拆分成两张小表,第一张表存放的是用户的基本信息,而第二张表存放的就是用户的身份信息。他们两者之间一对一的关系,一个用户只能对应一个身份证,而一个身份证也只能关联一个用户。
那么在数据库层面怎么去体现上述两者之间是一对一的关系呢?
其实一对一我们可以看成一种特殊的一对多。一对多我们是怎么设计表关系的?是不是在多的一方添加外键。同样我们也可以通过外键来体现一对一之间的关系,我们只需要在任意一方来添加一个外键就可以了。
一对一 :在任意一方加入外键,关联另外一方的主键,并且设置外键为唯一的(UNIQUE)
SQL脚本:
1 | -- 用户基本信息表 |
2.3 多对多
多对多的关系在开发中属于也比较常见的。比如:学生和老师的关系,一个学生可以有多个授课老师,一个授课老师也可以有多个学生。在比如:学生和课程的关系,一个学生可以选修多门课程,一个课程也可以供多个学生选修。
案例:学生与课程的关系
-
关系:一个学生可以选修多门课程,一门课程也可以供多个学生选择
-
实现关系:建立第三张中间表,中间表至少包含两个外键,分别关联两方主键
SQL脚本:
1 | -- 学生表 |
2.4 案例
下面通过一个综合案例加深对于多表关系的理解,并掌握多表设计的流程。
需求
步骤
-
阅读页面原型及需求文档,分析各个模块涉及到的表结构,及表结构之间的关系。
-
根据页面原型及需求文档,分析各个表结构中具体的字段及约束。
分析
- 页面原型-分类管理
分类的信息:分类名称、分类类型[菜品/套餐]、分类排序、分类状态[禁用/启用]、分类的操作时间(修改时间)。
- 页面原型-菜品管理
菜品的信息:菜品名称、菜品图片、菜品分类、菜品售价、菜品售卖状态、菜品的操作时间(修改时间)。
思考:分类与菜品之间是什么关系?
- 思考逻辑:一个分类下可以有多个菜品吗?反过来再想一想,一个菜品会对应多个分类吗?
答案:一对多关系。一个分类下会有多个菜品,而一个菜品只能归属一个分类。
设计表原则:在多的一方,添加字段,关联属于一这方的主键。
- 页面原型-套餐管理
套餐的信息:套餐名称、套餐图片、套餐分类、套餐价格、套餐售卖状态、套餐的操作时间。
思考:套餐与菜品之间是什么关系?
- 思考逻辑:一个套餐下可以有多个菜品吗?反过来再想一想,一个菜品可以出现在多个套餐中吗?
答案:多对多关系。一个套餐下会有多个菜品,而一个菜品也可以出现在多个套餐中。
设计表原则:创建第三张中间表,建立两个字段分别关联菜品表的主键和套餐表的主键。
分析页面原型及需求文档后,我们获得:
- 分类表
- 业务字段:分类名称、分类类型、分类排序、分类状态
- 基础字段:id(主键)、分类的创建时间、分类的修改时间
- 菜品表
- 业务字段:菜品名称、菜品图片、菜品分类、菜品售价、菜品售卖状态
- 基础字段:id(主键)、分类的创建时间、分类的修改时间
- 套餐表
- 业务字段:套餐名称、套餐图片、套餐分类、套餐价格、套餐售卖状态
- 基础字段:id(主键)、分类的创建时间、分类的修改时间
表结构之间的关系:
- 分类表 - 菜品表 : 一对多
- 在菜品表中添加字段(菜品分类),关联分类表
- 菜品表 - 套餐表 : 多对多
- 创建第三张中间表(套餐菜品关联表),在中间表上添加两个字段(菜品id、套餐id),分别关联菜品表和分类表
表结构
分类表:category
- 业务字段:分类名称、分类类型、分类排序、分类状态
- 基础字段:id(主键)、创建时间、修改时间
1 | -- 分类表 |
菜品表:dish
- 业务字段:菜品名称、菜品图片、菜品分类、菜品售价、菜品售卖状态
- 基础字段:id(主键)、分类的创建时间、分类的修改时间
1 | -- 菜品表 |
套餐表:setmeal
- 业务字段:套餐名称、套餐图片、套餐分类、套餐价格、套餐售卖状态
- 基础字段:id(主键)、分类的创建时间、分类的修改时间
1 | -- 套餐表 |
套餐菜品关联表:setmeal_dish
1 | -- 套餐菜品关联表 |
3. 多表查询
3.1 概述
3.1.1 数据准备
SQL脚本:
1 | #建议:创建新的数据库 |
3.1.2 介绍
多表查询:查询时从多张表中获取所需数据
单表查询的SQL语句:select 字段列表 from 表名;
那么要执行多表查询,只需要使用逗号分隔多张表即可,如: select 字段列表 from 表1, 表2;
查询用户表和部门表中的数据:
1 | select * from tb_emp , tb_dept; |
此时,我们看到查询结果中包含了大量的结果集,总共85条记录,而这其实就是员工表所有的记录(17行)与部门表所有记录(5行)的所有组合情况,这种现象称之为笛卡尔积。
笛卡尔积:笛卡尔乘积是指在数学中,两个集合(A集合和B集合)的所有组合情况。
在多表查询时,需要消除无效的笛卡尔积,只保留表关联部分的数据
在SQL语句中,如何去除无效的笛卡尔积呢?只需要给多表查询加上连接查询的条件即可。
1 | select * from tb_emp , tb_dept where tb_emp.dept_id = tb_dept.id ; |
由于id为17的员工,没有dept_id字段值,所以在多表查询时,根据连接查询的条件并没有查询到。
3.1.3 分类
多表查询可以分为:
-
连接查询
- 内连接:相当于查询A、B交集部分数据
-
外连接
-
左外连接:查询左表所有数据(包括两张表交集部分数据)
-
右外连接:查询右表所有数据(包括两张表交集部分数据)
-
-
子查询
3.2 内连接
内连接查询:查询两表或多表中交集部分数据。
内连接从语法上可以分为:
-
隐式内连接
-
显式内连接
隐式内连接语法:
1 | select 字段列表 from 表1 , 表2 where 条件 ... ; |
显式内连接语法:
1 | select 字段列表 from 表1 [ inner ] join 表2 on 连接条件 ... ; |
案例:查询员工的姓名及所属的部门名称
- 隐式内连接实现
1 | select tb_emp.name , tb_dept.name -- 分别查询两张表中的数据 |
- 显式内连接实现
1 | select tb_emp.name , tb_dept.name |
多表查询时给表起别名:
-
tableA as 别名1 , tableB as 别名2 ;
-
tableA 别名1 , tableB 别名2 ;
使用了别名的多表查询:
1 | select emp.name , dept.name |
注意事项:
一旦为表起了别名,就不能再使用表名来指定对应的字段了,此时只能够使用别名来指定字段。
3.3 外连接
外连接分为两种:左外连接 和 右外连接。
左外连接语法结构:
1 | select 字段列表 from 表1 left [ outer ] join 表2 on 连接条件 ... ; |
左外连接相当于查询表1(左表)的所有数据,当然也包含表1和表2交集部分的数据。
右外连接语法结构:
1 | select 字段列表 from 表1 right [ outer ] join 表2 on 连接条件 ... ; |
右外连接相当于查询表2(右表)的所有数据,当然也包含表1和表2交集部分的数据。
案例:查询员工表中所有员工的姓名, 和对应的部门名称
1 | -- 左外连接:以left join关键字左边的表为主表,查询主表中所有数据,以及和主表匹配的右边表中的数据 |
案例:查询部门表中所有部门的名称, 和对应的员工名称
1 | -- 右外连接 |
注意事项:
左外连接和右外连接是可以相互替换的,只需要调整连接查询时SQL语句中表的先后顺序就可以了。而我们在日常开发使用时,更偏向于左外连接。
3.4 子查询
3.4.1 介绍
SQL语句中嵌套select语句,称为嵌套查询,又称子查询。
1 | SELECT * FROM t1 WHERE column1 = ( SELECT column1 FROM t2 ... ); |
子查询外部的语句可以是insert / update / delete / select 的任何一个,最常见的是 select。
根据子查询结果的不同分为:
-
标量子查询(子查询结果为单个值[一行一列])
-
列子查询(子查询结果为一列,但可以是多行)
-
行子查询(子查询结果为一行,但可以是多列)
-
表子查询(子查询结果为多行多列[相当于子查询结果是一张表])
子查询可以书写的位置:
- where之后
- from之后
- select之后
3.4.2 标量子查询
子查询返回的结果是单个值(数字、字符串、日期等),最简单的形式,这种子查询称为标量子查询。
常用的操作符: = <> > >= < <=
案例1:查询"教研部"的所有员工信息
可以将需求分解为两步:
- 查询 “教研部” 部门ID
- 根据 “教研部” 部门ID,查询员工信息
1 | -- 1.查询"教研部"部门ID |
案例2:查询在 “方东白” 入职之后的员工信息
可以将需求分解为两步:
- 查询 方东白 的入职日期
- 查询 指定入职日期之后入职的员工信息
1 | -- 1.查询"方东白"的入职日期 |
3.4.3 列子查询
子查询返回的结果是一列(可以是多行),这种子查询称为列子查询。
常用的操作符:
操作符 | 描述 |
---|---|
IN | 在指定的集合范围之内,多选一 |
NOT IN | 不在指定的集合范围之内 |
案例:查询"教研部"和"咨询部"的所有员工信息
分解为以下两步:
- 查询 “销售部” 和 “市场部” 的部门ID
- 根据部门ID, 查询员工信息
1 | -- 1.查询"销售部"和"市场部"的部门ID |
3.4.4 行子查询
子查询返回的结果是一行(可以是多列),这种子查询称为行子查询。
常用的操作符:= 、<> 、IN 、NOT IN
案例:查询与"韦一笑"的入职日期及职位都相同的员工信息
可以拆解为两步进行:
- 查询 “韦一笑” 的入职日期 及 职位
- 查询与"韦一笑"的入职日期及职位相同的员工信息
1 | -- 查询"韦一笑"的入职日期 及 职位 |
3.4.5 表子查询
子查询返回的结果是多行多列,常作为临时表,这种子查询称为表子查询。
案例:查询入职日期是 “2006-01-01” 之后的员工信息 , 及其部门信息
分解为两步执行:
- 查询入职日期是 “2006-01-01” 之后的员工信息
- 基于查询到的员工信息,在查询对应的部门信息
1 | select * from emp where entrydate > '2006-01-01'; |
3.5 案例
基于之前设计的多表案例的表结构,我们来完成今天的多表查询案例需求。
准备环境
将资料中准备好的多表查询的数据准备的SQL脚本导入数据库中。
- 分类表:category
- 菜品表:dish
- 套餐表:setmeal
- 套餐菜品关系表:setmeal_dish
需求实现
- 查询价格低于 10元 的菜品的名称 、价格 及其 菜品的分类名称
1 | /*查询技巧: |
- 查询所有价格在 10元(含)到50元(含)之间 且 状态为"起售"的菜品名称、价格及其分类名称 (即使菜品没有分类 , 也要将菜品查询出来)
1 | select d.name , d.price, c.name |
- 查询每个分类下最贵的菜品, 展示出分类的名称、最贵的菜品的价格
1 | select c.name , max(d.price) |
- 查询各个分类下 菜品状态为 “起售” , 并且 该分类下菜品总数量大于等于3 的 分类名称
1 | /*查询技巧: |
- 查询出 “商务套餐A” 中包含了哪些菜品 (展示出套餐名称、价格, 包含的菜品名称、价格、份数)
1 | select s.name, s.price, d.name, d.price, sd.copies |
- 查询出低于菜品平均价格的菜品信息 (展示出菜品名称、菜品价格)
1 | -- 1.计算菜品平均价格 |
4. 事务
场景:学工部整个部门解散了,该部门及部门下的员工都需要删除了。
-
操作:
1
2
3
4
5-- 删除学工部
delete from dept where id = 1; -- 删除成功
-- 删除学工部的员工
delete from emp where dept_id = 1; -- 删除失败(操作过程中出现错误:造成删除没有成功) -
问题:如果删除部门成功了,而删除该部门的员工时失败了,此时就造成了数据的不一致。
要解决上述的问题,就需要通过数据库中的事务来解决。
4.1 介绍
在实际的业务开发中,有些业务操作要多次访问数据库。一个业务要发送多条SQL语句给数据库执行。需要将多次访问数据库的操作视为一个整体来执行,要么所有的SQL语句全部执行成功。如果其中有一条SQL语句失败,就进行事务的回滚,所有的SQL语句全部执行失败。
简而言之:事务是一组操作的集合,它是一个不可分割的工作单位。事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。
事务作用:保证在一个事务中多次操作数据库表中数据时,要么全都成功,要么全都失败。
4.2 操作
MYSQL中有两种方式进行事务的操作:
- 自动提交事务:即执行一条sql语句提交一次事务。(默认MySQL的事务是自动提交)
- 手动提交事务:先开启,再提交
事务操作有关的SQL语句:
SQL语句 | 描述 |
---|---|
start transaction; / begin ; | 开启手动控制事务 |
commit; | 提交事务 |
rollback; | 回滚事务 |
手动提交事务使用步骤:
- 第1种情况:开启事务 => 执行SQL语句 => 成功 => 提交事务
- 第2种情况:开启事务 => 执行SQL语句 => 失败 => 回滚事务
使用事务控制删除部门和删除该部门下的员工的操作:
1 | -- 开启事务 |
- 上述的这组SQL语句,如果如果执行成功,则提交事务
1 | -- 提交事务 (成功时执行) |
- 上述的这组SQL语句,如果如果执行失败,则回滚事务
1 | -- 回滚事务 (出错时执行) |
4.3 四大特性
面试题:事务有哪些特性?
- 原子性(Atomicity):事务是不可分割的最小单元,要么全部成功,要么全部失败。
- 一致性(Consistency):事务完成时,必须使所有的数据都保持一致状态。
- 隔离性(Isolation):数据库系统提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下运行。
- 持久性(Durability):事务一旦提交或回滚,它对数据库中的数据的改变就是永久的。
事务的四大特性简称为:ACID
-
原子性(Atomicity) :原子性是指事务包装的一组sql是一个不可分割的工作单元,事务中的操作要么全部成功,要么全部失败。
-
一致性(Consistency):一个事务完成之后数据都必须处于一致性状态。
如果事务成功的完成,那么数据库的所有变化将生效。
如果事务执行出现错误,那么数据库的所有变化将会被回滚(撤销),返回到原始状态。
- 隔离性(Isolation):多个用户并发的访问数据库时,一个用户的事务不能被其他用户的事务干扰,多个并发的事务之间要相互隔离。
一个事务的成功或者失败对于其他的事务是没有影响。
- 持久性(Durability):一个事务一旦被提交或回滚,它对数据库的改变将是永久性的,哪怕数据库发生异常,重启之后数据亦然存在。
4. 索引
4.1 介绍
索引(index):是帮助数据库高效获取数据的数据结构 。
- 简单来讲,就是使用索引可以提高查询的效率。
测试没有使用索引的查询:
添加索引后查询:
1 | -- 添加索引 |
优点:
- 提高数据查询的效率,降低数据库的IO成本。
- 通过索引列对数据进行排序,降低数据排序的成本,降低CPU消耗。
缺点:
- 索引会占用存储空间。
- 索引大大提高了查询效率,同时却也降低了insert、update、delete的效率。
4.2 结构
MySQL数据库支持的索引结构有很多,如:Hash索引、B+Tree索引、Full-Text索引等。
我们平常所说的索引,如果没有特别指明,都是指默认的 B+Tree 结构组织的索引。
在没有了解B+Tree结构前,我们先回顾下之前所学习的树结构:
二叉查找树:左边的子节点比父节点小,右边的子节点比父节点大
当我们向二叉查找树保存数据时,是按照从大到小(或从小到大)的顺序保存的,此时就会形成一个单向链表,搜索性能会打折扣。
可以选择平衡二叉树或者是红黑树来解决上述问题。(红黑树也是一棵平衡的二叉树)
但是在Mysql数据库中并没有使用二叉搜索数或二叉平衡数或红黑树来作为索引的结构。
思考:采用二叉搜索树或者是红黑树来作为索引的结构有什么问题?
答案
最大的问题就是在数据量大的情况下,树的层级比较深,会影响检索速度。因为不管是二叉搜索数还是红黑数,一个节点下面只能有两个子节点。此时在数据量大的情况下,就会造成数的高度比较高,树的高度一旦高了,检索速度就会降低。说明:如果数据结构是红黑树,那么查询1000万条数据,根据计算树的高度大概是23左右,这样确实比之前的方式快了很多,但是如果高并发访问,那么一个用户有可能需要23次磁盘IO,那么100万用户,那么会造成效率极其低下。所以为了减少红黑树的高度,那么就得增加树的宽度,就是不再像红黑树一样每个节点只能保存一个数据,可以引入另外一种数据结构,一个节点可以保存多个数据,这样宽度就会增加从而降低树的高度。这种数据结构例如BTree就满足。
下面我们来看看B+Tree(多路平衡搜索树)结构中如何避免这个问题:
B+Tree结构:
- 每一个节点,可以存储多个key(有n个key,就有n个指针)
- 节点分为:叶子节点、非叶子节点
- 叶子节点,就是最后一层子节点,所有的数据都存储在叶子节点上
- 非叶子节点,不是树结构最下面的节点,用于索引数据,存储的的是:key+指针
- 为了提高范围查询效率,叶子节点形成了一个双向链表,便于数据的排序及区间范围查询
拓展:
非叶子节点都是由key+指针域组成的,一个key占8字节,一个指针占6字节,而一个节点总共容量是16KB,那么可以计算出一个节点可以存储的元素个数:16*1024字节 / (8+6)=1170个元素。
- 查看mysql索引节点大小:show global status like ‘innodb_page_size’; – 节点大小:16384
当根节点中可以存储1170个元素,那么根据每个元素的地址值又会找到下面的子节点,每个子节点也会存储1170个元素,那么第二层即第二次IO的时候就会找到数据大概是:1170*1170=135W。也就是说B+Tree数据结构中只需要经历两次磁盘IO就可以找到135W条数据。
对于第二层每个元素有指针,那么会找到第三层,第三层由key+数据组成,假设key+数据总大小是1KB,而每个节点一共能存储16KB,所以一个第三层一个节点大概可以存储16个元素(即16条记录)。那么结合第二层每个元素通过指针域找到第三层的节点,第二层一共是135W个元素,那么第三层总元素大小就是:135W*16结果就是2000W+的元素个数。
结合上述分析B+Tree有如下优点:
- 千万条数据,B+Tree可以控制在小于等于3的高度
- 所有的数据都存储在叶子节点上,并且底层已经实现了按照索引进行排序,还可以支持范围查询,叶子节点是一个双向链表,支持从小到大或者从大到小查找
.3 语法
创建索引
1 | create [ unique ] index 索引名 on 表名 (字段名,... ) ; |
案例:为tb_emp表的name字段建立一个索引
1 | create index idx_emp_name on tb_emp(name); |
在创建表时,如果添加了主键和唯一约束,就会默认创建:主键索引、唯一约束
查看索引
1 | show index from 表名; |
案例:查询 tb_emp 表的索引信息
1 | show index from tb_emp; |
删除索引
1 | drop index 索引名 on 表名; |
案例:删除 tb_emp 表中name字段的索引
1 | drop index idx_emp_name on tb_emp; |
注意事项:
主键字段,在建表时,会自动创建主键索引
添加唯一约束时,数据库实际上会添加唯一索引