2 第二章 SQL

SQL（Structured Query Language，结构化查询语言）：操作关系型数据库的编程语言，定义了一套操作关系型数据库统一标准。

2.1 SQL的通用语法和分类

2.1.1 SQL的通用语法

在学习具体的SQL语句之前，先来了解一下SQL语言的同于语法。

SQL语句可以单行或多行书写，以分号结尾。
SQL语句可以使用空格/缩进来增强语句的可读性。
MySQL数据库的SQL语句不区分大小写，关键字建议使用大写。
注释：
- 单行注释：– 注释内容或 # 注释内容
- 多行注释：/* 注释内容 */

2.2 SQL语句的分类

SQL语句，根据其功能，主要分为四类：DDL、DML、DQL、DCL

表1.1: SQL语句的分类
分类	全称	说明
DDL	Data Definition Language	数据定义语言，用来定义/创建数据库对象(数据库，表，字段)
DML	Data Manipulation Language	数据操作语言，用来对数据库表中的数据进行增删改
DQL	Data Query Language	数据查询语言，用来查询数据库中表的记录
DCL	Data Control Language	数据控制语言，用来创建数据库用户、控制数据库的访问权限

2.3 数据类型

MySQL中的数据类型有很多，主要分为三类：数值类型、字符串类型、日期时间类型。

2.3.1 数值型

表2.1: 数值类型
类型	大小	有符号SIGNED范围	无符号范围
TINYINT	1byte	(-128，127)	(0，255)
SMALLINT	2bytes	(-32768，32767)	(0，65535)
MEDIUMINT	3bytes	(-8388608，8388607)	(0，16777215)
INT/INTEGER	4bytes	(-2147483648，2147483647)	(0，4294967295)
BIGINT	8bytes	(-2^63，2^63-1)	(0，2^64-1)
FLOAT	4bytes	(-3.402823466 E+38，3.402823466351 E+38)	0和(1.175494351 E-38，3.402823466 E+38)
DOUBLE	8bytes	(-1.7976931348623157E+308，1.7976931348623157E+308)	0和(2.2250738585072014E-308，1.7976931348623157E+308)
DECIMAL	不定	依赖于M(精度)和D(标度)的值	依赖于M(精度)和D(标度)的值

# 例子:

# 年龄字段 -- 不会出现负数, 而且人的年龄不会太大
age tinyint unsigned

# 分数 -- 总分100分,最长4位（100.0） 最多出现一位小数
score double(4,1)

2.3.2 字符串型

char 与 varchar 都可以描述字符串，char是定长字符串，指定长度多长，就占用多少个字符，和字段值的长度无关。而varchar是变长字符串，指定的长度为最大占用长度。相对来说，char的性能会更高些。

表2.2: 字符类型
类型	大小	描述
CHAR	0-255 bytes	定长字符串(需要指定长度)
VARCHAR	0-65535 bytes	变长字符串(需要指定长度)
TINYBLOB	0-255 bytes	不超过255个字符的二进制数据
TINYTEXT	0-255 bytes	短文本字符串
BLOB	0-65 535 bytes	二进制形式的长文本数据
TEXT	0-65 535 bytes	长文本数据
MEDIUMBLOB	0-16 777 215 bytes	二进制形式的中等长度文本数据
MEDIUMTEXT	0-16 777 215 bytes	中等长度文本数据
LONGBLOB	0-4 294 967 295 bytes	二进制形式的极大文本数据
LONGTEXT	0-4 294 967 295 bytes	极大文本数据

# 例子:

# 用户名 username ------> 长度不定, 最长不会超过50
username varchar(50)

# 性别 gender ---------> 存储值, 不是男,就是女
gender char(1)

# 手机号 phone --------> 固定长度为11
phone char(11)

2.3.3 日期时间类型

表2.3: 日期时间类型
类型	大小	范围	格式
DATE	3	1000-01-01 至 9999-12-31	YYYY-MM-DD
TIME	3	-838:59:59 至 838:59:59	HH:MM:SS
YEAR	1	1901 至 2155	YYYY
DATETIME	8	1000-01-01 00:00:00 至 9999-12-31 23:59:59	YYYY-MM-DD HH:MM:SS
TIMESTAMP	4	1970-01-01 00:00:01 至 2038-01-19 03:14:07	YYYY-MM-DD HH:MM:SS

# 例子
# 生日字段 birthday
birthday date

# 创建时间 createtime
createtime datetime

2.4 数据定义语言 DDL

DDL（Data Definition Language，数据定义语言）：用来定义数据库对象(数据库，表，字段) 。

2.4.1 数据库操作

#查询所有数据库
show databases;

#查询当前数据库
select database();

#创建数据库
create database [if not exists] 数据库名 [default charset 字符集] [collate 排序规则] ;
create database itcast; #创建一个名为itcast的数据库
create database if not exists itcast;  #如果itcast不存在，创建数据库，否则不创建
create database itheima default charset utf8mb4; #使用utf8mb4字符集，一个字符占四个字节

#删除数据库
drop database [if exists] 数据库名;
drop database test;
drop database if exists test;

#使用数据库
use 数据库名;
use itcast;

2.4.2 表操作

2.4.2.1 表的创建

creat table 表名(
    字段1 字段1类型 [COMMENT 字段1注释],
    字段2 字段2类型 [COMMENT 字段2注释],
    字段3 字段3类型 [COMMENT 字段3注释],
    ......
    字段n 字段n类型 [COMMENT 字段n注释]
) [COMMENT 表注释];   #[...] 内为可选参数

create table tb_user(
    id int comment '编号',
    name varchar(50) comment '姓名',
    age int comment '年龄',
    gender varchar(1) comment '性别'
) comment '用户表';

案例

设计一张员工信息表，要求如下： 1. 编号（纯数字）2. 员工工号 (字符串类型，长度不超过10位) 3. 员工姓名（字符串类型，长度不超过10位） 4. 性别（男/女，存储一个汉字） 5. 年龄（正常人年龄，不可能存储负数） 6. 身份证号（二代身份证号均为18位，身份证中有X这样的字符） 7. 入职时间（取值年月日即可）

对应的建表语句详见 3.1.1 节。

2.4.2.2 表的查询

# 查询当前数据库所有表
show tables;
show tb_user;

# 查询表结构
desc 表名;
desc tb_user;

# 查询指定表的建表语句
show creat table 表名;

2.4.2.3 表的修改

# 添加字段
alter table 表名 add 字段名 类型(长度) [comment 注释] [约束];
alter table emp add nickname varchar(20) comment '昵称';

# 修改数据类型
alter table 表名 modify 字段名 新数据类型(长度);

# 修改字段名和字段类型
alter table 表名 change 旧字段名 新字段名 类型(长度) [comment 注释] [约束];
alter table emp change nickname username varchar(30) comment '用户名';

# 删除字段
alter table 表名 drop 字段名;
alter table emp drop username;

# 修改表名
alter table 表名 rename to 新表名;
alter table emp rename to employee;

2.4.2.4 表的删除

# 删除表
drop table [if exists] 表名;

# 删除指定表数据，但保留表结构
truncate table 表名;
truncate table employee;

2.5 数据操作语言 DML

DML英文全称是Data Manipulation Language(数据操作语言)，用来对数据库中表的数据记录进行增、删、改操作。

2.5.1 添加数据

# 给指定字段添加数据
insert into 表名 (字段1, 字段2, ...) values(值1, 值2, ...);
INSERT INTO employee(id, workno, `name`, gender,age,idcard,entrydate) VALUES(1, '1', 'Itcast', '男', 10, '123456789012345678', '2020-01-01');

# 给全部字段添加数据
insert into 表名 values(值1, 值2, ...);
INSERT INTO employee VALUES(2,'2','张无忌','男',18,'123456789012345670','2005-01-01');

# 批量添加数据
insert into 表名 (字段名1, 字段名2, ...) values (值1, 值2, ...), (值1, 值2, ...), (值1, 值2, ...);
insert into 表名 values (值1, 值2, ...), (值1, 值2, ...), (值1, 值2, ...) ;
INSERT INTO employee VALUES(3,'3','韦一笑','男',38,'123456789712345670','2005-01-01'),(4,'4','赵敏','女',18,'123456789712345670','2005-01-01');

注意事项:

插入数据时，指定的字段顺序需要与值的顺序是一一对应的。
字符串和日期型数据应该包含在引号中。
插入的数据大小，应该在字段的规定范围内。

2.5.2 修改数据

UPDATE 表名 SET 字段名1 = 值1 , 字段名2 = 值2 , .... 1 [WHERE 条件];

# 例子
# 修改id为1的数据，将name修改为itheima
UPDATE employee SET name = 'ithema' WHERE id=1;
# 修改id为1的数据, 将name修改为小昭, gender修改为 女
UPDATE employee SET name = '小昭', gender = '女' WHERE id=1;
# 将所有的员工入职日期修改为 2008-01-01
UPDATE employee SET entrydate = '2008-01-01';

注意：修改语句的条件可以有，也可以没有，如果没有条件，则会修改整张表的所有数据。

2.5.3 删除数据

DELETE FROM 表名 [ WHERE 条件 ] ;

# 例子
# 删除gender为女的员工
DELETE FROM employee WHERE gender = '女';
# 删除所有员工
DELETE FROM employee;

2.6 数据查询语言 DQL

DQL（Data Query Language，数据查询语言）：用来查询数据库中表的记录。

我们先来完成如下数据准备工作，数据表的建表语句详见 3.1.2 节。

DQL 查询语句，语法结构如下：

SELECT
  字段列表
FROM
  表名列表
WHERE
  条件列表
GROUP BY
  分组字段列表
HAVING
  分组后条件列表
ORDER BY
  排序字段列表
LIMIT
  分页参数

我们在讲解这部分内容的时候，会将上面的完整语法进行拆分，分为以下几个部分：基本查询（不带任何条件）、条件查询（WHERE）、聚合函数（count、max、min、avg、sum）、分组查询（group by）、排序查询（order by）和分页查询（limit）。

2.6.1 基础查询

在基本查询的DQL语句中，不带任何的查询条件，查询的语法如下：

# 查询多个字段
SELECT 字段1, 字段2, 字1 段3 ... FROM 表名;
SELECT `name`,workno,age FROM emp; # 查询指定字段 name, workno, age并返回

# 查询返回所有字段
SELECT * FROM 表名;
SELECT * FROM emp; # 查询返回emp表中的所有字段

# 字段设置别名
SELECT 字段1 [ AS 别名1 ] , 字段2 [ AS 别名2 1 ] ... FROM 表名;
SELECT 字段1 [ 别名1 ] , 字段2 [ 别名2 ] ... FROM 表名;
SELECT workaddress AS '工作地址' FROM emp; # 查询所有员工的工作地址,起别名
SELECT workaddress '工作地址' FROM emp; # 查询所有员工的工作地址,起别名

# 去除重复记录
SELECT DISTINCT 字段列表 FROM 表名;
SELECT DISTINCT workaddress AS '工作地址' FROM emp; # 查询公司员工的上班地址有哪些(不要重复)

2.6.2 条件查询

SELECT 字段列表 FROM 表1 名 WHERE 条件列表 ;

# 查询年龄等于 88 的员工
SELECT * FROM emp WHERE age=88;
# 查询年龄小于 20 的员工信息
SELECT * FROM emp WHERE age<20;
# 查询年龄小于等于 20 的员工信息
SELECT * FROM emp WHERE age<=20;
# 查询没有身份证号的员工信息
SELECT * FROM emp WHERE idcard IS NULL;
# 查询有身份证号的员工信息
SELECT * FROM emp WHERE idcard IS NOT NULL;
# 查询年龄不等于 88 的员工信息
SELECT * FROM emp WHERE age!=88;
SELECT * FROM emp WHERE age<>88;
# 查询年龄在15岁(包含) 到 20岁(包含)之间的员工信息
SELECT * FROM emp WHERE age >= 15 && age <= 20;
SELECTt * FROM emp WHERE age >= 15 AND age <= 20;
SELECT * FROM emp WHERE age BETWEEN 15 AND 20;
# 查询性别为 女 且年龄小于 25岁的员工信息
SELECT * FROM emp WHERE gender = '女' AND age<=25;
# 查询年龄等于18 或 20 或 40 的员工信息
SELECT * FROM emp WHERE age IN (18,20,40);
SELECT * FROM emp WHERE age=18 OR AGE=20 OR AGE=40;
# 查询姓名为两个字的员工信息 _ %
SELECT * FROM emp WHERE `name` LIKE '__';
# 查询身份证号最后一位是X的员工信息
SELECT * FROM emp WHERE idcard LIKE '%X';

条件

表2.4: 比较运算符
比较运算符	功能
>	大于
>=	大于等于
<	小于
<=	小于等于
=	等于
!=或<>	不等于
BETWEEN … AND …	在某个范围之内（含最小最大值）
IN(…)	在in之后的列表中的值，多选一
LIKE 占位符	模糊匹配(_匹配单个字符, %匹配任意个字符)
IS NULL	判断是否为NULL值

表2.5: 逻辑运算符
逻辑运算符	功能
AND 或 &&	并且 (多个条件同时成立)
OR 或 \|\|	或者 (多个条件任意一个成立)
NOT 或 !	非 , 不是

2.6.3 聚合函数

将一列数据作为一个整体，进行纵向计算。

常见的聚合函数如下：

表2.6: 逻辑运算符
函数	功能
count	计数
max	最大值
min	最小值
avg	平均值
sum	求和

NULL值是不参与所有聚合函数运算的。

SELECT 聚合函数(字段列表) FROM 表名;

# 统计该企业员工数量
SELECT COUNT(*) FROM emp;
# 统计该企业员工的平均年龄
SELECT AVG(age) FROM emp;
# 统计该企业员工的最大年龄
SELECT MAX(age) FROM emp;
# 统计该企业员工的最小年龄
SELECT MIN(age) FROM emp;
# 统计西安地区员工的年龄之和
SELECT SUM(age) FROM emp WHERE workaddress = '西安';

2.6.4 分组查询

SELECT 字段列表 FROM 表名 [WHERE 条件] GROUP BY 分组字段名 [HAVING 分组后过滤条件];

# 根据性别分组 , 统计男性员工 和 女性员工的数量
SELECT gender, COUNT(*) FROM emp GROUP BY gender;
# 根据性别分组 , 统计男性员工 和 女性员工的平均年龄
SELECT gender, AVG(age) FROM emp GROUP BY gender;
# 查询年龄小于45的员工 , 并根据工作地址分组 , 获取员工数量大于等于3的工作地址
SELECT workaddress, COUNT(*) AS address_count FROM emp WHERE age<45 GROUP BY workaddress having address_count>=3;
# 统计各个工作地址上班的男性及女性员工的数量
SELECT workaddress, gender, COUNT(*) '数量' FROM emp GROUP BY gender, workaddress;

where与having区别

执行时机不同：where是分组之前进行过滤，不满足where条件，不参与分组；而having是分组之后对结果进行过滤。
判断条件不同：where不能对聚合函数进行判断，而having可以。

注意事项:

分组之后，查询的字段一般为聚合函数和分组字段，查询其他字段无任何意义。
执行顺序: where > 聚合函数 > having 。
支持多字段分组, 具体语法为 : group by columnA,columnB

2.6.5 排序查询

SELECT 字段列表 FROM 表名 ORDER BY 字段1 排1 序方式1 , 字段2 排序方式2;

# 根据年龄对公司的员工进行升序排序
SELECT * FROM emp ORDER BY age ASC;
# 根据入职时间, 对员工进行降序排序
SELECT * FROM emp ORDER BY entrydate DESC;
# 根据年龄对公司的员工进行升序排序 , 年龄相同 , 再按照入职时间进行降序排序
SELECT * FROM emp ORDER BY age ASC, entrydate DESC;

排序方式

ASC : 升序(默认值)。如果是升序, 可以不指定排序方式ASC ;
DESC: 降序

注意事项：如果是多字段排序，当第一个字段值相同时，才会根据第二个字段进行排序；

2.6.6 分页查询

SELECT 字段列表 FROM 表名 LIMIT 起始索引, 查询记录数;

# 查询第1页员工数据, 每页展示10条记录
SELECT * FROM emp LIMIT 0,10; 
select * from emp limit 10;
# 查询第2页员工数据, 每页展示10条记录 --------> (页码-1)*页展示记录数
SELECT * FROM emp LIMIT 10,10;

注意事项

起始索引从0开始，起始索引 = （查询页码 - 1）* 每页显示记录数。
分页查询是数据库的方言，不同的数据库有不同的实现，MySQL中是LIMIT。
如果查询的是第一页数据，起始索引可以省略，直接简写为 limit 10。

案例

详见 3.1.3 节。