2 第二章 SQL
SQL(Structured Query Language,结构化查询语言):操作关系型数据库的编程语言,定义了 一套操作关系型数据库统一标准 。
2.2 SQL语句的分类
SQL语句,根据其功能,主要分为四类:DDL、DML、DQL、DCL
| 分类 | 全称 | 说明 |
|---|---|---|
| DDL | Data Definition Language | 数据定义语言,用来定义/创建数据库对象(数据库,表,字段) |
| DML | Data Manipulation Language | 数据操作语言,用来对数据库表中的数据进行增删改 |
| DQL | Data Query Language | 数据查询语言,用来查询数据库中表的记录 |
| DCL | Data Control Language | 数据控制语言,用来创建数据库用户、控制数据库的访问权限 |
2.3 数据类型
MySQL中的数据类型有很多,主要分为三类:数值类型、字符串类型、日期时间类型。
2.3.1 数值型
| 类型 | 大小 | 有符号SIGNED范围 | 无符号范围 |
|---|---|---|---|
| TINYINT | 1byte | (-128,127) | (0,255) |
| SMALLINT | 2bytes | (-32768,32767) | (0,65535) |
| MEDIUMINT | 3bytes | (-8388608,8388607) | (0,16777215) |
| INT/INTEGER | 4bytes | (-2147483648,2147483647) | (0,4294967295) |
| BIGINT | 8bytes | (-2^63,2^63-1) | (0,2^64-1) |
| FLOAT | 4bytes | (-3.402823466 E+38,3.402823466351 E+38) | 0和(1.175494351 E-38,3.402823466 E+38) |
| DOUBLE | 8bytes | (-1.7976931348623157E+308,1.7976931348623157E+308) | 0和(2.2250738585072014E-308,1.7976931348623157E+308) |
| DECIMAL | 不定 | 依赖于M(精度)和D(标度)的值 | 依赖于M(精度)和D(标度)的值 |
# 例子:
# 年龄字段 -- 不会出现负数, 而且人的年龄不会太大
age tinyint unsigned
# 分数 -- 总分100分,最长4位(100.0) 最多出现一位小数
score double(4,1)
2.3.2 字符串型
char 与 varchar 都可以描述字符串,char是定长字符串,指定长度多长,就占用多少个字符,和 字段值的长度无关 。而varchar是变长字符串,指定的长度为最大占用长度 。相对来说,char的性 能会更高些。
| 类型 | 大小 | 描述 |
|---|---|---|
| CHAR | 0-255 bytes | 定长字符串(需要指定长度) |
| VARCHAR | 0-65535 bytes | 变长字符串(需要指定长度) |
| TINYBLOB | 0-255 bytes | 不超过255个字符的二进制数据 |
| TINYTEXT | 0-255 bytes | 短文本字符串 |
| BLOB | 0-65 535 bytes | 二进制形式的长文本数据 |
| TEXT | 0-65 535 bytes | 长文本数据 |
| MEDIUMBLOB | 0-16 777 215 bytes | 二进制形式的中等长度文本数据 |
| MEDIUMTEXT | 0-16 777 215 bytes | 中等长度文本数据 |
| LONGBLOB | 0-4 294 967 295 bytes | 二进制形式的极大文本数据 |
| LONGTEXT | 0-4 294 967 295 bytes | 极大文本数据 |
# 例子:
# 用户名 username ------> 长度不定, 最长不会超过50
username varchar(50)
# 性别 gender ---------> 存储值, 不是男,就是女
gender char(1)
# 手机号 phone --------> 固定长度为11
phone char(11)
2.3.3 日期时间类型
| 类型 | 大小 | 范围 | 格式 |
|---|---|---|---|
| DATE | 3 | 1000-01-01 至 9999-12-31 | YYYY-MM-DD |
| TIME | 3 | -838:59:59 至 838:59:59 | HH:MM:SS |
| YEAR | 1 | 1901 至 2155 | YYYY |
| DATETIME | 8 | 1000-01-01 00:00:00 至 9999-12-31 23:59:59 | YYYY-MM-DD HH:MM:SS |
| TIMESTAMP | 4 | 1970-01-01 00:00:01 至 2038-01-19 03:14:07 | YYYY-MM-DD HH:MM:SS |
# 例子
# 生日字段 birthday
birthday date
# 创建时间 createtime
createtime datetime
2.4 数据定义语言 DDL
DDL(Data Definition Language,数据定义语言):用来定义数据库对象(数据库,表,字段) 。
2.4.1 数据库操作
#查询所有数据库
show databases;
#查询当前数据库
select database();
#创建数据库
create database [if not exists] 数据库名 [default charset 字符集] [collate 排序规则] ;
create database itcast; #创建一个名为itcast的数据库
create database if not exists itcast; #如果itcast不存在,创建数据库,否则不创建
create database itheima default charset utf8mb4; #使用utf8mb4字符集,一个字符占四个字节
#删除数据库
drop database [if exists] 数据库名;
drop database test;
drop database if exists test;
#使用数据库
use 数据库名;
use itcast;
2.4.2 表操作
2.4.2.1 表的创建
creat table 表名(
字段1 字段1类型 [COMMENT 字段1注释],
字段2 字段2类型 [COMMENT 字段2注释],
字段3 字段3类型 [COMMENT 字段3注释],
......
字段n 字段n类型 [COMMENT 字段n注释]
) [COMMENT 表注释]; #[...] 内为可选参数
create table tb_user(
id int comment '编号',
name varchar(50) comment '姓名',
age int comment '年龄',
gender varchar(1) comment '性别'
) comment '用户表';
案例
设计一张员工信息表,要求如下: 1. 编号(纯数字)2. 员工工号 (字符串类型,长度不超过10位) 3. 员工姓名(字符串类型,长度不超过10位) 4. 性别(男/女,存储一个汉字) 5. 年龄(正常人年龄,不可能存储负数) 6. 身份证号(二代身份证号均为18位,身份证中有X这样的字符) 7. 入职时间(取值年月日即可)
对应的建表语句详见 3.1.1 节。
2.4.2.2 表的查询
# 查询当前数据库所有表
show tables;
show tb_user;
# 查询表结构
desc 表名;
desc tb_user;
# 查询指定表的建表语句
show creat table 表名;
2.4.2.3 表的修改
# 添加字段
alter table 表名 add 字段名 类型(长度) [comment 注释] [约束];
alter table emp add nickname varchar(20) comment '昵称';
# 修改数据类型
alter table 表名 modify 字段名 新数据类型(长度);
# 修改字段名和字段类型
alter table 表名 change 旧字段名 新字段名 类型(长度) [comment 注释] [约束];
alter table emp change nickname username varchar(30) comment '用户名';
# 删除字段
alter table 表名 drop 字段名;
alter table emp drop username;
# 修改表名
alter table 表名 rename to 新表名;
alter table emp rename to employee;
2.5 数据操作语言 DML
DML英文全称是Data Manipulation Language(数据操作语言),用来对数据库中表的数据记录进 行增、删、改操作。
2.5.1 添加数据
# 给指定字段添加数据
insert into 表名 (字段1, 字段2, ...) values(值1, 值2, ...);
INSERT INTO employee(id, workno, `name`, gender,age,idcard,entrydate) VALUES(1, '1', 'Itcast', '男', 10, '123456789012345678', '2020-01-01');
# 给全部字段添加数据
insert into 表名 values(值1, 值2, ...);
INSERT INTO employee VALUES(2,'2','张无忌','男',18,'123456789012345670','2005-01-01');
# 批量添加数据
insert into 表名 (字段名1, 字段名2, ...) values (值1, 值2, ...), (值1, 值2, ...), (值1, 值2, ...);
insert into 表名 values (值1, 值2, ...), (值1, 值2, ...), (值1, 值2, ...) ;
INSERT INTO employee VALUES(3,'3','韦一笑','男',38,'123456789712345670','2005-01-01'),(4,'4','赵敏','女',18,'123456789712345670','2005-01-01');
注意事项:
- 插入数据时,指定的字段顺序需要与值的顺序是一一对应的。
- 字符串和日期型数据应该包含在引号中。
- 插入的数据大小,应该在字段的规定范围内。
2.5.2 修改数据
UPDATE 表名 SET 字段名1 = 值1 , 字段名2 = 值2 , .... 1 [WHERE 条件];
# 例子
# 修改id为1的数据,将name修改为itheima
UPDATE employee SET name = 'ithema' WHERE id=1;
# 修改id为1的数据, 将name修改为小昭, gender修改为 女
UPDATE employee SET name = '小昭', gender = '女' WHERE id=1;
# 将所有的员工入职日期修改为 2008-01-01
UPDATE employee SET entrydate = '2008-01-01';
注意:修改语句的条件可以有,也可以没有,如果没有条件,则会修改整张表的所有数据。
2.6 数据查询语言 DQL
DQL(Data Query Language,数据查询语言):用来查询数据库中表的记录。
我们先来完成如下数据准备工作,数据表的建表语句详见 3.1.2 节。
DQL 查询语句,语法结构如下:
SELECT
字段列表
FROM
表名列表
WHERE
条件列表
GROUP BY
分组字段列表
HAVING
分组后条件列表
ORDER BY
排序字段列表
LIMIT
分页参数
我们在讲解这部分内容的时候,会将上面的完整语法进行拆分,分为以下几个部分:基本查询(不带任何条件)、条件查询(WHERE)、聚合函数(count、max、min、avg、sum)、分组查询(group by)、排序查询(order by)和分页查询(limit)。
2.6.1 基础查询
在基本查询的DQL语句中,不带任何的查询条件,查询的语法如下:
# 查询多个字段
SELECT 字段1, 字段2, 字1 段3 ... FROM 表名;
SELECT `name`,workno,age FROM emp; # 查询指定字段 name, workno, age并返回
# 查询返回所有字段
SELECT * FROM 表名;
SELECT * FROM emp; # 查询返回emp表中的所有字段
# 字段设置别名
SELECT 字段1 [ AS 别名1 ] , 字段2 [ AS 别名2 1 ] ... FROM 表名;
SELECT 字段1 [ 别名1 ] , 字段2 [ 别名2 ] ... FROM 表名;
SELECT workaddress AS '工作地址' FROM emp; # 查询所有员工的工作地址,起别名
SELECT workaddress '工作地址' FROM emp; # 查询所有员工的工作地址,起别名
# 去除重复记录
SELECT DISTINCT 字段列表 FROM 表名;
SELECT DISTINCT workaddress AS '工作地址' FROM emp; # 查询公司员工的上班地址有哪些(不要重复)
2.6.2 条件查询
SELECT 字段列表 FROM 表1 名 WHERE 条件列表 ;
# 查询年龄等于 88 的员工
SELECT * FROM emp WHERE age=88;
# 查询年龄小于 20 的员工信息
SELECT * FROM emp WHERE age<20;
# 查询年龄小于等于 20 的员工信息
SELECT * FROM emp WHERE age<=20;
# 查询没有身份证号的员工信息
SELECT * FROM emp WHERE idcard IS NULL;
# 查询有身份证号的员工信息
SELECT * FROM emp WHERE idcard IS NOT NULL;
# 查询年龄不等于 88 的员工信息
SELECT * FROM emp WHERE age!=88;
SELECT * FROM emp WHERE age<>88;
# 查询年龄在15岁(包含) 到 20岁(包含)之间的员工信息
SELECT * FROM emp WHERE age >= 15 && age <= 20;
SELECTt * FROM emp WHERE age >= 15 AND age <= 20;
SELECT * FROM emp WHERE age BETWEEN 15 AND 20;
# 查询性别为 女 且年龄小于 25岁的员工信息
SELECT * FROM emp WHERE gender = '女' AND age<=25;
# 查询年龄等于18 或 20 或 40 的员工信息
SELECT * FROM emp WHERE age IN (18,20,40);
SELECT * FROM emp WHERE age=18 OR AGE=20 OR AGE=40;
# 查询姓名为两个字的员工信息 _ %
SELECT * FROM emp WHERE `name` LIKE '__';
# 查询身份证号最后一位是X的员工信息
SELECT * FROM emp WHERE idcard LIKE '%X';
条件
| 比较运算符 | 功能 |
|---|---|
| > | 大于 |
| >= | 大于等于 |
| < | 小于 |
| <= | 小于等于 |
| = | 等于 |
| !=或<> | 不等于 |
| BETWEEN … AND … | 在某个范围之内(含最小最大值) |
| IN(…) | 在in之后的列表中的值,多选一 |
| LIKE 占位符 | 模糊匹配(_匹配单个字符, %匹配任意个字符) |
| IS NULL | 判断是否为NULL值 |
| 逻辑运算符 | 功能 |
|---|---|
| AND 或 && | 并且 (多个条件同时成立) |
| OR 或 || | 或者 (多个条件任意一个成立) |
| NOT 或 ! | 非 , 不是 |
2.6.3 聚合函数
将一列数据作为一个整体,进行纵向计算。
常见的聚合函数如下:
| 函数 | 功能 |
|---|---|
| count | 计数 |
| max | 最大值 |
| min | 最小值 |
| avg | 平均值 |
| sum | 求和 |
NULL值是不参与所有聚合函数运算的。
SELECT 聚合函数(字段列表) FROM 表名;
# 统计该企业员工数量
SELECT COUNT(*) FROM emp;
# 统计该企业员工的平均年龄
SELECT AVG(age) FROM emp;
# 统计该企业员工的最大年龄
SELECT MAX(age) FROM emp;
# 统计该企业员工的最小年龄
SELECT MIN(age) FROM emp;
# 统计西安地区员工的年龄之和
SELECT SUM(age) FROM emp WHERE workaddress = '西安';
2.6.4 分组查询
SELECT 字段列表 FROM 表名 [WHERE 条件] GROUP BY 分组字段名 [HAVING 分组后过滤条件];
# 根据性别分组 , 统计男性员工 和 女性员工的数量
SELECT gender, COUNT(*) FROM emp GROUP BY gender;
# 根据性别分组 , 统计男性员工 和 女性员工的平均年龄
SELECT gender, AVG(age) FROM emp GROUP BY gender;
# 查询年龄小于45的员工 , 并根据工作地址分组 , 获取员工数量大于等于3的工作地址
SELECT workaddress, COUNT(*) AS address_count FROM emp WHERE age<45 GROUP BY workaddress having address_count>=3;
# 统计各个工作地址上班的男性及女性员工的数量
SELECT workaddress, gender, COUNT(*) '数量' FROM emp GROUP BY gender, workaddress;
where与having区别
- 执行时机不同:where是分组之前进行过滤,不满足where条件,不参与分组;而having是分组之后对结果进行过滤。
- 判断条件不同:where不能对聚合函数进行判断,而having可以。
注意事项:
- 分组之后,查询的字段一般为聚合函数和分组字段,查询其他字段无任何意义。
- 执行顺序: where > 聚合函数 > having 。
- 支持多字段分组, 具体语法为 : group by columnA,columnB
2.6.5 排序查询
SELECT 字段列表 FROM 表名 ORDER BY 字段1 排1 序方式1 , 字段2 排序方式2;
# 根据年龄对公司的员工进行升序排序
SELECT * FROM emp ORDER BY age ASC;
# 根据入职时间, 对员工进行降序排序
SELECT * FROM emp ORDER BY entrydate DESC;
# 根据年龄对公司的员工进行升序排序 , 年龄相同 , 再按照入职时间进行降序排序
SELECT * FROM emp ORDER BY age ASC, entrydate DESC;
排序方式
- ASC : 升序(默认值)。如果是升序, 可以不指定排序方式ASC ;
- DESC: 降序
注意事项:如果是多字段排序,当第一个字段值相同时,才会根据第二个字段进行排序;
2.6.6 分页查询
SELECT 字段列表 FROM 表名 LIMIT 起始索引, 查询记录数;
# 查询第1页员工数据, 每页展示10条记录
SELECT * FROM emp LIMIT 0,10;
select * from emp limit 10;
# 查询第2页员工数据, 每页展示10条记录 --------> (页码-1)*页展示记录数
SELECT * FROM emp LIMIT 10,10;
注意事项
- 起始索引从0开始,起始索引 = (查询页码 - 1)* 每页显示记录数。
- 分页查询是数据库的方言,不同的数据库有不同的实现,MySQL中是LIMIT。
- 如果查询的是第一页数据,起始索引可以省略,直接简写为 limit 10。
案例
详见 3.1.3 节。