6. 多表查询
作者:互联网
6.1 一个案例引入多表查询
现在有两张表employees和department。
现在的要求是
# 查询每个员工的姓名和对应的部门名称
SELECT last_name, department_name
FROM employees, departments;
# 部分结果举例
/*
| Gietz | Payroll |
| Gietz | Recruiting |
| Gietz | Retail Sales |
| Gietz | Government Sales |
| Gietz | IT Helpdesk |
| Gietz | NOC |
| Gietz | IT Support |
| Gietz | Operations |
| Gietz | Contracting |
| Gietz | Construction |
| Gietz | Manufacturing |
| Gietz | Benefits |
| Gietz | Shareholder Services |
| Gietz | Control And Credit |
| Gietz | Corporate Tax |
| Gietz | Treasury |
| Gietz | Accounting |
| Gietz | Finance |
| Gietz | Executive |
| Gietz | Sales |
| Gietz | Public Relations |
| Gietz | IT |
| Gietz | Shipping |
| Gietz | Human Resources |
| Gietz | Purchasing |
| Gietz | Marketing |
| Gietz | Administration |
+-------------+----------------------+
2889 rows in set (1.04 sec)
*/
从结果上看最终查询的数量是 employees表的行数 * departments表的行数 (107 * 27 )。
那么为什么会出现这种现象呢?
笛卡尔积
这里需要引入笛卡尔积的概念,什么是笛卡尔积呢?
从图中可以看出,笛卡尔积就是所有可能性结果,也称之为交叉连接
,英文是CROSS JOIN
,SQL99中也是使用CROSS JOIN来表示交叉连接,作用就是可以将任意表进行连接,哪怕两张表不相关。
笛卡尔积错误的产生
- 省略多个表的连接条件
- 连接条件无效
- 所有表中的所有行互相连接
为了避免笛卡尔积的条件,需要用WHERE加入有效的连接条件
# 查询每个员工的姓名和对应的部门名称
SELECT last_name, department_name
FROM employees, departments
WHERE employees.department_id = departments.department_id;
6.2 多表查询的分类
等值连接 VS 非等值连接
等值连接
利用一张表的某列的值和另外一张表中某列的值相等的关系,把多余的数据过滤掉
刚才的查询就是一个典型的等值连接
# 查询每个员工的姓名和对应的部门名称
SELECT last_name, department_name
FROM employees, departments
WHERE employees.department_id = departments.department_id;
-
多个条件可以用逻辑运算符连接起来
-
如果两个表中有相同的列名,这个时候需要带上
表名.
区分,可以给 表取名然后用别名区分注:如果给表起了别名,过了条件中只能使用别名,不能使用原来的表名
-
多个表连接需要更多的条件,N个表连接至少愮用N-1个条件
非等值连接
除了利用相等,还可以利用范围条件实现两个表的查询。
# 查询所有员工的工资等级
SELECT e.last_name, e.salary, j.grade_level
FROM employees e, job_grades j
WHERE e.salary BETWEEN j.lowest_sal AND j.highest_sal;
自连接 VS 非自连接
- table1和table2本质上是同一张表,只是取别名的方式虚拟成两张表代表不同的意义,然后两张表再进行内连接,外连接等查询,这就是自连接。
# 查询employees表,返回“Xxx works for Xxx”
SELECT CONCAT(worker.last_name," works for ",manager.last_name)
FROM employees worker, employees manager
WHERE worker.manager_id = manager.employee_id;
# 查询出last_name为 ‘Chen’ 的员工的 manager 的信息
SELECT manager.*
FROM employees worker, employees manager
WHERE worker.last_name = 'Chen' AND worker.manager_id = manager.employee_id;
内连接 VS 外连接
刚才上面的查询都是内连接
-
内连接:合并具有同一列的两个以上的表的行,结果集中不包含一个表和另一个表不匹配的行
-
外连接:两个个表在连接过程中除了返回满足连接条件的行以外还返回左(或右)表中不满足条件的行,这种连接称为左(或右)外连接,没有匹配的行,结果表中相对应的列为NULL
-
如果是左外连接,则连接条件中的左边的表为主表,右边的表为从表
如果是左外连接,则连接条件中的右边的表为主表,左边的表为从表
6.3 多表查询的实现
基本语法
# 使用JOIN ON子句创建连接
SELECT table1.column, table2.column,table3.column
FROM table1
JOIN table2 ON table1 和 table2 的连接条件
JOIN table3 ON table2 和 table3 的连接条件
内连接(INNER JOIN)的实现
-
语法
SELECT 字段列表 FROM A表 INNER JOIN B表 ON 关联条件 WHERE 等其他子句;
-
练习
继续用刚才的等值连接的题目
# 查询每个员工的姓名和对应的部门名称 SELECT last_name, department_name FROM employees INNER JOIN departments ON employees.department_id = departments.department_id; # INNER JOIN可以省略成JOIN # 查询员工工号以及对应的工作城市和工作部门 SELECT employee_id, city, deparment_name FROM employees e JOIN departments d ON e.department_id = d.department_id JOIN ON locations l ON d.location_id = l.location_id;
外连接(OUTER JOIN)的实现
-
语法
# 左外连接,A表是主表,最终结果包含A表所有内容 SELECT 字段列表 FROM A表 LEFT OUTER JOIN B表 ON 关联条件 WHERE 等其他子句; # 右外连接,B表是主表,最终结果包含B表所有内容 SELECT 字段列表 FROM A表 RIGHT OUTER JOIN B表 ON 关联条件 WHERE 等其他子句;
和刚才一样,这里的OUTER可以省略
-
举例
# 左外连接 # 查询所有员工对应的部门和部门名称 SELECT e.last_name, e.employee_id, d.department_id, department_name FROM employees e LEFT JOIN departments d ON e.department_id = d.department_id; /* 有一条数据是没有部门的但是还会在查询结果中 | Grant | 178 | NULL | NULL | */ # 右外连接 # 查询部门对应的员工 SELECT e.last_name, e.employee_id, d.department_id, department_name FROM employees e RIGHT JOIN departments d ON e.department_id = d.department_id; /* 有几个部门没有员工也会在查询结果中 | NULL | NULL | 120 | Treasury | | NULL | NULL | 130 | Corporate Tax | | NULL | NULL | 140 | Control And Credit | | NULL | NULL | 150 | Shareholder Services | | NULL | NULL | 160 | Benefits | | NULL | NULL | 170 | Manufacturing | | NULL | NULL | 180 | Construction | | NULL | NULL | 190 | Contracting | | NULL | NULL | 200 | Operations | | NULL | NULL | 210 | IT Support | | NULL | NULL | 220 | NOC | | NULL | NULL | 230 | IT Helpdesk | | NULL | NULL | 240 | Government Sales | | NULL | NULL | 250 | Retail Sales | | NULL | NULL | 260 | Recruiting | | NULL | NULL | 270 | Payroll | */
-
满外连接
- FULL OUTER JOIN 就是满外连接,所有的查询结果都会在出现,无论左边右边的表是否有对应结果
- MYSQL不支持FULL JOIN,采用 UNION替代
UNION
UNION有两种查询,分别是UNION
和UNION ALL
-
UNION操作
返回两个结果集的并集,并且去掉重复记录
-
UNION ALL操作
返回两个结果集的并集,不去掉重复记录
UNION ALL所需要的资源比UNION少,如果确定结果没有重复记录,建议使用UNION ALL,提高数据查询速度。
练习
# 查询部门编号>90或邮箱包含a的员工信息
# 直接查询
SELECT * FROM employees e
WHERE e.department_id > 90 OR e.email LIKE "%a%";
# UNION查询
SELECT * FROM employees e1
WHERE e1.email LIKE "%a%"
UNION
SELECT * FROM employees e2
WHERE e2.department_id > 90;
# 查询中国用户中男性的信息以及美国用户中年男性的用户信息
# 表t_chinamale 和 表 t_usmale
SELECT id,cname FROM t_chinamale WHERE csex='男'
UNION ALL
SELECT id,tname FROM t_usmale WHERE tGender='male';
6.4 7种SQL JOIN的实现
# 还是拿员工表和部门表作为例子
# 左上角 左外连接
SELECT e.employee_id, e.last_name, department_name
FROM employees e LEFT JOIN departments d
ON e.department_id = d.department_id;
# 右上角 右外连接
SELECT e.employee_id, e.last_name, department_name
FROM employees e RIGHT JOIN departments d
ON e.department_id = d.department_id;
# 中间图内连接
SELECT e.employee_id, e.last_name, department_name
FROM employees e JOIN departments d
ON e.department_id = d.department_id;
# 左下图 这个就是两个集合的并集用UNION就可以处理
SELECT e.employee_id, e.last_name, department_name
FROM employees e LEFT JOIN departments d
ON e.department_id = d.department_id
UNION
SELECT e.employee_id, e.last_name, department_name
FROM employees e RIGHT JOIN departments d
ON e.department_id = d.department_id;
其余四个需要一定的解释,但是拿出来说
先说左中图和右中图,两个是一致的只是最终的结果是相反的
现在以左中图作为例子,实质上结果是 A - A∩B,
# 左中图 A - A∩B
# 可以先查询出A的外连接
SELECT e.employee_id, e.last_name, department_name
FROM employees e LEFT JOIN departments d
ON e.department_id = d.department_id
WHERE d.department_id IS NULL; # 在这里需要删掉B为NULL的时候
这里有的同学可能会误解为什么是判断B表的字段是不是NULL为什么不是A表的?
这里解释一下,JOIN之后的操作实质上就是从笛卡尔集中取出数据,那么在查询出A表的外连接的时候,表会变成什么样呢,可以一起来看看
可能有人会说,这里A表B表的字段都是NULL,为什么不判断B表的呢?
在这里我想说的是,这里尚硅谷给的例子比较特殊,用的是外键去判断,如果这里的条件不是用等值的外键去判断呢,假设A没有这个字段,是不是只有B才有这个字段,也就是说当前获取的集合里面只能通过B表去判断是否为NULL!!!
同理
# 右中图 B - A∩B
SELECT e.employee_id, e.last_name, department_name
FROM employees e RIGHT JOIN departments d
ON e.department_id = d.department_id
WHERE e.department_id IS NULL; # 在这里需要删掉B为NULL的时候
剩下的左下图就是两个的并集
SELECT e.employee_id, e.last_name, department_name
FROM employees e LEFT JOIN departments d
ON e.department_id = d.department_id
WHERE d.department_id IS NULL
UNION
SELECT e.employee_id, e.last_name, department_name
FROM employees e RIGHT JOIN departments d
ON e.department_id = d.department_id
WHERE e.department_id IS NULL;
6.5 SQL99的新特性
自然连接
自然连接就是NATURAL JOIN
,自然连接会自动匹配两张表的相同字段,然后进行等值连接
# 正常内连接写法
SELECT employee_id,last_name,department_name
FROM employees e JOIN departments d
ON e.`department_id` = d.`department_id`
AND e.`manager_id` = d.`manager_id`;
# 使用自然连接
SELECT employee_id,last_name,department_name
FROM employees e NATURAL JOIN departments d;
USING连接
USING连接和自然连接很接近,自然连接时自动匹配所有相同字段,USING是指定一个相同字段
# 内连接
SELECT employee_id,last_name,department_name
FROM employees e ,departments d
WHERE e.department_id = d.department_id;
# 使用USING后
SELECT employee_id,last_name,department_name
FROM employees e JOIN departments d
USING (department_id);
注:可以看出来内连接和刚才的等值连接很像,只是所使用的语法不同,其实从实质上两个可以理解成相同的,在SQL92规范中,内连接就是等值连接,而外连接只需要用+,但是MySQL不支持这种写法,现在的SQL99虽然写起来繁琐,但是比较好分辨。
#左外连接 SELECT last_name,department_name FROM employees ,departments WHERE employees.department_id = departments.department_id(+); #右外连接 SELECT last_name,department_name FROM employees ,departments WHERE employees.department_id(+) = departments.department_id;
标签:多表,name,连接,employees,查询,department,NULL,id 来源: https://www.cnblogs.com/jiangblog/p/16410607.html