重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
关系运算包括四种:投影、选择、连接、除。
为信宜等地区用户提供了全套网页设计制作服务,及信宜网站建设行业解决方案。主营业务为成都网站建设、成都网站制作、信宜网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!
在任何一种数据库管理系统中(包括MySQL),投影对应于SELECT子句,选择对应于WHERE子句,连接对应于JOIN子句,但除没有直接的对应语句,需要根据题目的实际含义书写复杂的SQL,通常都会包含子查询。
Mysql 工作原理图
Mysql是由SQL接口,解析器,优化器,缓存,存储引擎组成的。
mysql原理图各个组件说明:
1. connectors
与其他编程语言中的sql 语句进行交互,如php、java等。
2. Management Serveices Utilities
系统管理和控制工具
3. Connection Pool (连接池)
管理缓冲用户连接,线程处理等需要缓存的需求
4. SQL Interface (SQL接口)
接受用户的SQL命令,并且返回用户需要查询的结果。比如select from就是调用SQL Interface
5. Parser (解析器)
SQL命令传递到解析器的时候会被解析器验证和解析。
主要功能:
a . 将SQL语句分解成数据结构,并将这个结构传递到后续步骤,后面SQL语句的传递和处理就是基于这个结构的
b. 如果在分解构成中遇到错误,那么就说明这个sql语句是不合理的,语句将不会继续执行下去
6. Optimizer (查询优化器)
SQL语句在查询之前会使用查询优化器对查询进行优化(产生多种执行计划,最终数据库会选择最优化的方案去执行,尽快返会结果) 他使用的是“选取-投影-联接”策略进行查询。
用一个例子就可以理解: select uid,name from user where gender = 1;
这个select 查询先根据where 语句进行选取,而不是先将表全部查询出来以后再进行gender过滤
这个select查询先根据uid和name进行属性投影,而不是将属性全部取出以后再进行过滤
将这两个查询条件联接起来生成最终查询结果.
7. Cache和Buffer (查询缓存)
如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。
这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key缓存,权限缓存等
8.Engine (存储引擎)
存储引擎是MySql中具体的与文件打交道的子系统。也是Mysql最具有特色的一个地方。
Mysql的存储引擎是插件式的。它根据MySql AB公司提供的文件访问层的一个抽象接口来定制一种文件访问机制(这种访问机制就叫存储引擎)
SQL 语句执行过程
数据库通常不会被直接使用,而是由其他编程语言通过SQL语句调用mysql,由mysql处理并返回执行结果。那么Mysql接受到SQL语句后,又是如何处理
首先程序的请求会通过mysql的connectors与其进行交互,请求到处后,会暂时存放在连接池(connection pool)中并由处理器(Management Serveices Utilities)管理。当该请求从等待队列进入到处理队列,管理器会将该请求丢给SQL接口(SQL Interface)。SQL接口接收到请求后,它会将请求进行hash处理并与缓存中的结果进行对比,如果完全匹配则通过缓存直接返回处理结果;否则,需要完整的走一趟流程:
(1)由SQL接口丢给后面的解释器(Parser),解释器会判断SQL语句正确与否,若正确则将其转化为数据结构。
(2)解释器处理完,便来到后面的优化器(Optimizer),它会产生多种执行计划,最终数据库会选择最优化的方案去执行,尽快返会结果。
(3)确定最优执行计划后,SQL语句此时便可以交由存储引擎(Engine)处理,存储引擎将会到后端的存储设备中取得相应的数据,并原路返回给程序。
注意点
(1)如何缓存查询数据
存储引擎处理完数据,并将其返回给程序的同时,它还会将一份数据保留在缓存中,以便更快速的处理下一次相同的请求。具体情况是,mysql会将查询的语句、执行结果等进行hash,并保留在cache中,等待下次查询。
(2)buffer与cache的区别
从mysql原理图可以看到,缓存那里实际上有buffer和cache两个,那它们之间的区别:简单的说就是,buffer是写缓存,cache是读缓存。
(3)如何判断缓存中是否已缓存需要的数据
这里可能有一个误区,觉得处理SQL语句的时候,为了判断是否已缓存查询结果,会将整个流程走一遍,取得执行结果后再与需要的进行对比,看看是否命中,并以此说,既然不管缓存中有没有缓存到查询内容,都要整个流程走一遍,那缓存的优势在哪?
其实并不是这样,在第一次查询后,mysql便将查询语句以及查询结果进行hash处理并保留在缓存中,SQL查询到达之后,对其进行同样的hash处理后,将两个hash值进行对照,如果一样,则命中,从缓存中返回查询结果;否则,需要整个流程走一遍。
查询语句:select 语句
三种能力:投影、选择、连接
投影:在一张二维表中根据所需要的条件选出所需要的列
选择:在二维表中根据所需的条件选择合适的行
连接:从一张或者多张表中获取所需要的行,并且把这个行结合在一起的查询
SQL语句大小写不敏感。
select语句是可以计算的
算术表达式和运算符优先级
举例:select ename,sal 12*sal+100 from emp
计算出年薪+100块
NULL值是不可用,且未分配的,未知并且不适用的值,可以当成是保留值
AS其实可以省略
例如:select ename as name,sal salary from emp;
查询出的字段会自动换成别名
例子:select ename "Name",sal*12 "Annual Salary" from emp;
级联操作是将列或字符串和其他列串联,由两条竖线(||)表示
select ename,job,ename || job as "Employees" from emp;
可以看出Employees就将ENAME和JOB进行结合的一个操作
在select句子中适用DISTINCT 关键字消除重复行
select distinct deptnp from emp;
限制选择的行:
where关键字
如果where后面查的数据是字符串类型或者日期类型的要加''号
#######比较条件
举几个例子:
select ename,job,sal,deptno from emp where sal between 5000 and 10000;
这个是包含了5000和10000的
in的表达:
select empno,ename,mgr,deptno from emp where mgr in (7788,7782,7000);
只要mgr有括号里面的值都显示出来。
通配符:%通配的是多个字符,_通配的是一个字符
IS NULL是查询某个字段为空的显示出来
and、or、not
例子:
查询sal=2000和job的内容是包括MAN字符串的,当同时满足两个条件时候才返回结果。
and就是两边同时为真,or的话是有一边为真就行,not就是不等于
ASC 升序,默认升序
DESC 降序
例子:
将deptno中进行升序排列,排列出来后,在将sal进行降序排列。
单行函数:就是对单行数据进行处理的函数,只针对这一条数据得出一个结果
函数工作的过程
ROUND(45.926,2)是将45.926这个数字的小数点后两位进行四舍五入操作得到45.93
TRUNC(45.926,2) 是将45.926这个数字的小数点后两位后面的进行丢掉。
返回当前系统日期
经常是不同类型之间的转换
TO_CHAR就是将日期型数字型转换成字符型
例子:
数字型的转换
把字符转换成数字:
把字符转换成日期:
什么是分组函数?
另外的名字叫多行函数,针对于多行数据进行一个汇总处理的一类函数,最后会得到一个汇总的结果。
例子:
其实就是对一系列数据找最大值
基本格式:select group_function(column),... from table [where condition];
首先对一个数据进行分类汇总把每一组的数据单独的拿出来。就是对每一列数据的相同数据进行一个分组,然后在将分组后的结果再去执行select后面跟的一个分组函数的操作。
例子:
那下面这样的怎么操作呢?
其实就是对分组以后的结果再次进行一个限制筛选
where和Having的区别?
where是针对于整体的一个查询结果
Having是针对于分组后的查询结果的一个条件限制,它是不能单独存在的,它只能够在group by后面
下面是它的表达式:
显示部门的最大平均薪水是多少
select max(avg(sal))
是这样的一个嵌套
当我们查的数据存在于多个表的时候就需要多表查询
下面是用到的表
一个是EMP的职员表、一个是DEPT的部分表
表连接的三种方式:
从总类上来看:自连接、等值连接、外连接(又可以分为三类:左连接、右连接、全连接)
自连接:一个表自己与自己建立连接成为自连接或自身连接。
在查询的时候多表,这两张表是同一张表,所以在查询前我们需要对这个表进行一个别名的重命名。
举例:查询出员工编号、名字及其经理名字
MGR对应的是经理的ID号,这个对应的就是另一张经理表中的名字
表示比较连接列的值显示出最终的一个结果,其查询结果中列出被连接表中的所有列,包括其中的重复列。
查询员工的姓名 工作 部门号 部门名称
左连接就是返回左边的匹配行,不考虑右边的表是否有相应的行
(+)的意思就是dept是个匹配表,左边是一个基础表,基础表优先,如果右边这个表找不到对应的值去匹配,会自动填空
右连接就是返回右边的匹配行,不考虑左边的表是否有相应的行,如果没有会自动填空
左表右表都不做限制,所有的记录都显示,不足的地方用null填充
FULL JOIN表示emp和dept做一个全连接
ON表示触发条件 。