MySQL SQL基础入门-你想要的我尽可能覆盖全

MySQL SQL基础入门-你想要的我尽可能覆盖全

2024-11-18 13:05

SQL（Structured Query Language) ,结构化查询语言。SQL是一种专用语言，用户关系型数据库管理系统或者在关系流数据管理系统中进行流处理。

SQL怎么读？两种读法：一个字母一个字母读或者连起来读。一个字母一个字母读音标： /ˌɛsˌkjuːˈɛl/，连读音标： /ˈsiːkwəl/ 。

关系型数据是一种数据库类型，关系型数据库存储和提供数据都是相互关联的。关系型数据库是通过关系模型来组织数据的。通常关系型数据通过多张表中的行和列来组织关系。表中的行也叫记录或者元组。列也叫属性。

MySQL SQL基础入门-你想要的我尽可能覆盖全

什么是数据库？

数据库是在按照数据模型来组织，存储和管理数据的集合。数据库一般由很多表组成，这些表之间有直接或者间接的关系。我们可以把表定义为图中的节点，关系为他们之间的边。如下图：

什么是数据库管理系统？

数据库管理系统是数据库系统的核心部分，他复杂各种CRUD，没有它根本就不会存在数据库系统。

常见的数据库管理系统：MySQL, PostgreSQL, MariaDB, Oracle, SQL Server, DB2…一大堆。

MySQL SQL基础入门-你想要的我尽可能覆盖全

什么是数据库系统？

数据库系统是一个生态系统，包括数据库，数据库管理系统和数据库的集成环境还有你的应用程序（我们都是数据库系统开发工程师。。。）。这是说首先你得有一个系统来CRUD你的数据库，然后你得有各种driver能连接数据库系统，或者有GUI的客户端来操作数据库。比如：你启动一个MySQL就是启动了一个数据库管理系统，你在MySQL中新建自己的数据库，使用MySQL的driver和dialect(方言)来操作MySQL数据库，那么这个整体就是数据库系统。

关系流数据管理系统是借鉴了数据库管理系统的一些概念和技术针对大量流数据进行快速响应的系统。其实我理解就是大数据哪些内容。

常见的关系流数据管理系统：Spark， Flink，Storm。

文章中所有的SQL都是基于MySQL 8.0数据库系统。

这些概念整的人头大。

DDL（Data Defination Language)数据定义语言
DQL（Data Query Language)数据查询语言：用来查询数据中的数据,专指查询：SELECT
DCL（Data Control Language）数据控制语言：用来控制权限：Authorization
DML（Data Manipulation Language) 数据操纵语言，指的就是CRUD

大家对DQL的认可度不高，DDL，DML和DCL听得比较多，我理解是因为SELECT专指SELECT xxxx,如果你使用FROM和WHERE，那么FROM和WHERE就属于DML了，感觉还是挺鸡肋的。

MySQL SQL基础入门-你想要的我尽可能覆盖全

约束就是限制一个数据只能为A不能为B。比如：你设置一个用户的用户名长度不能超过20个中文，性别在数据库中的类型只能为数字，那么数据库会遵守这些约束，当程序向数据库写入用户名超过20个中文时就会报错，性别写入字符串时也会报错。

当然我们对约束的需求还是比较多的，主要有以下几类：

主键
唯一键
外键
check
NOT NULL
Default
数据类型
字段长度

我们上面列了这么多，MySQL可以通过下面的SQL来查询约束

COPY

数据库提供了很多数据类型以满足我们的应用需求，虽然很多，但是分类一下还是很清晰的，看下数据类型图：

Numberic Types

Numeric TypeSigned RangeUnsigned RangeTINYINT-128 to 1270 to 255SMALLINT-32768 to 327670 to 65535MEDIUMINT-8388608 to 83886070 to 16777215INT or INTEGER-2147483648 to 21474836470 to 4294967295BIGINT-9223372036854775808 to 92233720368547758070 to 18446744073709551615DECIMAL (M,D) or NUMERIC (M,D)Depends on M and D valuesDepends on M and D valuesFLOAT (P)-3.402823466E+38 to -1.175494351E-38, 0, and 1.175494351E-38 to 3.402823466E+380 to 3.402823466E+38DOUBLE (M,D)-1.7976931348623157E+308 to -2.2250738585072014E-308, 0, and 2.2250738585072014E-308 to 1.7976931348623157E+3080 to 1.7976931348623157E+308BIT (M)-2^(M-1) to 2^(M-1)-10 to 2^M-1BOOLEANN/AN/ASERIALN/A1 to 18446744073709551615

What is the size of column of int(11) in mysql in bytes?

String types

String TypeDescriptionCHAR(M)A fixed-length string useful when all values are approximately the same length. Pad with space when saved. M can be from 0 to 255.VARCHAR(M)A variable-length string useful when values are of varying length. M can be from 0 to 65535.TINYTEXTA tiny text string holding a maximum length of 255 characters.TEXTA text string holding a maximum length of 65,535 charactersMEDIUMTEXTA medium-sized text string which can hold a string with a maximum length of 16,777,215 charactersLONGTEXTA large text string which can hold a string with a maximum length of 4,294,967,295 charactersENUM(‘value1′,’value2’,…)A string object with a value chosen from a list of permitted valuesSET(‘value1′,’value2’,…)A string objects that can have zero or more values, each of which must be chosen from a list of permitted valuesBINARY(M)Similar to CHAR, but stores binary byte strings. Pad with 0x00 bytes when saved.VARBINARY(M)Similar to VARCHAR, but stores binary byte strings.TINYBLOBA binary large object column with a maximum length of 255 bytesBLOBA binary large object column with a maximum length of 65,535 bytesMEDIUMBLOBA binary large object column with a maximum length of 16,777,215 bytesLONGBLOBA binary large object column with a maximum length of 4,294,967,295 bytes

Date types

Date/Time TypeDescriptionDATEA date. The supported range is ‘1000-01-01’ to ‘9999-12-31’.DATETIMEA date and time combination. The supported range is ‘1000-01-01 00:00:00’ to ‘9999-12-31 23:59:59’.TIMESTAMPA timestamp. The range is ‘1970-01-01 00:00:01’ UTC to ‘2038-01-19 03:14:07’ UTC.TIMEA time. The range is ‘-838:59:59’ to ‘838:59:59’.YEARA year in four-digit format. Values in the range 1901 to 2155 and 0000.

有这么数据类型可以供我们选择。怎么选择？一般就是根据我们的业务需求，然后满足一定的扩展性的情况下选择存储小的类型。存储小的类型占用的磁盘空间小，数据在一个数据叶中的存储就会更多，增删查改I/O就会更少。

字符集（Character Set）和排序规则（Collation）是与字符编码和字符串比较相关的重要概念。

字符集(Character Set)：字符集是一个符号集合。在电脑中，每一个符号是由若干位表示的，每个符号对应唯一的位模式。简单的说，字符集就是一个符号与位模式之间的对应关系。在MySQL中，它支持多种字符集，如utf8（可以用1到3个字节存储字符），utf8mb4（可以用1到4个字节存储字符），latin1（用1个字节存储字符）等等。选择合适的字符集可以确保您的数据库正确存储和显示各种语言的文本。

排序规则(Collation)：排序规则决定了字符串之间的比较规则。比如在英文中，字母“a”和“A”是相同的。但在计算机中，“a”的ASCII码是97，“A”的ASCII码是65，它们在计算机看来是不同的。因此，我们需要一个规则来指导计算机在比较时应如何处理这种情况，这个规则就是所谓的排序规则。不同的语言和地区，排序规则是不一样的。

但是我从来没有修改过排序规则，我只为能够存储emoji表情把utf-8字符集修改为了utf8mb4。但是前提是业务系统能容忍不区分大小写。

DDL语句帮助我们对数据库从0到1的建设。

创建数据库

我们得先创建数据库，在MySQL中创建数据库的语法如下：

COPY

修改数据库

MySQL ALTER DATABASE无法修改数据库名的，看他的alter_option就可以知道了。

COPY

删除数据库

删除数据库的SQL语句是非常简单的，但是却是个高危操作，可能有不少人因为这个SQL而失业。

COPY

查询数据库

MySQL查询数据库有多种方式：

show
数据字典

COPY

MySQL创建表的SQL特别长，我们这儿只给一部分吧，大家平时使用工具自己生成就好了：

COPY

这儿给出一个示例吧，创建一个trade_user表，这张表有以下字段：

COPY

对应的建表语句如下：

COPY

我们再新建一张表表示用户的订单方便我们后面进行SQL测试。表结构如下所示：

COPY

建表SQL：

COPY

有些数据库比如MySQL有一种语法：，表示既创建表又从另一张表拷贝数据到新表，但是会有一个问题就会所有的约束和索引会丢失。举个例子：

正确姿势

在使用不熟悉的SQL之前要确保理解了它的所有特性。

修改表使用语句， MySQL 语句如下：

的语法也有点多啊，如果要修改大家还是用工具吧，先修改然后生成SQL。

COPY

修改表指南

MySQL 8.0版本支持了Instant方式修改表结构，但是只能最多64次，64次以后就回退回重建表的方式，然后有有了64次Instant机会。具体可以参考：

MySQL 8 INSTANT 添加或者删除列（是否可以不用担心大表添加/删除列问题了？）
【翻译】MySQL 8.0中的“即时增加和删除列”功能

MySQL删除表还是很简单的但是执行要慎重,SQL语句如下：

COPY

注意

重要的事情说三遍：删除之前要完整备份。删除之前要完整备份。删除之前要完整备份。

MySQL查询表和查询数据库一样有两种方式：

SHOW TABLES
查询数据字典

SQL如下：

COPY

INSERT向表插入新数据，MySQL中一般有三种形式

INSERT INTO tbl_name (col_name[, col_name]…) VALUES (value[, value]…); 这种形式是最基本的形式，用于向指定列插入一行或多行数据
INSERT INTO tbl_name SET col_name=value[, col_name=value]…; 这种形式也可用于插入数据，数据的列名和值是通过“列名=值”的形式一一对应的
INSERT INTO tbl_name (col_name[, col_name]…) SELECT … ; 这种形式是把查询出的数据直接插入到表中

额外说明下：INSERT INTO SELECT可以适用于复制表，数据转换或者聚合完解决查询新表等场景。INSERT INTO 性能特别高。但是有索引会响应一些性能。

我们插入数据都到上面定义的两张表：

COPY

删除数据使用DELETE，使用非常简单，执行要慎重，否则影响绩效（说是影响绩效是因为误删除还可以通过binlog恢复）。

MySQL的delete语法：

COPY

生产环境SQL不要使用select查询出来的数据作为条件，就让DevOps查出来所有满足数据的ID，然后使用ID删除，一批删除不完就分多批，删除之前一定要备份数据，可以整表备份，可以增量备份。
线上删除整表数据不要直接,你的binlog会受不了，你的下游复制会受不了，DevOps要骂人了，用户要骂人了；备份，备份，备份，重要事情说三遍；使用truncate table;不能用truncate table就分批delete,删除完以后optimize一下。

我们大部分时间都在select, 同时select也是变换莫测，目前我也没玩出什么花。

MySQL SQL基础入门-你想要的我尽可能覆盖全

COPY

逻辑运算符小提示

又使用and又使用or的算是复杂查询了，尽可能使用一个区分度比较高的索引，否则就是index range和Index merge了。

COPY

in 避坑

in中有null。

插入一条数据:

COPY

查询一下刚插入的数据：

COPY

查不出来，emo~

换个姿势，再来一次：

COPY

查询出来了，完美~

为什么？在 SQL 中，NULL 不是一个具体的值，而是代表一个“未知”的状态。如果你使用 IN 操作符来查询 NULL，可能会出现问题。这是因为在 SQL 中， NULL 与任何其他值（包括另一个 NULL）的比较操作都会返回 NULL，而不是布尔值 TRUE 或 FALSE。

使用Go的小伙伴有没有试过nil == nil?

COPY

听说like左边%不会走索引？你说了可不算

这都得视情况而定，不是%在左边就一定不走索引。举个例子：还是我们的表。我们的表有50多万数据，索引有3个：主键，idx_name,idx_age。

第一条SQL: 查询用户的所有信息，条件是用户名中有51的用户信息

COPY

结果是真没走索引，全表扫描。

第二条SQL：查询用户的name，条件不变

COPY

结果是走了索引，而且是覆盖索引。

第三条SQL：查询用户的id和name，条件不变

COPY

结果和第二条SQL一模一样。

第四条SQL：查询用户的id,name和birthday，查询条件不变

COPY

结果和第一条一模一样，全表扫描

COPY

Limit M OFFSET N闭坑

参考：MySQL limit N offset M 速度慢？来实际体验下

计数

COPY

又来讨论下count(*), count(1), count(column)了

count()计数：只有有行就+1，不管列值 count(1): count(column): 列不为空+1，否则+0 结果：count()=count(1)=count(id)=count(非空column) !=count(可空列)

什么？我说的有毛病？那你还是看看Stackoverflow的说法？:What is better in MYSQL count(*) or count(1)? 看看MySQL官网的说法：MySQL Aggregation Function

*InnoDB handles SELECT COUNT() and SELECT COUNT(1) operations in the same way. There is no performance difference.MyISAM COUNT(1) is only subject to the same optimization if the first column is defined as NOT NULL.**

COPY

求和避坑

sum()会返回空值，这时候需要应用层判断或者使用数据库函数处理：

COPY

sum()可能会溢出，不过一般不用担心，一般处理钱的问题都是bigint并且以分为单位，如果溢出了说明你家公司效益逆天，扶摇直上九万里。

sum()可能会有性能问题，万一你的条件是全表扫描并且数据很多，那就GG了，所以可以用替代方案，比如：redis 的incr一直加或者减就可以替代某一类的sum。

COPY

匹配条件左右两边都有值时才会返回记录：

COPY

inner join在一对多关系下会返回重复记录，记得去重。

左边的表有值但右边没有匹配，返回的结果集右表为空：

COPY

那个是左表？trade_user因为它在JOIN的右边。

left join在一对多关系下会返回重复记录，记得去重。

左边的表有值但右边没有匹配，返回的结果集右表为空：

COPY

那个是右表？trade_order因为它在JOIN的右边。

right join在一对多关系下会返回重复记录，记得去重。

COPY

子查询是一个嵌套在另一个SQL语句中的SELECT语句。其目的通常是处理复杂的业务逻辑，处理后的结果可以作为外部查询条件使用。子查询可以被嵌套在 SELECT、INSERT、UPDATE、DELETE 语句以及另一个子查询中。子查询分类：

相关子查询（correlated subquery）非相关子查询是一个独立的查询，子查询的结果不依赖于外层查询。他们通常在执行时首先被解析和执行，然后将结果集返回给外部查询以供使用。
非相关子查询（non-correlated subquery）相关子查询依赖于外层查询，并且每一行外层查询的结果都需要执行一次子查询。相关子查询在执行时，对外层查询的每一行记录都进行一次子查询操作。

非相关子查询

不依赖外层的查询。

COPY

排序避坑

这条SQL在遇到NULL值的时候会有问题，比如我们的SQL如下：

COPY

结果输出：

COPY

这很疑惑啊，id=525592出来凑什么热闹？分析下？这条数据和其他的区别就在于age=NULL，再翻翻数据库的文档：对NULL列做运算则结果是NULL，NULL在排序中被视为最小值。举个例子：

COPY

分组(grouping)可能遇到的问题

this is incompatible with sql_mode=only_full_group_by 原因：
COPY

SQL-92及更早版本的标准不允许在查询中，选择列表，HAVING条件或ORDER BY列表引用非聚合列，且这些列在GROUP BY子句中未被命名。例如，以下查询在SQL-92标准中是非法的，因为select列表中的非聚合列name未出现在GROUP BY中：

SELECT o.custid, c.name, MAX(o.payment) FROM orders AS o, customers AS c WHERE o.custid = c.custid GROUP BY o.custid;

要使此查询在SQL-92中合法，必须从select列表中省略name列，或者在GROUP BY子句中命名它。

SQL:1999及以后的版本允许这种非聚合列存在于可选功能T301中，前提是它们在功能上依赖于GROUP BY列：如果name和custid之间存在这样的关系，查询就是合法的。例如，如果custid是customers的主键，那么这种情况就会发生。

NULL值

UNION 命令用于合并两个或两个以上 SELECT 语句的结果集。同时，UNION 会删除结果集中重复的行。

UNION 通过比较结果集中所有的行来去除重复行，这一过程对应的是一个完全的行比较，只有两行数据中的所有字段都完全一致，系统才会识别这两行为重复并进行去重。

需要注意的是，UNION 命令只会删除完全一样（所有列的值都一样）的行。当使用 UNION 时，每个 SELECT 语句必须具有相同数量的列，列也必须具有相像的数据类型，且顺序也必须相同。

如果你不想去除结果集中的重复行，可以使用 UNION ALL。相比 UNION，UNION ALL 不会去除重复行，所以它的执行速度比 UNION 更快。

COPY

union 和 union all 区别？

区别UNIONUNION ALL去重会自动去除所有重复的行不会去除重复的行性能因为去重的操作，的性能可能比的性能较低的性能一般会优于结果集大小返回的结果集可能小于或等于两个查询结果集的和返回的结果集大小恰好等于两个查询结果集的和操作对两个结果集执行集合并（set union）合并两个结果集，包括所有重复的行

COPY

窗口函数与Group By比较

以下是上述内容的口语化版本：

表示不知道或缺失的信息：可以理解为某条数据中一种"我不知道"或者"信息缺失"的状态。
无法用常规方式比较：不等于任何值，包括它自己。我们不能用，，或者这样的运算符来检查一个值是否是，但可以使用或。
在排序时的特别位置：在排序时，比如使用，通常会被看作是最小的值。如果你是升序排序，会排在最前；如果是降序排序，会放在最后。
参与运算结果还是未知：在做数学运算时，无论是和什么数运算，只要有参与，结果就是。
在统计运算中被忽视：在做统计运算时，大多数时候会被忽略掉，但如果我们计算所有的行数，比如用，就会被计进去。
在逻辑判断中为假：在 MySQL 中，和零都被看作是假，而其他的非零和非的值都被视为真。
可以被加索引：如果你使用的是 MyISAM，InnoDB 或者 MEMORY 这些存储引擎，你可以在可能有值的列上加索引。
在分组中被认为是一样的：当我们做分组计算的时候，所有的都被认为是一样的。
适用于所有数据类型：几乎所有的数据类型都可以包含，本身并没有数据类型。
不阻止插入零或空字符串：即使列被设定为也完全可以插入零或空字符串，因为真正被阻止的是，而零和空字符串都是具体的值。
无法通过 in 运算符查询：例如，语句不会返回任何结果，因为不能被直接查询，如果需要查询值，应使用语句。

Difference Between Explain And Explain Analyze

关于事务和事务隔离级别可以参考：

MySQL 事务与事务隔离级别
快分清MySQL当前读、快照读和幻读关系
当前读,快照读，脏读，幻读和不可重复读

关于锁可以参考：

MySQL 锁合集与事务隔离级别