数据库基础知识
为什么要使用数据库
数据保存在内存
优点: 存取速度快
缺点: 数据不能永久保存
数据保存在文件
优点: 数据永久保存
缺点:1)速度比内存操作慢,频繁的 IO 操作。2)查询数据不方便
数据保存在数据库
1)数据永久保存
2)使用 SQL 语句,查询方便效率高。
3)管理数据方便
什么是 SQL?
结构化查询语言(Structured Query Language)简称 SQL,是一种数据库查询语言。
作用:用于存取数据、查询、更新和管理关系数据库系统。
什么是 MySQL?
MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,属于 Oracle 旗下产
品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL 是最好
的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件
之一。在 Java 企业级开发中非常常用,因为 MySQL 是开源免费的,并且方便扩展。
数据库三大范式是什么
第一范式:每个列都不可以再拆分。
第二范式:在第一范式的基础上,非主键列完全依赖于主键,而不能是依赖于主键的一部
分。
第三范式:在第二范式的基础上,非主键列只依赖于主键,不依赖于其他非主键。
在设计数据库结构的时候,要尽量遵守三范式,如果不遵守,必须有足够的理由。比如性
能。事实上我们经常会为了性能而妥协数据库的设计。
mysql 有关权限的表都有哪几个
MySQL 服务器通过权限表来控制用户对数据库的访问,权限表存放在 mysql 数据库里,由
mysql_install_db 脚本初始化。这些权限表分别 user,db,table_priv,columns_priv 和
host。下面分别介绍一下这些表的结构和内容:
• user 权限表:记录允许连接到服务器的用户帐号信息,里面的权限是全局级的。
• db 权限表:记录各个帐号在各个数据库上的操作权限。
• table_priv 权限表:记录数据表级的操作权限。
• columns_priv 权限表:记录数据列级的操作权限。
• host 权限表:配合 db 权限表对给定主机上数据库级操作权限作更细致的控制。这个权限表
不受 GRANT 和 REVOKE 语句的影响。
MySQL 的 binlog 有有几种录入格式?分
别有什么区别?
有三种格式,statement,row 和 mixed。
• statement 模式下,每一条会修改数据的 sql 都会记录在 binlog 中。不需要记录每一行的变
化,减少了 binlog 日志量,节约了 IO,提高性能。由于 sql 的执行是有上下文的,因此在
保存的时候需要保存相关的信息,同时还有一些使用了函数之类的语句无法被记录复制。
• row 级别下,不记录 sql 语句上下文相关信息,仅保存哪条记录被修改。记录单元为每一行
的改动,基本是可以全部记下来但是由于很多操作,会导致大量行的改动(如 alter table),
因此这种模式的文件保存的信息太多,日志量太大。
• mixed,一种折中的方案,普通操作使用 statement 记录,当无法使用 statement 的时候使
用 row。
此外,新版的 MySQL 中对 row 级别也做了一些优化,当表结构发生变化的时候,会记录
语句而不是逐行记录。
数据类型
mysql 有哪些数据类型
分类
类型名称
说明
整数类型
tinyInt
很小的整数(8 位二进制)
smallint
小的整数(16 位二进制)
mediumint
中等大小的整数(24 位二进制)
int(integer)
普通大小的整数(32 位二进制)
小数类型
float
单精度浮点数
double
双精度浮点数
decimal(m,d)
压缩严格的定点数
日期类型
year
YYYY 1901~2155
time
HH:MM:SS -838:59:59~838:59:59
date
YYYY-MM-DD 1000-01-01~9999-12-3
datetime
YYYY-MM-DD HH:MM:SS 1000-01-01 00:00:00~
9999-12-31 23:59:59
timestamp
YYYY-MM-DD HH:MM:SS 1970
01
01 00:00:01
UTC~2038-01-19 03:14:07UTC
文本、二进
制类型
CHAR(M)
M 为 0~255 之间的整数
VARCHAR(M)
M 为 0~65535 之间的整数
TINYBLOB
允许长度 0~255 字节
BLOB
允许长度 0~65535 字节
MEDIUMBLOB
允许长度 0~167772150 字节
LONGBLOB
允许长度 0~4294967295 字节
TINYTEXT
允许长度 0~255 字节
TEXT
允许长度 0~65535 字节
MEDIUMTEXT
允许长度 0~167772150 字节
LONGTEXT
允许长度 0~4294967295 字节
VARBINARY(M)
允许长度 0~M 个字节的变长字节字符串
BINARY(M)
允许长度 0~M 个字节的定长字节字符串
• 1、整数类型,包括 TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT,分别表示 1
字节、2 字节、3 字节、4字节、8 字节整数。任何整数类型都可以加上 UNSIGNED 属性,
表示数据是无符号的,即非负整数。长度:整数类型可以被指定长度,例如:INT(11)表
示长度为 11 的 INT 类型。长度在大多数场景是没有意义的,它不会限制值的合法范围,只
会影响显示字符的个数,而且需要和 UNSIGNED ZEROFILL 属性配合使用才有意义。例
子,假定类型设定为 INT(5),属性为 UNSIGNED ZEROFILL,如果用户插入的数据为 12
的话,那么数据库实际存储数据为 00012。
• 2、实数类型,包括 FLOAT、DOUBLE、DECIMAL。DECIMAL 可以用于存储比 BIGINT
还大的整型,能存储精确的小数。而 FLOAT 和 DOUBLE 是有取值范围的,并支持使用标
准的浮点进行近似计算。计算时 FLOAT 和 DOUBLE 相比 DECIMAL 效率更高一些,
DECIMAL 你可以理解成是用字符串进行处理。
• 3、字符串类型,包括 VARCHAR、CHAR、TEXT、BLOB。VARCHAR 用于存储可变
长字符串,它比定长类型更节省空间。VARCHAR 使用额外 1 或 2 个字节存储字符串长度。
列长度小于 255 字节时,使用 1 字节表示,否则使用 2 字节表示。VARCHAR 存储的内容
超出设置的长度时,内容会被截断。CHAR 是定长的,根据定义的字符串长度分配足够的
空间。CHAR 会根据需要使用空格进行填充方便比较。CHAR 适合存储很短的字符串,或
者所有值都接近同一个长度。CHAR 存储的内容超出设置的长度时,内容同样会被截断。
使用策略:对于经常变更的数据来说,CHAR 比 VARCHAR 更好,因为 CHAR 不容易产生
碎片。对于非常短的列,CHAR 比 VARCHAR 在存储空间上更有效率。使用时要注意只分
配需要的空间,更长的列排序时会消耗更多内存。尽量避免使用 TEXT/BLOB 类型,查询
时会使用临时表,导致严重的性能开销。
• 4、枚举类型(ENUM),把不重复的数据存储为一个预定义的集合。有时可以使用
ENUM 代替常用的字符串类型。ENUM 存储非常紧凑,会把列表值压缩到一个或两个字节。
ENUM 在内部存储时,其实存的是整数。尽量避免使用数字作为 ENUM 枚举的常量,因为
容易混乱。排序是按照内部存储的整数
• 5、日期和时间类型,尽量使用 timestamp,空间效率高于 datetime,用整数保存时间戳
通常不方便处理。如果需要存储微妙,可以使用 bigint 存储。看到这里,这道真题是不是
就比较容易回答了。
引擎
MySQL 存储引擎 MyISAM 与 InnoDB 区
别
存储引擎 Storage engine:MySQL 中的数据、索引以及其他对象是如何存储的,是一套文
件系统的实现。
常用的存储引擎有以下:
• Innodb 引擎:Innodb 引擎提供了对数据库 ACID 事务的支持。并且还提供了行级锁和外键
的约束。它的设计的目标就是处理大数据容量的数据库系统。
• MyIASM 引擎(原本 Mysql 的默认引擎):不提供事务的支持,也不支持行级锁和外键。
• MEMORY 引擎:所有的数据都在内存中,数据的处理速度快,但是安全性不高。
MyISAM 与 InnoDB 区别
MyISAM
Innodb
存储结构
每张表被存放在三个文件:
frm-表格定义、
MYD(MYData)-数据文件、
MYI(MYIndex)-索引文件
所有的表都保存在同一个数据文
件中(也可能是多个文件,或者
是独立的表空间文件),
InnoDB 表的大小只受限于操作
系统文件的大小,一般为 2GB
存储空间
MyISAM 可被压缩,存储空间
较小
InnoDB 的表需要更多的内存和
存储,它会在主内存中建立其专
用的缓冲池用于高速缓冲数据和
索引
可移植性、备份及
恢复
由于 MyISAM 的数据是以文件
的形式存储,所以在跨平台的
数据转移中会很方便。在备份
和恢复时可单独针对某个表进
行操作
免费的方案可以是拷贝数据文
件、备份 binlog,或者用
mysqldump,在数据量达到几十
G 的时候就相对痛苦了
文件格式
数据和索引是分别存储的,数
据.MYD,索引.MYI
数据和索引是集中存储的,.ibd
记录存储顺序
按记录插入顺序保存
按主键大小有序插入
外键
不支持
支持
事务
不支持
支持
锁支持(锁是避免
资源争用的一个机
制,MySQL 锁对用
户几乎是透明的)
表级锁定
行级锁定、表级锁定,锁定力度
小并发能力高
SELECT
MyISAM 更优
INSERT、
UPDATE、
DELETE
InnoDB 更优
select count(*)
myisam 更快,因为 myisam
内部维护了一个计数器,可以
直接调取。
索引的实现方式
B+树索引,myisam 是堆表
B+树索引,Innodb 是索引组织
表
哈希索引
不支持
支持
全文索引
支持
不支持
MyISAM 索引与 InnoDB 索引的区别?
• InnoDB 索引是聚簇索引,MyISAM 索引是非聚簇索引。
• InnoDB 的主键索引的叶子节点存储着行数据,因此主键索引非常高效。
• MyISAM 索引的叶子节点存储的是行数据地址,需要再寻址一次才能得到数据。
• InnoDB 非主键索引的叶子节点存储的是主键和其他带索引的列数据,因此查询时做到覆
盖索引会非常高效。