详解char nchar varchar nvarchar

xiaoxiao2021-02-28 158

接触过数据库的朋友们，对于char，nchar，varchar和nvarchar这四个类型都挺熟悉的吧。在数据库中，当一个字段为字符串时，大家估计会纠结到底该用那个类型，这里就给大家详细解答一下。

一 . 定义

char：固定长度，存储ASCII字符，不足的自动补英文半角空格，超出的自动截取未溢出的部分。

nchar：固定长度，存储Unicode字符，不足的自动补英文半角空格，超出的自动截取未溢出的部分。

varchar：可变长度，存储ASCII字符，可以根据长度自动变化。varchar(n)长度为n个字节。

nvarchar：可变长度，存储Unicode字符，可以根据长度自动变化。

二 . 优缺点

char：存储定长数据很方便，char字段上的索引效率级高。至于char的缺点，举个例子吧，比如char(10)，那么不管你存储的数据是否达到了10个字节，都要占去10个字节的空间。

varchar：存储变长数据，但是存储效率没有char高。如果一个字段的值可能是不定长的，但是又知道他不可能超过10个字符，把它定义成varchar(10)是最划算的。varchar类型的实际长度是它值的实际长度+1。“+1”？，这个字节用于保存实际用了多大的长度。

从空间上考虑，用varchar合适；从效率上，用char合适。

nchar，nvarchar：相比char和varchar多了个“n”,"n"是指存储Unicode字符，即所有的字符都占两个字节（生僻字占四字节）。nchar，nvarchar最多存储4000个字符，不论英文还是汉字；char，varchar最多存储8000个字符，8000个英文数字和符号，4000个汉字。可以看出nchar，nvarchar数据类型时，不用担心输入的字符时英文还是汉字，较为方便，但是存储英文时数量上有些损失。所以有中文字符，用nchar和nvarchar；只有英文和数字，用char和varchar。

再说一下"var"，有var前缀的，表示实际的存储空间是变长的，如varchar，nvarchar。

既然是详解，那么再给大家介绍一下关于Unicode，ASCII和UTF-8编码，字节。

ASCII编码是指最早被编码到计算机里的127个字符，这些字符包括大小写英文字母，数字和一些符号。例如：大写字母A的编码是65，小写字母Z的编码是122.

但是要处理中文至少需要两个字节，而且还不能和ASCII编码冲突，所以中国制定了GB2312编码，用来把中文编进去。全世界有上百种语言。各国有各国的标准，就会不可避免地出现冲突，结果就是，在多语言混合的文本中，显示出来会有乱码。因此，Unicode应运而生。Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了。

Unicode标准也在不断发展，最常用的是用两个字节表示一个字符（非常偏僻的字符就需要4个字节）。现代操作系统和大多数编程语言都直接支持Unicode。如果统一成Unicode编码，乱码问题从此消失了，但是如果你写的文本基本上全部是英文的话，用Unicode编码比ASCII编码需要多一倍的存储空间，在存储和传输上就十分不划算。所以，又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间。UTF-8编码有一个额外的好处，就是ASCII编码实际上可以被看成是UTF-8编码的一部分，所以，大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

然后又有疑问了，上面提到了好多“字节”这个词，但是字节的到底是什么？

字节（byte）是计算机信息技术用于计算存储容量的一种计量单位，通常情况下1字节等于有8位。

1B（byte，字节）= 8 bit；

1 KB = 10^3 B = 1000 B；

位（bit）是计算机中数据最小单位，即二进制位，数值位0和1。一个字节8位，一个汉字通常为16位二进制数（2字节）。用8位二进制数表示的字符叫单字节字符，用16位二进制表示的字符叫双字节字符。

转载请注明原文地址: https://www.6miu.com/read-1950235.html

技术

最新回复(0)