详解char nchar varchar nvarchar

xiaoxiao2021-02-28  28

    接触过数据库的朋友们,对于char,nchar,varchar和nvarchar这四个类型都挺熟悉的吧。在数据库中,当一个字段为字符串时,大家估计会纠结到底该用那个类型,这里就给大家详细解答一下。

    一 . 定义

        char:固定长度,存储ASCII字符,不足的自动补英文半角空格,超出的自动截取未溢出的部分。

        nchar:固定长度,存储Unicode字符,不足的自动补英文半角空格,超出的自动截取未溢出的部分。

        varchar:可变长度,存储ASCII字符,可以根据长度自动变化。varchar(n)长度为n个字节。

        nvarchar:可变长度,存储Unicode字符,可以根据长度自动变化。

  二 . 优缺点

     char:存储定长数据很方便,char字段上的索引效率级高。至于char的缺点,举个例子吧,比如char(10),那么不管你存储的数据是否达到了10个字节,都要占去10个字节的空间。

     varchar:存储变长数据,但是存储效率没有char高。如果一个字段的值可能是不定长的,但是又知道他不可能超过10个字符,把它定义成varchar(10)是最划算的。varchar类型的实际长度是它值的实际长度+1。“+1”?,这个字节用于保存实际用了多大的长度。

    从空间上考虑,用varchar合适;从效率上,用char合适。

    nchar,nvarchar:相比char和varchar多了个“n”,"n"是指存储Unicode字符,即所有的字符都占两个字节(生僻字占四字节)。nchar,nvarchar最多存储4000个字符,不论英文还是汉字;char,varchar最多存储8000个字符,8000个英文 数字和符号,4000个汉字。可以看出nchar,nvarchar数据类型时,不用担心输入的字符时英文还是汉字,较为方便,但是存储英文时数量上有些损失。所以有中文字符,用nchar和nvarchar;只有英文和数字,用char和varchar。

    再说一下"var",有var前缀的,表示实际的存储空间是变长的,如varchar,nvarchar。

    既然是详解,那么再给大家介绍一下关于Unicode,ASCII和UTF-8编码,字节。

    ASCII编码是指最早被编码到计算机里的127个字符,这些字符包括大小写英文字母,数字和一些符号。例如:大写字母A的编码是65,小写字母Z的编码是122.

    但是要处理中文至少需要两个字节,而且还不能和ASCII编码冲突,所以中国制定了GB2312编码,用来把中文编进去。全世界有上百种语言。各国有各国的标准,就会不可避免地出现冲突,结果就是,在多语言混合的文本中,显示出来会有乱码。因此,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。

    Unicode标准也在不断发展,最常用的是用两个字节表示一个字符(非常偏僻的字符就需要4个字节)。现代操作系统和大多数编程语言都直接支持Unicode。如果统一成Unicode编码,乱码问题从此消失了,但是如果你写的文本基本上全部是英文的话,用Unicode编码比ASCII编码需要多一倍的存储空间,在存储和传输上就十分不划算。所以,又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。

    UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。UTF-8编码有一个额外的好处,就是ASCII编码实际上可以被看成是UTF-8编码的一部分,所以,大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

    然后又有疑问了,上面提到了好多“字节”这个词,但是字节的到底是什么?

    字节(byte)是计算机信息技术用于计算存储容量的一种计量单位,通常情况下1字节等于有8位。

    1B(byte,字节)= 8 bit;

    1 KB = 10^3 B = 1000 B;

    位(bit)是计算机中数据最小单位,即二进制位,数值位0和1。一个字节8位,一个汉字通常为16位二进制数(2字节)。用8位二进制数表示的字符叫单字节字符,用16位二进制表示的字符叫双字节字符。

转载请注明原文地址: https://www.6miu.com/read-1950235.html

最新回复(0)