对字符和字符编码的理解:
字符指类字形单位或符号,包括字母、数字、运算符号、标点符号和其他符号,以及一些功能性符号。
从人的角度看,字符就是一个独立的符号。
从计算机的角度看,字符就是一串二进制数。
而,这串所谓的二进制数就是对字符的编码。
当然,根据编码的作用不同,就会分出来不同类型的编码。
常用的编码类型:
编码类型 | 生日 | 作用 | 编码的长度 |
---|---|---|---|
ASCII | 1967 | 表示英语和西欧语言 | 1byte |
GB2312 | 1980 | 国家简体中文字符集,兼容ASCII | 2bytes |
Unicode | 1991 | 国际标准组织统一标准字符集 | 2bytes |
UTF-8 | 1992 | 不定长编码 | 1-3bytes |
GBK | 1995 | GB2312的扩展字符集,支持繁体字,兼容GB2312 | 2bytes |
1、ASCII(American Standard Code for Information Interchange,美国信息交换标准编码)
ASCII码分为两种:标准ASCII码和扩展ASCII码
(1)标准ASCII码
也叫基本ASCII码,共128个编码,对应128种字符。使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符。
(2)扩展ASCII码
后128个编码称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展ASCII 码允许将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。