当前位置:首页 > 解答 > 正文

    我们在电脑上输入一个字符时,究竟输入的是什么?

    匿名用户 2022-06-21 18:02:23提问

你可以搜索全国信息技术标准化技术委员会
汉字内码扩展规范(GBK),这里可以看到,你输入的汉字其实是一串字母和数字比如"啊"字对应的GBK编码是"B0A1".,所以各个编码之间是不通用的 保存的是字节,头部会加编码类型。在你用编辑器打开的时候会读取头部,看看是什么编码,根据编码类型转换成文字。显示在编辑器。

这几天也在处理编码问题,gbk复制到utf8肯定要一个转换。一般不用二进制表示,而是用字节表示,一个字节等于8位(也就是8个二进制数)。不同编码,一个汉字对应的是不同长度的字节。
比如:
gbk中文两个字节(16个二进制),utf8中文3个字节(24个二进制),英文两者都一样一个字节。
复制的二进制到底是什么?要对着编码表查询(gbk编码表,utf8编码表)。
不同编码存储在硬盘编码是不同的。值不同。