python UTF-8编码是什么

864次阅读
没有评论

python

1、说明

UTF-8编码,即“可变长的编码”。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,很生僻的字符会被编码成4-6个字节。

2、注意点

Python的诞生比Unicode标准早,所以最早的Python只支持ASCII代码。

一般字符串ABC在Python中都是ASCII编码。

使用UTF-8代码还有另一个好处,那就是ASCII代码实际上可以被视为UTF-8代码的一部分。

因此,大量只支持ASCII代码的历史遗留软件可以在UTF-8代码下继续工作。

这就是为什么我们每次使用中文都需要在文件开头声明UTF-8。

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

相关文章:

版权声明:wuyou2021-04-29发表,共计293字。
新手QQ群:570568346,欢迎进群讨论 Python51学习