python开发中如何对比使用编码方式

707次阅读

python开发中如何对比使用编码方式

编码方式的历史大致为ASCII ->gb2312->unicode->utf-8，期间具体详细信息感兴趣的可以去做一些查询，正因为存在这样的过渡，因此对同一模块的不同使用，需要我们去进行有选择性的挑选使用，因此，这就衍生出了我们今天的主题，怎么去对比使用这些存在的编码方式。

来个编码解码的小例子先，记住中文可以进行GBK和utf-8编码，在GBk一个中文字符对应两个字节，在utf-8一个中文字符对应三个字节，中文不能进行ASCII编码。

>>> '爬森'.encode('GBK')
b'\xc1\xf5\xc8\xf3\xc9\xad'
>>> '爬森'.encode('ascii')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
>>> 'Runsen'.encode('ascii')
b'Runsen'
>>> "爬森".encode('utf-8')
b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae'
>>> '爬森'.encode('GBK').decode('GBK')
'爬森'
>>> '爬森'.encode('GBK').decode('utf-8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte

如果编码解码格式不一致可能会出现乱码，encode表示编码，decode表示解码，这样大家可以对选择上有明确想法了吧，如果还想知道更多相关内容。

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

发表于：Python基础教程

2021-05-21

复制链接

赏

python开发中如何对比使用编码方式

相关文章：

HTTP代理设置详解：一步步配置指南

什么是Socks5代理IP及其优势

Socks5代理配置教程及注意事项

什么是代理服务器IP：如何选择合适的

国外代理服务器的优势及选择建议

如何找到可靠的免费代理服务器

在线代理服务器的使用与推荐

HTTP代理服务器的设置及应用实例

静态代理IP怎么填写：步骤与示例

海外静态IP的代理选择与配置

动态与静态代理IP的区别解析

如何找到可靠的免费代理服务器

在线代理服务器的使用与推荐

什么是代理服务器IP：如何选择合适的

HTTP代理服务器的设置及应用实例

什么是Socks5代理IP及其优势

静态代理IP怎么填写：步骤与示例

HTTP代理设置详解：一步步配置指南

国外代理服务器的优势及选择建议

Socks5代理配置教程及注意事项