Python之字符编码相关介绍

507次阅读

没有评论

Python之字符编码相关介绍

Python 字符编码简记

Python之字符编码相关介绍

可以简单的理解为：

1.为了处理英文字符，产生了ASCII码。

2.为了处理中文字符，产生了GB2312。

3.为了处理各国字符，产生了Unicode。

4.为了提高Unicode存储和传输性能，产生了UTF-8，它是Unicode的一种实现形式。

注意：

Python2.x 默认编码是 ASCII

Python3.x 默认编码是 unicode，所以 Python3.x 直接支持中文不需要进行二次处理。

GBK转换成 UTF-8 的流程:

1.通过解码 (decode) 转换成 Unicode

2.通过编码 (encode) 转成成 GBK

Python之字符编码相关介绍

乱码是因为系统编码与所提供字符的编码不一致所导致的。所以当我们需要操作系统正确的输出一个字符时，除了要知道该字符的字符编码，也要知道自己系统所使用的字符编码。

Linux 系统大部分使用的是 UTF-8 编码，Windoors 系统使用的编码是 GB2312。

可以通过 chardet 来判断字符的编码

安装步骤：

1. 下载 chardet-3.0.4.tar.gz 
地址：https://pypi.python.org/pypi/chardet/3.0.4#downloads
2. 解压至安装目录
我的电脑为 D:\software\Python2.7\Lib\site-packages\chardet-3.0.4
3. 打开 Windows 命令行窗口进行安装

进入源码目录

Python之字符编码相关介绍

使用 python setup.py install 安装

Python之字符编码相关介绍

测试

# -*- encoding:utf-8 -*-
import chardet
name = '你好'
print(chardet.detect(name))

运行结果：

Python之字符编码相关介绍

在py2中

#-*- coding: UTF-8 -*-

声明这句话就是告诉 python2.7 解释器 (默认ACSII编码方式)解释的 .py 文件声明下面的内容按 utf8 编码，就是编码(编码成字节串最后转成0101的形式让机器去执行)　

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

发表于：Python基础教程

2021-07-07

复制链接

赏

Python之字符编码相关介绍

相关文章：

HTTP代理设置详解：一步步配置指南

什么是Socks5代理IP及其优势

Socks5代理配置教程及注意事项

什么是代理服务器IP：如何选择合适的

国外代理服务器的优势及选择建议

如何找到可靠的免费代理服务器

在线代理服务器的使用与推荐

HTTP代理服务器的设置及应用实例

静态代理IP怎么填写：步骤与示例

海外静态IP的代理选择与配置

在线代理服务器的使用与推荐

HTTP代理服务器的设置及应用实例

什么是代理服务器IP：如何选择合适的

静态代理IP怎么填写：步骤与示例

HTTP代理设置详解：一步步配置指南

海外静态IP的代理选择与配置

如何找到可靠的免费代理服务器

什么是Socks5代理IP及其优势

国外代理服务器的优势及选择建议

Socks5代理配置教程及注意事项