当前位置:首页 » 编程语言 » pythoncodingutf8

pythoncodingutf8

发布时间: 2022-06-10 05:59:17

python中文显示乱码,已经在开头有了coding: utf-8

乱码原因:
因为你的文件声明为 utf-8,并且也应该是用 utf-8 的编码保存的源文件。但是 windows 的本地默认编码是 cp936,也就是 gbk 编码,所以在控制台直接打印 utf-8 的字符串当然是乱码了。

解决方法:

py文件用记事本打开,另存为utf-8格式即可

Ⅱ coding=utf-8在python中#是什么作用

PY文件当中是不支持中文的,即使你输入的注释是中文也不行,为了解决这个问题,就需要把文件编码类型改为UTF-8的类型,输入这个代码就可以让PY源文件里面有中文了。
建议你写代码之前都把这句话加上,因为不管是注释还是弹出消息提示,免不了的要输入中文,所以这个基本是必须的。

Ⅲ 怎么在Python里使用UTF-8编码

概述

在python代码即.py文件的头部声明即可

解析

py文件中的编码

Python 默认脚本文件都是 ANSCII 编码的,当文件 中有非 ANSCII 编码范围内的字符的时候就要使用"编码指示"来修正一个 mole 的定义中,如果.py文件中包含中文字符(严格的说是含有非anscii字符),则需要在第一行或第二行指定编码声明:

# -*- coding=utf-8 -*-

#coding=utf-8

# 以上两种选其一即可

其他的编码如:gbk、gb2312也可以;否则会出现:

SyntaxError: Non-ASCII character 'xe4' in file test.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

python中的编码与解码

先说一下python中的字符串类型,在python中有两种字符串类型,分别是 str 和 unicode,他们都是basestring的派生类;

str类型是一个包含Characters represent (at least) 8-bit bytes的序列;

unicode 的每个 unit 是一个 unicode obj;

在str的文档中有这样的一句话:

    The string data type is also used to represent arrays of bytes, e.g., to hold data read from a file.

也就是说在读取一个文件的内容,或者从网络上读取到内容时,保持的对象为str类型;如果想把一个str转换成特定编码类型,需要把str转为Unicode,然后从unicode转为特定的编码类型如:utf-8、gb2312等。

拓展内容

utf-8编码

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,也是一种前缀码。它可以用来表示Unicode标准中的任何字符,且其编码中的第一个字节仍与ASCII兼容,这使得原来处理ASCII字符的软件无须或只须做少部分修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或发送文字的应用中,优先采用的编码。

UTF-8使用一至六个字节为每个字符编码(尽管如此,2003年11月UTF-8被RFC 3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF,也就是说最多四个字节):

1、128个US-ASCII字符只需一个字节编码(Unicode范围由U+0000至U+007F)。

2、带有附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母则需要两个字节编码(Unicode范围由U+0080至U+07FF)。

3、其他基本多文种平面(BMP)中的字符(这包含了大部分常用字,如大部分的汉字)使用三个字节编码(Unicode范围由U+0800至U+FFFF)。

4、其他极少使用的Unicode辅助平面的字符使用四至六字节编码(Unicode范围由U+10000至U+1FFFFF使用四字节,Unicode范围由U+200000至U+3FFFFFF使用五字节,Unicode范围由U+4000000至U+7FFFFFFF使用六字节)。

对上述提及的第四种字符而言,UTF-8使用四至六个字节来编码似乎太耗费资源了。但UTF-8对所有常用的字符都可以用三个字节表示,而且它的另一种选择,UTF-16编码,对前述的第四种字符同样需要四个字节来编码,所以要决定UTF-8或UTF-16哪种编码比较有效率,还要视所使用的字符的分布范围而定。不过,如果使用一些传统的压缩系统,比如DEFLATE,则这些不同编码系统间的的差异就变得微不足道了。若顾及传统压缩算法在压缩较短文字上的效果不大,可以考虑使用Unicode标准压缩格式(SCSU)。

互联网工程工作小组(IETF)要求所有互联网协议都必须支持UTF-8编码。互联网邮件联盟(IMC)建议所有电子邮件软件都支持UTF-8编码。

Ⅳ python中如何获取中文的utf8编码

  • 首先要表示一个汉字,至少需要2个字节码

  • 如果需要以utf解码你的汉字,可以用如下办法

>>>unicode('人','utf-16')
u'ucbc8'
  • 如果需要以gbk解码你的汉字,可以用如下办法

>>>unicode('人','gbk')
u'u4eba

Ⅳ python 用coding:utf-8没用啊!还是乱码。我是要打印输出文件夹中的文件名。系统:UBUNTU。高手指点!!

试试这个

import os

for filenam in os.listdir('.'):
print filename.decode('utf-8').encode('utf-8')

另外你的问题和 coding:utf-8 没关系的,加那行是为了在代码里用其他字符,比如
# -*- coding: utf-8 -*-
a = ‘中文‘

Ⅵ 如何设置python的编码格式为utf-8

python的编码格式?
#coding=utf-8
这是文档编码
import sys
sys.setdefaultencoding("utf-8")
这是设置默认编码方式为utf-8
xx.encode("utf-8")
这是字符串编码操作
import codecs
codecs.open(xx,'r','utf-8"),这是文件编码读取方式

Ⅶ python里的#coding=utf_8是什么意思

python编辑软件sublime不支持非utf-8格式的中文,有时会显示乱码
编辑的文件头一行,通常先先手动设置一下编码格式#encoding:utf-8
然后再编辑文件,通常能解决一些乱码问题
def 是python的关键字,表达的意思是定义函数,后面跟的就是函数名,括号内为函数变量,也可以为空
文字比较抽象,等用到例子以后可以再具体分析

Ⅷ 为什么我的Python3加注释也要用#coding:utf-8

#coding:utf-8
如果没有给出其他编码提示,Python将默认为ASCII作为标准编码
另外 完整的Python源文件应该使用单个编码。不允许嵌入不同编码的数据,并且在编译Python源代码期间将导致解码错误。

Ⅸ python # -*- coding: cp936 -*- # -*- coding: utf-8 -*- 是做什么用的

这种格式是对python源文件编码方式的声明。
它表示你的源文件(当前执行的python脚本)的编码表,如果指定,则python解释器会按照指定的编码来对脚本内容进行解码。
你在windows中创建的文本文件如无意外都应该是缺省的中国地区ANSI编码即GBK编码。而cp936编码能够与GBK兼容,但少几十个字符,而utf8编码不与GBK编码兼容。
所以你用GBK编码写出的python脚本,却向解释器声明它是由utf8写成,当然会出错。实际上你删掉编码的声明,python解释器能够自行判断编码表。
另外你也可以尝试将python脚本转换编码为utf8,具体操作为使用记事本打开,然后另存为,选择编码,utf8。如使用其他IDE,请自行摸索。

Ⅹ python声明utf-8为什么以注释的形式 #-*-coding:UTF-8 -*-

三种引号都表示字符串
单引号表示的字符串里可包含双引号,当然不能包含单引号
双引号表示的字符串里可以包含单引号,字符串都只能有一行
三个引号能包含多行字符串,同时常常出现在函数的声明的下一行,来注释函数的功能,与众不同的地方在于,这个注释作为函数的一个默认属性,可以通过 函数名.__doc__ 来访问

热点内容
cbs加密 发布:2024-05-19 06:29:56 浏览:200
ssis存储过程 发布:2024-05-19 06:21:31 浏览:630
怎样删除小视频文件夹 发布:2024-05-19 05:49:29 浏览:589
开启php短标签 发布:2024-05-19 05:44:12 浏览:473
android各国语言 发布:2024-05-19 05:42:54 浏览:247
微信什么资料都没怎么找回密码 发布:2024-05-19 05:35:34 浏览:907
填志愿密码是什么 发布:2024-05-19 05:30:23 浏览:318
城堡争霸自动掠夺脚本 发布:2024-05-19 05:22:06 浏览:204
asp编程工具 发布:2024-05-19 05:20:36 浏览:143
insertpython 发布:2024-05-19 05:12:26 浏览:244