pythonbytesdecode

发布时间: 2023-02-27 15:19:38

A. python 中怎么把类似这样的'\xe5\xae\x9d\xe9\xb8\xa1\xe5\xb8\x82'转换成汉字输出

首先你要确定这是汉子的十六进制码，还有他的编码方式是什么

我姑且算是utf-8来说明吧

把上述十六进制转成二进制，python byte类型（记不清是否可以）也可以手动转二进制
p3使用str(s, 'utf8') p2使用 s.decode('utf8')来对二进制解码
输出汉字

你要确定上述十六进制码是汉字转过来的，否则无论尝试何种解码方式皆不可得

B. python2.7.3中怎么将str转为bytes

bytes解码会得到str str编码会变成bytes >>> b'123'.decode('ascii')'123'>>> '123'.encode('ascii')b'123'

C. Python文件处理里encoding和encode有事区别，bytes类型是什么意思

python问题我来回答你。

首先你要知道的是，字符串在Python内部的表示是unicode(统一码、万国码)编码，很多编程语言都是这么设计的，各个国家通用编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。
decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表示将gb2312编码的字符串str1转换成unicode编码。
encode的作用是将unicode编码转换成其他编码的字符串，如str2.encode('gb2312')，表示将unicode编码的字符串str2转换成gb2312编码。
因此，转码的时候一定要先搞明白，字符串str是什么编码，然后decode成unicode，然后再encode成其他编码。
bytes类型是 Python 3.x版本新增的数据类型，在 Python 2.x 中是不存在的。字符串是以字符为单位进行处理的，bytes类型是以字节为单位处理的。
bytes 只负责以字节序列的形式（二进制形式）来存储数据，至于这些数据到底表示什么内容（字符串、数字、图片、音频等），完全由程序的解析方式决定。
说白了，bytes 只是简单地记录内存中的原始数据，至于如何使用这些数据，bytes 并不在意，你想怎么使用就怎么使用，bytes 并不约束你的行为。

bytes 类型的数据非常适合在互联网上传输，可以用于网络通信编程；bytes 也可以用来存储图片、音频、视频等二进制格式的文件。

举个例子：

b = b'' # 创建一个空的bytes

b = byte() # 创建一个空的bytes

b = b'hello' # 直接指定这个hello是bytes类型

b = bytes('string',encoding='编码类型') #利用内置bytes方法，将字符串转换为指定编码的bytes

b = str.encode('编码类型') # 利用字符串的encode方法编码成bytes，默认为utf-8类型

bytes.decode('编码类型')：将bytes对象解码成字符串，默认使用utf-8进行解码。

D. python str与bytes编码解码

下面一张图搞懂编码、解码、编码表之间的关系。

不难看出，它们是一种根据编码表进行翻译、映射的过程：

实际上，字符串类型只有encode()方法，没有decode()方法，而bytes类型只有decode()方法而没有encode()方法。

二进制格式的数据也常称为裸数据(raw data)，所以str数据经过编码后得到raw data，raw data解码后得到的str。

上面说了，编码是将字符数据转换成字节数据(raw data)，解码是将字节数据转换成字符数据。在Python中字符数据也就是字符串，即str类型，字节数据也就是bytes类型或bytearray类型。

编码时，可以使用字节类型的构造方法bytes()、bytearray()来构造字节，也可以使用str类型的encode()方法来转换。

解码时，可以使用str类型的构造方法str()来构造字符串，也可以使用bytes、bytearray()类型的decode()方法。

另外需要注意的是，编码和解码的过程中都需要指定编码表(字符集)，默认采用的是utf-8字符集。

例如，使用encode()的方式将str编码为bytes数据。

使用bytes()和bytearray()将str构造成bytes或bytearray数据，这两个方法都要求str->byte的过程中给定编码。

实际上，bytes()、bytearray()这两个方法构造字节数据的时候还有点复杂，因为可以从多个数据源来构造，比如字符串、整数值、buffer。如何使用这两个方法构造字节数据，详细内容参考help(bytes)和help(bytearray)给出的说明，这里给几个简单示例。

构造bytes的方式：

构造bytearray的方式：

解码是字节序列到str类型的转换。

例如，使用decode()方法进行解码"我"字，它的utf-8的编码对应为"\xe6\x88\x91"：

使用str()进行转换。

当编码、解码的过程使用了不同的(不兼容的)编码表时，就会出现乱码。所以，解决乱码的唯一方式是指定对应的编码表进行编码、解码。

例如，使用utf-8编码"我"字，得到一个bytes序列，然后使用gbk解码这个bytes序列。

这里报错了，因为utf-8的字节序列里有gbk无法解码的字节。如果使用文本编辑器一样的工具去显化这个过程，得到的将是乱码字符。

原文地址： https://www.cnblogs.com/f-ck-need-u/p/10185965.html

E. 您好，有关于Python的问题，想要请教你，方便加您的可以直接沟通的方式吗

可以呀
Common Stumbling Blocks
本段简单的列出容易使人出错的变动（初学者应该注意）。
· print语句被print()函数取代了，可以使用关键字参数来替代老的print特殊语法。例如：
Old: print "The answer is", 2*2
New: print("The answer is", 2*2)

Old: print x, # 使用逗号结尾禁止换行
New: print(x, end=" ") # 使用空格代替换行

Old: print # 输出新行
New: print() # 输出新行

Old: print >>sys.stderr, "fatal error"
New: print("fatal error", file=sys.stderr)

Old: print (x, y) # 输出repr((x, y))
New: print((x, y)) # 不同于print(x,y)!

你可以自定义输出项之间的分隔符：
print("There are <", 2**32, ">possibilities!", sep="")
输出结果是：
There are <4294967296> possibilities!

注意：

print()函数不支持老print语句的"软空格"特性，例如，在python2.x中，print "A\n", "B"会输出"A\nB\n"，而python3.0中，print("A\n","B")会输出"A\n B\n"

使用 2to3 源码转换工具时，所有的print语句被自动转换成print()函数调用，对大项目，这是无需争论的。
· python3.0使用字符串(strings)和bytes代替Unicode字符串和8位字符串，这意味着几乎所有使用Unicode编码和二进制数据的代码都要改动。这个改动很不错，在2.x的世界里，无数的bug都是因为编码问题。
· map()和filter()返回迭代器(iterators)
· dict方法keys(),items(),values()返回视图(同样是迭代器)而不是列表(list)
· 内建的sorted()方法和list.sort()方法不再接受表示比较函数的cmp参数，使用key参数代替。
· 1/2返回浮点数，使用1//2能得到整数。
· repr()函数对于long整数不再包含拖尾的L，所以不加判断的去除最后一个字符会导致去掉一个有用的数字。
String and Bytes
· 现在只有一种字符串:str，它的行为和实现都很像2.x的unicode串。
· basestring超类已经去掉了，2to3 工具会把每个出现的basestring替换成str。
· PEP3137:新类型bytes，用来表示二进制数据和编码文本，str和bytes不能混合，需要时，必须进行显示的转换，转换方法是str.encode()(str->bytes)和bytes.decode()(bytes->str).
· 在原始字符串(raw strings)中所有反斜线都按字面量解释，不再特殊处理Unicode转义字符。
· PEP3112:bytes字面量，例如b"abc"，创建bytes实例。
· PEP3120:默认源文件编码为UTF-8
· PEP3131:可以使用非ASCII标识符(然而，除了注释中贡献者的名字之外，标准库仍然只包含ASCII)
· PEP3116:新的IO实现，API几乎100%向后兼容，二进制文件使用bytes代替strings
· 去除了StringIO和cStringIO模块，取而代之的是io.StringIO或者io.BytesIO
PEP3101：字符串格式化的新方法
· str.format方法(原文提到替代了%操作符，实际上，format方法和%的用法差别很大，各有所长)。
PEP3106:修补了dict的keys(),items(),values()方法
· 删除了dict.iterkeys(),dict.itervalues()和dict.iteritems()
· dict.keys(),dict.values()和dict.items()返回dict相关数据的引用
PEP3107:函数注解(FunctionAnnotations)
· 注解函数参数和返回值的标准化方法
Exception Stuff
· PEP352:异常类必须继承自BaseException,它异常结构的基类。
· 移除了StandardError
· Dropping sequence behavior (slicing!)and message attribute of exception instances.
· PEP3109:抛出异常：现在必须使用raiseException(args)而不是原来的raise Exception, args
· PEP3110:捕获异常，现在必须使用exceptException as identifier而不是原来的except Exception,identifier
· PEP3134:异常链(Exceptionchain)。
· 改良了一些windows不能加载模式时的异常信息，具有本地化处理。
New Class and Metaclass Stuff
· 移除了classic class
· PEP3115:新的metaclass语法
· PEP3119:抽象基类。
· PEP3129:类包装。
· PEP3141:数字抽象基类
其他的语言变化

这里列出大多数的Python语言核心和内建函数的变化。
· 移除了backticks(使用repr()代替)
· 移除了<>(不等号，使用!=代替)
· as和with变成了关键字
· True,False和None变成了关键字
· PEP237:long不存在了，只有int，它和原来的long一样。不再支持以L结尾的数字字面量。移除sys.maxint，因为int现在已经是无限大了
· PEP238:int相除，返回float
· 改变了顺序操作符的行为，例如x<y，当x和y类型不匹配时抛出TypeError而不是返回随即的bool值
· 移除了__getslice__，语法a[i:j]被解释成a.__getitem__(slice(i,j))
· PEP3102:keyword-only arguments.在函数参数列表中，出现在*args之后的命名参数只能使用"关键字参数"的形式调用
· PEP3104:nonlocal声明。使用nonlocal可以声明一个外部变量(不是global变量)
· PEP3111:raw_input() 改名为input()，也就是说，新的input()函数从标准输入设备(sys.stdin)读取一行并返回(不包括行结束符)，如果输入过早终止，该函数抛出EOFError，如果想使用老的input()，可以使用(input())代替。
· xrange()改名为range()，range()现在不是产生一个列表(list)，而是一个迭代器。
· PEP3113:移除了"元组参数拆包(tuple parameter unpacking)"。这种写法已经不行了：
1. deffoo(a, (b, c)):…
2.
3. 现在要这样写:
4.
5. deffoo(a, b_c):
6. b,c = b_c
· PEP3114:next()重命名为__next__(),新的内建函数next()可以调用一个对象的__next__()方法。
· PEP3127:新的八进制字面量，二进制字面量和bin()函数。你应该写0o666而不是0666，oct()函数也做了响应的改动。同样，0b1010等价于10，bin(10)返回"0b1010″。0666这种写法现在是错误的。
· PEP3132:支持迭代器拆包。现在你可以这样写:
1 a,b, *rest = some_seqence
2
3 甚至象这样：
4
5 *rest,a = stuff
6 一般情况下，rest对象是list，而等号右边的对象是可迭代的
· PEP3135:新的super()。你可以不适用任何参数调用super()，正确的参数和实例会被正确选择。如果使用参数，它的行为不变，和以前一样。
· zip(),map(),filter()返回迭代器。
· 移除了string.letters和它的小伙伴们(string.lowcase和string.uppercase)，现在上场的是string.ascii_letters等
· 移除了apply(),callable(),exefile(),file(),rece(),reload()
· 移除了dict.has_key()。使用in操作符进行测试
· exec语句没有了，现在是exec()函数
· 移除了__oct__()和__hex__()特殊方法。oct()和hex()方法使用__index__()
· 移除了对__members__和__methods__的支持
· nb_nonzero重命名为nb_bool,__nonzero__()重命名为__bool__()
Optimizations
· 一般情况下，python 3.0比python 2.5慢33%左右。不过仍有提升空间。
模块变动(新的，改进的和废弃的)
· 移除了cPickle模块，可以使用pickle模块代替。最终我们将会有一个透明高效的模块。
· 移除了imageop模块
· 移除了audiodev, Bastion, bsddb185,exceptions, linuxaudiodev, md5, MimeWriter, mimify, popen2, rexec, sets, sha,stringold, strop, sunaudiodev, timing和xmllib模块
· 移除了bsddb模块(单独发布，可以从获取)
· 移除了new模块
· os.tmpnam()和os.tmpfile()函数被移动到tmpfile模块下
· tokenize模块现在使用bytes工作。主要的入口点不再是generate_tokens，而是tokenize.tokenize()
Build and C API Changes

Python's build process和C API的改动包括:
· PEP3118:新的Buffer API
PEP3121:扩展模块的的Initialization& Finalization
· PEP3123:使PyObject_HEAD符合标准C
其他的改动和修复

阅读全文

热点内容

java返回this 发布：2025-10-20 08:28:16 浏览：1094

制作脚本网站发布：2025-10-20 08:17:34 浏览：1372

python中的init方法发布：2025-10-20 08:17:33 浏览：1059

图案密码什么意思发布：2025-10-20 08:16:56 浏览：1235

怎么清理微信视频缓存发布：2025-10-20 08:12:37 浏览：1103

c语言编译器怎么看执行过程发布：2025-10-20 08:00:32 浏览：1454

邮箱如何填写发信服务器发布：2025-10-20 07:45:27 浏览：659

shell脚本入门案例发布：2025-10-20 07:44:45 浏览：555

怎么上传照片浏览上传发布：2025-10-20 07:44:03 浏览：1231

python股票数据获取发布：2025-10-20 07:39:44 浏览：1257

pythonbytesdecode

与pythonbytesdecode相关的资讯