当前位置:首页 » 编程语言 » pythonunicode转字符

pythonunicode转字符

发布时间: 2022-10-30 17:02:27

python怎么转换unicode编码

用decode()就行。decode()方法必须传入一个参数,这个参数就是当前待转码的编码,此函数方法的用意就是将当前编码为Unicode编码。

比如就你这提问的此页面:

#使用版本是python2.
importurllib
url='https://..com/question/1499967322379602619.html?entry=qb_ihome_tag&hideOtherAnswer=true&newAnswer=1'
html=urllib.urlopen(url).read()
result=html.decode('gbk')
printresult

方法是绝对可行的

此法对字符串和文档内容的解码一样有效。

② 关于python中字符编码的问题

你说的是,把字符串:
\u3232\u6674
本身,转换为unicode字符吧?
那么可以通过:
slashUStr
=
"\\u3232\\u6674";
decodedUniChars
=
slashUStr.decode("unicode-escape");
print
"decodedUniChars=",decodedUniChars;
#decodedUniChars=
(有)

注:(有)
是个特殊字符,如果想要在cmd(默认为gbk)中打印,会出错的。
UnicodeEncodeError:
'gbk'
codec
can't
encode
character
u'\u3232'
in
position
0:
illegal
multibyte
sequence
但是,本身的确已经是转换好了unicode字符串了。
详情可参考:
【整理】Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符
(此处不能贴地址,请用google搜标题,即可找到帖子地址)

③ python 任何字符转unicode

可以使用encode方法,参数填“utf-8”

④ 如何使用python,将字符串转化为 \u XXXX 的字符串(unicode)

print(u'你好'.__repr__())

⑤ python2 怎么将unicode编码转成中文

1、python2与python3稍微有点区别
2、python2中默认的字符编码格式都是unicode,在字符串前加'u',表示unicode 编码
3、将unicode转换成中文,只需要用deconde解码就可以了!

⑥ python ,unicode码怎么转成中文字符串,附值给其他变量

python2添加u前缀,比如u"abc"。
python3默认就是unicode字符串,加不加u前缀都一样。

⑦ python中怎样将unicode转换成原来的中文

python默认就是unicode存储。如果是从文件读取的,在open的参数中指定encoding关键字参数就行。如下:

#coding=utf-8/importjson /defLoadQuestion(): /f=open("test.json",'r') qas=json.load(f) question=qas['documents'] /returnquestion/t=LoadQuestion() /printstr(t).decode("unicode-escape")

拓展资料:

通常python2时所有IO读写都是byte方式。也就是编码后的。java也是这样子。只有python3还有某些特定的模块才会自动将byte重新转换成unicode

在python2里的确可以使用s.decode('gbk','ignore')之类的变成unicode。不过在python3里应该是这样子, s.encode('gbk','ignore')这样就变成了byte

如果你喜欢 utf-8,可以s.encode(‘utf-8','ignore')和s.decode(‘utf-8','ignore')

⑧ python 如何将乱码转成汉字

1、python2与python3稍微有点区别
2、python2中默认的字符编码格式都是unicode,在字符串前加'u',表示unicode 编码
3、将unicode转换成中文,只需要用deconde解码就可以了
>>> u='欢迎'>>> e=u.encode()>>> eb'\xe6\xac\xa2\xe8\xbf\x8e'>>> e.decode()#python3中默认就是utf-8编码'欢迎'>>> e.decode('gbk')#如果解码为gbk就是乱码'娆四繋'

python2编码环境比较复杂,在这里不做详细说明

⑨ python unicode字符里面的转义字符如何替换

我有一个比较变态的解决方法----利用json来解析。因为json在编码时会被转化为unicode字符串,将这个字符串拼接到一个json中,再解析,就可以达到目的。

importjson
s=u'\uff0c\u73b0\u573aRose\u732e\u6b4c\u906d\u4f17\u4eba\u56f4\u89c2'
ss=s.encode('utf8')
x=json.loads('{"foo":"%s"}'%ss)
printx['foo']

这时,x['foo']已经是正常的unicode对象了。

其实你看到的双斜杠\只是一个斜杠,因为斜杠是转义字符。

热点内容
java的实验报告 发布:2025-05-20 10:02:06 浏览:527
豪华配置高电动轿车有哪些 发布:2025-05-20 10:01:59 浏览:486
哪些电脑配置低 发布:2025-05-20 09:34:16 浏览:955
地板网站源码 发布:2025-05-20 09:27:23 浏览:346
安卓视频转换器怎么使用 发布:2025-05-20 09:20:52 浏览:544
telnet批量脚本 发布:2025-05-20 09:11:58 浏览:627
搭建jrebel服务器 发布:2025-05-20 08:57:40 浏览:903
安卓手机上网怎么连接电脑 发布:2025-05-20 08:28:30 浏览:548
福建公积金密码是什么 发布:2025-05-20 08:28:13 浏览:507
学习编程用什么软件好 发布:2025-05-20 08:27:28 浏览:599