pythonunicode转字符
① python怎么转换unicode编码
用decode()就行。decode()方法必须传入一个参数,这个参数就是当前待转码的编码,此函数方法的用意就是将当前编码为Unicode编码。
比如就你这提问的此页面:
#使用版本是python2.
importurllib
url='https://..com/question/1499967322379602619.html?entry=qb_ihome_tag&hideOtherAnswer=true&newAnswer=1'
html=urllib.urlopen(url).read()
result=html.decode('gbk')
printresult
方法是绝对可行的
此法对字符串和文档内容的解码一样有效。
② 关于python中字符编码的问题
你说的是,把字符串:
\u3232\u6674
本身,转换为unicode字符吧?
那么可以通过:
slashUStr
=
"\\u3232\\u6674";
decodedUniChars
=
slashUStr.decode("unicode-escape");
print
"decodedUniChars=",decodedUniChars;
#decodedUniChars=
(有)
晴
注:(有)
是个特殊字符,如果想要在cmd(默认为gbk)中打印,会出错的。
UnicodeEncodeError:
'gbk'
codec
can't
encode
character
u'\u3232'
in
position
0:
illegal
multibyte
sequence
但是,本身的确已经是转换好了unicode字符串了。
详情可参考:
【整理】Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符
(此处不能贴地址,请用google搜标题,即可找到帖子地址)
③ python 任何字符转unicode
可以使用encode方法,参数填“utf-8”
④ 如何使用python,将字符串转化为 \u XXXX 的字符串(unicode)
print(u'你好'.__repr__())
⑤ python2 怎么将unicode编码转成中文
1、python2与python3稍微有点区别
2、python2中默认的字符编码格式都是unicode,在字符串前加'u',表示unicode 编码
3、将unicode转换成中文,只需要用deconde解码就可以了!
⑥ python ,unicode码怎么转成中文字符串,附值给其他变量
python2添加u前缀,比如u"abc"。
python3默认就是unicode字符串,加不加u前缀都一样。
⑦ python中怎样将unicode转换成原来的中文
python默认就是unicode存储。如果是从文件读取的,在open的参数中指定encoding关键字参数就行。如下:
#coding=utf-8/importjson /defLoadQuestion(): /f=open("test.json",'r') qas=json.load(f) question=qas['documents'] /returnquestion/t=LoadQuestion() /printstr(t).decode("unicode-escape")
拓展资料:
通常python2时所有IO读写都是byte方式。也就是编码后的。java也是这样子。只有python3还有某些特定的模块才会自动将byte重新转换成unicode
在python2里的确可以使用s.decode('gbk','ignore')之类的变成unicode。不过在python3里应该是这样子, s.encode('gbk','ignore')这样就变成了byte
如果你喜欢 utf-8,可以s.encode(‘utf-8','ignore')和s.decode(‘utf-8','ignore')
⑧ python 如何将乱码转成汉字
1、python2与python3稍微有点区别
2、python2中默认的字符编码格式都是unicode,在字符串前加'u',表示unicode 编码
3、将unicode转换成中文,只需要用deconde解码就可以了
>>> u='欢迎'>>> e=u.encode()>>> eb'\xe6\xac\xa2\xe8\xbf\x8e'>>> e.decode()#python3中默认就是utf-8编码'欢迎'>>> e.decode('gbk')#如果解码为gbk就是乱码'娆四繋'
python2编码环境比较复杂,在这里不做详细说明
⑨ python unicode字符里面的转义字符如何替换
我有一个比较变态的解决方法----利用json来解析。因为json在编码时会被转化为unicode字符串,将这个字符串拼接到一个json中,再解析,就可以达到目的。
importjson
s=u'\uff0c\u73b0\u573aRose\u732e\u6b4c\u906d\u4f17\u4eba\u56f4\u89c2'
ss=s.encode('utf8')
x=json.loads('{"foo":"%s"}'%ss)
printx['foo']
这时,x['foo']已经是正常的unicode对象了。
其实你看到的双斜杠\只是一个斜杠,因为斜杠是转义字符。