當前位置:首頁 » 編程語言 » pythonunicode轉字元

pythonunicode轉字元

發布時間: 2022-10-30 17:02:27

python怎麼轉換unicode編碼

用decode()就行。decode()方法必須傳入一個參數,這個參數就是當前待轉碼的編碼,此函數方法的用意就是將當前編碼為Unicode編碼。

比如就你這提問的此頁面:

#使用版本是python2.
importurllib
url='https://..com/question/1499967322379602619.html?entry=qb_ihome_tag&hideOtherAnswer=true&newAnswer=1'
html=urllib.urlopen(url).read()
result=html.decode('gbk')
printresult

方法是絕對可行的

此法對字元串和文檔內容的解碼一樣有效。

② 關於python中字元編碼的問題

你說的是,把字元串:
\u3232\u6674
本身,轉換為unicode字元吧?
那麼可以通過:
slashUStr
=
"\\u3232\\u6674";
decodedUniChars
=
slashUStr.decode("unicode-escape");
print
"decodedUniChars=",decodedUniChars;
#decodedUniChars=
(有)

註:(有)
是個特殊字元,如果想要在cmd(默認為gbk)中列印,會出錯的。
UnicodeEncodeError:
'gbk'
codec
can't
encode
character
u'\u3232'
in
position
0:
illegal
multibyte
sequence
但是,本身的確已經是轉換好了unicode字元串了。
詳情可參考:
【整理】Python中,如何將反斜杠u類型(\uXXXX)的字元串,轉換為對應的unicode的字元
(此處不能貼地址,請用google搜標題,即可找到帖子地址)

③ python 任何字元轉unicode

可以使用encode方法,參數填「utf-8」

④ 如何使用python,將字元串轉化為 \u XXXX 的字元串(unicode)

print(u'你好'.__repr__())

⑤ python2 怎麼將unicode編碼轉成中文

1、python2與python3稍微有點區別
2、python2中默認的字元編碼格式都是unicode,在字元串前加'u',表示unicode 編碼
3、將unicode轉換成中文,只需要用deconde解碼就可以了!

⑥ python ,unicode碼怎麼轉成中文字元串,附值給其他變數

python2添加u前綴,比如u"abc"。
python3默認就是unicode字元串,加不加u前綴都一樣。

⑦ python中怎樣將unicode轉換成原來的中文

python默認就是unicode存儲。如果是從文件讀取的,在open的參數中指定encoding關鍵字參數就行。如下:

#coding=utf-8/importjson /defLoadQuestion(): /f=open("test.json",'r') qas=json.load(f) question=qas['documents'] /returnquestion/t=LoadQuestion() /printstr(t).decode("unicode-escape")

拓展資料:

通常python2時所有IO讀寫都是byte方式。也就是編碼後的。java也是這樣子。只有python3還有某些特定的模塊才會自動將byte重新轉換成unicode

在python2里的確可以使用s.decode('gbk','ignore')之類的變成unicode。不過在python3里應該是這樣子, s.encode('gbk','ignore')這樣就變成了byte

如果你喜歡 utf-8,可以s.encode(『utf-8','ignore')和s.decode(『utf-8','ignore')

⑧ python 如何將亂碼轉成漢字

1、python2與python3稍微有點區別
2、python2中默認的字元編碼格式都是unicode,在字元串前加'u',表示unicode 編碼
3、將unicode轉換成中文,只需要用deconde解碼就可以了
>>> u='歡迎'>>> e=u.encode()>>> eb'\xe6\xac\xa2\xe8\xbf\x8e'>>> e.decode()#python3中默認就是utf-8編碼'歡迎'>>> e.decode('gbk')#如果解碼為gbk就是亂碼'嬈四繋'

python2編碼環境比較復雜,在這里不做詳細說明

⑨ python unicode字元裡面的轉義字元如何替換

我有一個比較變態的解決方法----利用json來解析。因為json在編碼時會被轉化為unicode字元串,將這個字元串拼接到一個json中,再解析,就可以達到目的。

importjson
s=u'\uff0c\u73b0\u573aRose\u732e\u6b4c\u906d\u4f17\u4eba\u56f4\u89c2'
ss=s.encode('utf8')
x=json.loads('{"foo":"%s"}'%ss)
printx['foo']

這時,x['foo']已經是正常的unicode對象了。

其實你看到的雙斜杠\只是一個斜杠,因為斜杠是轉義字元。

熱點內容
數據結構c語言版嚴蔚敏李冬梅 發布:2025-05-20 06:55:05 瀏覽:447
iphone快捷訪問 發布:2025-05-20 06:55:05 瀏覽:927
如何加密硬碟分區 發布:2025-05-20 06:52:29 瀏覽:362
反編譯gd 發布:2025-05-20 06:52:23 瀏覽:836
java源碼知乎 發布:2025-05-20 06:47:59 瀏覽:481
dos解壓縮命令 發布:2025-05-20 06:47:57 瀏覽:637
安卓傳數據給蘋果的軟體叫什麼 發布:2025-05-20 06:42:48 瀏覽:803
怎麼樣盤解壓力 發布:2025-05-20 06:37:08 瀏覽:84
apk編譯反編譯工具 發布:2025-05-20 06:35:44 瀏覽:285
王者榮耀如何設置自己賬號密碼 發布:2025-05-20 06:23:02 瀏覽:726