当前位置:首页 » 编程语言 » python解析url参数

python解析url参数

发布时间: 2025-02-21 11:35:31

‘壹’ 用python怎么解析'%3cp%3e%e5%'

import urllib
rawurl=xxx
url=urllib.unquote(rawurl)

所用模块:urllib
所用函数:urllib.unquote()
案例
import urllib
rawurl = "%E6%B2%B3%E6%BA%90"url = urllib.unquote(rawurl)print url

输出
河源

问题扩展
urllib.unquote()目的是对url编码进行解码,与该函数对应的是编码函数urllib.quote()

123

>>> import urllib>>> urllib.quote("河源")'%E6%B2%B3%E6%BA%90

URL为何要编码、解码?
通常如果一样东西需要编码,说明这样东西并不适合传输。原因多种多样,如Size过大,包含隐私数据。对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。
例如,Url参数字符串中使用key=value键值对这样的形式来传参,键值对之间以&符号分隔,如/s?q=abc&ie=utf-8。如果你的value字符串中包含了=或者&,那么势必会造成接收Url的服务器解析错误,因此必须将引起歧义的&和=符号进行转义,也就是对其进行编码。
又如,Url的编码格式采用的是ASCII码,而不是Unicode,这也就是说你不能在Url中包含任何非ASCII字符,例如中文。否则如果客户端浏览器和服务端浏览器支持的字符集不同的情况下,中文可能会造成问题。

‘贰’ url里有tvid=398da32a9这个信息,怎么用python提取tvid等号后面的字符串

利用字符串匹配,这是url的参数,首先python 里面有专门解析url的包urllib,可以将url分成各个部分,你可以获取参数集合,或者你手动的根据?来截断字符串,?后面的就是参数集合的字符串了。i
然后split("&")可以将各个参数和值分开。
对每个参数q匹配,q.find("tvid="),如果能匹配到,则根据返回额index号,获取子串,q[index+5:]
就是最终想要的值了

‘叁’ Python3 如何对url解码

url编码:

import urllib

url = 'http://test.com/s?wd=哈哈' #如果尘铅早此网站编码是激蠢gbk的话派雀,需要进行解码,从gbk解码成unicode,再从Unicode编码编码为utf-8格式。

url = url.decode('gbk', 'replace')

print urllib.quote(url.encode('utf-8', 'replace'))

热点内容
什么软件下载安卓市场 发布:2025-09-24 21:26:40 浏览:314
发短信php 发布:2025-09-24 21:26:00 浏览:768
电脑是怎么存储数字的 发布:2025-09-24 21:00:24 浏览:772
c语言的什么意思 发布:2025-09-24 20:55:44 浏览:737
yellow系列zip解压码 发布:2025-09-24 20:47:24 浏览:69
瀑布线源码 发布:2025-09-24 20:33:41 浏览:416
安卓手机tif卡怎么装 发布:2025-09-24 20:20:54 浏览:427
javaandroid开发视频 发布:2025-09-24 19:59:08 浏览:801
新浪云存储怎么用 发布:2025-09-24 19:52:41 浏览:470
主机服务器连接电脑 发布:2025-09-24 19:39:36 浏览:271