pythoncookie
A. python如何保存cookie到本地
python如何保存cookie到本地的方法:
第一次訪問頁面後,Server可將Cookie信息加入HTTP
Header返回給瀏覽器,瀏覽器會自動將這些信息保存在本地;
當再次訪問相同域名時,瀏覽器將對應Cookie信息隨請求一起發送,Server端可讀取這些信息進行處理。
Cookie可設置過期時間,到期後由瀏覽器自動刪除;
當我們要返回頁面時,首先輸出如下:
[python]
view
plain
print
"Content-type:
text/plain\n"
它其實是一個HTTP
Header,
連續碰到兩個換行表示HTTP
Header部分結束,剩餘部分將被做為數據處理;
包含了Cookie後輸出大致如下:
[python]
view
plain
print
"Content-Type:
text/html"
print
"Set-Cookie:
session=12345"
print
#
多加一個換行表示HTTP
Header部分結束
代碼:
setcookie.py
[python]
view
plain
#!/usr/bin/env
python
import
Cookie
import
datetime
import
random
expiration
=
datetime.datetime.now()
+
datetime.timedelta(days=30)
cookie
=
Cookie.SimpleCookie()
cookie["session"]
=
random.randint(0,1000000000)
cookie["session"]["domain"]
=
"localhost"
cookie["session"]["path"]
=
"/"
cookie["session"]["expires"]
=
\
expiration.strftime("%a,
%d-%b-%Y
%H:%M:%S
PST")
print
"Content-type:
text/plain"
print
cookie.output()
print
print
"Cookie
set
with:
"
+
cookie.output()
getcookie.py
[python]
view
plain
#!/usr/bin/env
python
import
Cookie
import
os
print
"Content-type:
text/plain\n"
try:
cookie
=
Cookie.SimpleCookie(os.environ["HTTP_COOKIE"])
print
"session
=
"
+
cookie["session"].value
except
(Cookie.CookieError,
KeyError):
print
"session
cookie
not
set!"
B. python 爬蟲為什麼要獲取響應的cookie
Cookie是指某些網站為了辨別用戶身份、進行session跟蹤而儲存在用戶本地終端上的數據(通常經過加密)。比如說有些網站需要登錄後才能訪問某個頁面,在登錄之前你想抓取某個頁面內容是不允許的。那麼可以利用Urllib庫保存登錄的Cookie,然後再抓取其他頁面,這樣就達到了你的目的。爬蟲過程中只用python來保存cookie信息模擬登錄是不行的,爬蟲限制有很多,例如同一IP短時間內多次訪問同一頁面,或者同一賬戶短時間內多次進行相同操作等等。
C. python爬蟲使用Cookie如何進行
Cookie,指某些網站為了辨別用戶身份、進行session跟蹤而儲存在用戶本地終端上的數據(通常經過加密),比如說有些網站需要登錄後才能訪問某個頁面,在登錄之前,你想抓取某個頁面內容是不允許的。那麼我們可以利用Urllib2庫保存我們登錄的Cookie,然後再抓取其他頁面就達到目的了,那麼python爬蟲使用Cookie如何進行?
D. Python 使用cookie登陸的問題
cookie是有過期時間的,網站設置了有個值,所以到了過期時間就會失效
退出了的話伺服器會知道你的cookie里session已經過期。
大概有,比如經常保持此會話活動狀態。
不過最好還是把你的代碼改進為腳本自動登錄獲取cookie,Python的requests庫文檔里有講怎麼配置登錄:http://cn.python-requests.org/zh_CN/latest/