精品综合久久久_久久日本片精品aaaaa国产_日韩视频在线一区二区三区_欧美色欧美亚洲另类七区

python使用動態ip抓取網頁

當我們從網站抓取一條信息時,如果我們經常訪問它,它可能會被被訪問的網站檢測到并被阻止。解決這個問題的方法之一是使用代理ip。當我們上網時,我們的電腦會被分配一個IP讓我們嘗試。當我們頻繁訪問一個網站時,網站會被阻止,因為我們發現同一個IP地址被訪問了很多次。此時,更改IP地址是最好的解決方案。此時如果我們使用多個不同的頭,此時會出現多個ip+主機的組合,訪問時被發現的概率會進一步降低。
 
 
關于代碼中ip代理的使用,介紹如下:
 
步驟:
 
1.urllib2庫中的ProxyHandler類,通過它可以使用ip代理來訪問網頁。
 
proxy _ support = urllib 2 . proxy handler({ }),其中參數是字典{'type':' proxy ip:端口號' }。
 
2、定制和創建一個開瓶器。
 
open er = urllib 2 . build _ open er(proxy _ support)
 
3.(1)安裝開啟器。
 
urlib2.install_opener(opener)
 
(2)調用默認的開瓶器。
 
open . open(URL)
 
對于沒有反爬蟲機制的網站,我們只需要直接引入如上的ProxyHandler類進行處理,以訪問csdn主頁為例:
 
導入urllib
 
url="http://www.csdn.net/"
 
對于范圍內的I(0,10000):
 
html=urllib.urlopen(url)
 
打印html.info()
 
使用上述代碼時,當循環到20時,將出現以下錯誤。
 
追溯(最近一次通話持續時間):
文件“C:/Users/Lenovo/pycharmports/untitle 1/jt2/_ _ init _ _。py”,第19行,中
html=urllib.urlopen(url)
文件“C:Python27liburllib.py”,第87行,在urlopen中
返回開啟器. open(url)
文件“C:python 27 LiberLib . py”,第213行,處于打開狀態
返回getattr(自我,姓名)(url)
open_http中第350行的文件“C:Python27liburllib.py”
h.endheaders(數據)
文件“C:Python27libhttplib.py”,第997行,在endheaders中
自我。_發送輸出(消息正文)
文件“C:Python27libhttplib.py”,第850行,in _send_output
self.send(消息)
文件“C:Python27libhttplib.py”,第812行,發送中
self.connect()
文件“C:Python27libhttplib.py”,第793行,在connect中
self.timeout,self.source_address)
create_connection中的文件“C:Python27libsocket.py”,第571行
引發錯誤
IOError: [Errno套接字錯誤] [Errno 10060]
 
這是因為我們使用計算機的單個ip進行頻繁訪問并被檢測到。
 
以下是使用ip代理的代碼:
 
導入urllib2
 
隨機導入
 
def getHtml(url,代理):
 
random_proxy = random.choice(代理)
 
proxy_support = urllib2。proxy handler({“http”:random _ proxy })
 
open er = urllib 2 . build _ open er(proxy _ support)
 
urllib2.install_opener(opener)
 
html=urllib2.urlopen(url)
 
返回html
 
url="http://www.csdn.net/"
 
代理=["101.53.101.172:9999 "、" 171.117.93.229:8118 "、" 119.251.60.37:21387 "、" 58.246.194.70:8080 "
 
"115.173.218.224:9797","110.77.0.70:80"]
 
對于范圍內的I(0,10000):
 
嘗試:
 
html=getHtml(url,代理)
 
打印。info () #打印網頁的標題信息只是為了顯示您已經訪問過該網頁,并且可以將其修改為您想要顯示的內容。
 
打印I
 
除了:
 
打印“已失敗”
 
在1096次測試中檢測到此代碼。我們應該知道我的列表中只有6個IP。如果我們增加IPs的數量,被發現的概率會不會再次降低?至于上例中的ip代理,可能過了一段時間就不用了,需要在網上搜索最新的ip代理進行更換。此外,程序中的異常處理是為了使程序能夠處理訪問ip代碼時出現的問題,因為一些ip代理在訪問時會失敗,這可以使程序更加健壯。
 
對于具有反爬蟲機制的網頁,以下是訪問csdn中博客的示例:
 
#編碼:utf-8
 
導入urllib2
 
隨機導入
 
def get_html(url、標頭、代理):
 
random_userAget = random.choice(標頭)
 
random_proxy = random.choice(代理)
 
#以下是模擬的瀏覽器訪問。
 
req = urllib2。請求(網址)
 
req.add_header(“用戶代理”,random_userAget)
 
req.add_header("GET ",url)
 
req.add_header("Host "," blog.csdn.net ")
 
req.add_header("Referer "," http://blog.csdn.net/?&page=6”)
 
#以下是使用ip代理的訪問。
 
proxy_support = urllib2。proxy handler({“http”:random _ proxy })
 
open er = urllib 2 . build _ open er(proxy _ support)
 
urllib2.install_opener(opener)
 
html = urllib2.urlopen(req)
 
返回html
 
url = "http://blog.csdn.net/?&page=3 "
 
使用來自多個主機的user_agent信息形成一個列表。當然,這個列表中所有的user _ agents都是不完整的,使用的時候可以自己去找。
 
用戶代理= [
 
“Mozilla/5.0(Windows NT 6.3;蘋果我們.。。hrome/45 . 0 . 2454 . 101 Safari/537.36 ",
 
“Mozilla/5.0(Windows NT 6.1)apple WebKit/537。。。。。likeGecko)Chrome/45 . 0 . 2454 . 101 safari/537.36”,
 
" Mozilla/5.0(Windows NT 10.0;蘋果網絡工具包.。。。。gecko)Chrome/50 . 0 . 2661 . 102 Safari/537.36”,
 
" Mozilla/5.0(Windows NT 6.1;蘋果網絡工具包/537.3 .。。。ML,像Gecko)Chrome/49 . 0 . 2623 . 112 Safari/537.36”,
 
"用戶代理:Mozilla/5.0(Windows NT 10.0;Win64x64 ).。。WebKit/537.36 (KHTML,像Gecko)Chrome/46 . 0 . 2486 . 0 Safari/537.36 Edge/13.10586”,
 
"用戶代理:Mozilla/5.0(Windows NT 10.0)applebwebki .。。。。36 (KHTML,喜歡Gecko)Chrome/46 . 0 . 2486 . 0 Safari/537.36 Edge/13 . 10586”,
 
" Mozilla/5.0(Windows NT 10.0;蘋果公司.。。。。KHTML,像Gecko)Chrome/50 . 0 . 2661 . 94 Safari/537.36 "

#互聯網上的ip可能不可用,所以您需要嘗試更多。
 
my proxy =[" 220 . 189 . 249 . 80:80 "、" 124.248.32.43:80"]
 
html = get_html(url、用戶代理、我的代理)
 
打印html.read()
 
精品综合久久久_久久日本片精品aaaaa国产_日韩视频在线一区二区三区_欧美色欧美亚洲另类七区
**欧美日韩vr在线| 亚洲麻豆av| 欧美久久久久久蜜桃| 午夜在线电影亚洲一区| 亚洲电影在线看| 亚洲深夜影院| 亚洲国产另类久久久精品极度| 国产精品日韩在线播放| 欧美高清在线视频| 久久精品国产在热久久| 亚洲一区在线看| 亚洲美女视频在线观看| 久久国产精品黑丝| 亚洲欧美在线播放| 宅男噜噜噜66国产日韩在线观看| 在线不卡亚洲| 国产精品久久久久久久免费软件| 欧美aⅴ一区二区三区视频| 亚洲女人天堂av| 一本色道久久88综合亚洲精品ⅰ | 精品69视频一区二区三区| 国产精品综合久久久| 国产精品免费一区豆花| 欧美日韩国产色视频| 欧美韩国在线| 欧美不卡三区| 美玉足脚交一区二区三区图片| 久久久999成人| 午夜欧美精品久久久久久久| 亚洲一二三区视频在线观看| 亚洲三级影院| 最新热久久免费视频| 亚洲国产视频直播| 亚洲国产成人91精品| 性欧美暴力猛交另类hd| 午夜精品免费| 午夜国产精品视频| 午夜日韩av| 欧美伊人影院| 久久国产精品99国产精| 欧美一区二视频| 久久精品道一区二区三区| 久久国产精品黑丝| 亚洲国产高清aⅴ视频| 久久精品女人的天堂av| 亚洲第一精品电影| 亚洲国产婷婷香蕉久久久久久99| 亚洲国产精品一区二区久| 亚洲激情一区二区三区| 亚洲精品国产精品国自产在线| 亚洲精品欧美日韩专区| 99av国产精品欲麻豆| 一区二区三区视频观看| 亚洲永久字幕| 羞羞答答国产精品www一本| 久久gogo国模裸体人体| 久久久久久9999| 嫩草影视亚洲| 欧美日韩一区高清| 国产精品蜜臀在线观看| 国产亚洲综合精品| 影音先锋久久| 亚洲精品裸体| 亚洲一区美女视频在线观看免费| 性欧美长视频| 亚洲黄色大片| 亚洲性人人天天夜夜摸| 亚欧成人精品| 美腿丝袜亚洲色图| 欧美日韩一区二区三区在线看| 国产精品视频自拍| 国产综合久久| 亚洲精品社区| 亚洲欧美日韩精品综合在线观看| 久久国内精品自在自线400部| 亚洲精品日韩综合观看成人91| 中日韩视频在线观看| 欧美尤物一区| 欧美成人一区在线| 国产精品久久久一本精品| 国产一二精品视频| 亚洲乱码精品一二三四区日韩在线| 亚洲一区日本| 亚洲日本va午夜在线影院| 亚洲一区二区免费| 久久看片网站| 国产精品国产三级国产aⅴ9色| 国产日韩欧美91| 亚洲区在线播放| 欧美一级在线视频| 99国产麻豆精品| 久久久7777| 欧美午夜国产| 影音先锋日韩有码| 亚洲一区二区在线免费观看视频| 亚洲国产精品女人久久久| 亚洲一区国产一区| 久久综合九色综合欧美就去吻| 欧美午夜免费影院| 影音先锋成人资源站| 亚洲免费视频一区二区| 亚洲精品女av网站| 久久国产欧美日韩精品| 欧美日韩欧美一区二区| 狠狠久久五月精品中文字幕| 一区二区三区四区蜜桃| 亚洲你懂的在线视频| 99精品欧美一区| 久久视频一区二区| 国产麻豆视频精品| 亚洲免费精品| 亚洲欧洲一区二区三区在线观看| 欧美一区二区免费| 欧美日韩国产限制| 伊人成综合网伊人222| 亚洲摸下面视频| 亚洲一级黄色| 欧美福利视频在线| 精品不卡一区| 欧美一区二区三区免费视| 亚洲一区二区黄| 欧美激情国产高清| 国内精品视频666| 亚洲欧美中日韩| 午夜免费日韩视频| 欧美特黄a级高清免费大片a级| 亚洲国产精品成人综合| 久久精品国产99| 久久精品成人| 国产欧美一级| 亚洲一卡二卡三卡四卡五卡| 亚洲午夜视频| 欧美精品色网| 亚洲激情不卡| 亚洲欧洲一区二区三区在线观看| 久久只有精品| 国产综合色在线| 欧美一级午夜免费电影| 欧美资源在线| 国产免费成人| 亚洲欧美日韩区| 欧美一区二区三区四区在线观看地址 | 欧美午夜不卡在线观看免费| 亚洲日产国产精品| 亚洲日本视频| 蜜臀a∨国产成人精品| 国产视频亚洲| 欧美亚洲网站| 欧美一级专区| 国产日本亚洲高清| 欧美一级免费视频| 久久精品视频播放| 黄色一区二区在线| 亚洲国产二区| 欧美+日本+国产+在线a∨观看| 亚洲电影专区| 亚洲精品综合| 欧美日韩国产综合视频在线| 一区二区国产日产| 亚洲欧美一区二区激情| 国产麻豆精品theporn| 午夜日韩电影| 玖玖玖国产精品| 亚洲国产日韩欧美在线99| 亚洲人成网站精品片在线观看 | 久久久视频精品| 激情综合网址| 亚洲品质自拍| 欧美日韩国产电影| 在线视频日本亚洲性| 午夜在线a亚洲v天堂网2018| 国产性猛交xxxx免费看久久| 久久成人综合网| 免费短视频成人日韩| 亚洲日本精品国产第一区| 亚洲一区二区三区中文字幕| 国产欧美一区二区精品性色| 久久国产综合精品| 欧美国产日韩精品| 正在播放亚洲一区| 欧美在线视频日韩| 在线播放日韩专区| 亚洲网站在线播放| 国产精品另类一区| 久久精品系列| 欧美日韩精品免费看| 亚洲欧美激情一区二区| 久久午夜羞羞影院免费观看| 亚洲国产一区在线观看| 亚洲欧美精品在线| 很黄很黄激情成人| 99视频精品全部免费在线| 国产精品久久久久国产精品日日| 欧美主播一区二区三区美女 久久精品人| 蜜桃视频一区| 亚洲视频精品在线| 美女日韩欧美| 亚洲午夜精品久久| 老色鬼精品视频在线观看播放 | 亚洲国产高清在线观看视频|