爬蟲遇到ip被禁的處理方式

有時候爬蟲會遇到ip被禁的情況,這時候可以找代理網(wǎng)站,抓取ip,做動態(tài)輪詢。也可以使用別人做的第三方ip代理平臺,比如Crawler,就是利用代理IP地址池做分布式下載的第三方平臺,除了scrapy、普通java、php、python等。
 
 
現(xiàn)在我們可以總結(jié)所有步驟:
 
1.使用爬蟲腳本每天定時抓取代理網(wǎng)站上的免費(fèi)ip,或者購買一定量的ip,寫入MongoDB或其他數(shù)據(jù)庫。此表用作原始表。

2.在使用它之前,你需要做一個步驟測試,即測試ip是否有效。方法是用curl訪問網(wǎng)站檢查返回值,需要新建一個表,循環(huán)讀取原表并在有效時插入,驗(yàn)證后從原表中刪除。在驗(yàn)證的同時,您可以使用響應(yīng)時間來計(jì)算ip的質(zhì)量和最大使用次數(shù),有一種算法可以參考基于連接代理優(yōu)化管理的多線程網(wǎng)絡(luò)爬蟲處理方法。
 
3.將有效ip寫入IP模擬器代理的配置文件,并重新加載配置文件。
 
4.讓爬蟲程序去指定的服務(wù)ip和端口并抓取它。
 
主站蜘蛛池模板: 国产欧美亚洲精品| 天天躁日日躁狠狠躁日日躁| 国产国产精品人在线视| 一级做a爰片性色毛片男| 日本精品啪啪一区二区三区| 伊人久久大香线蕉亚洲| 老师上课跳d突然被开到最大视频| 国产成人综合色视频精品| www.99re6| 日韩精品久久久久久| 亚洲性久久久影院| 波多野结衣被强女教师系列| 免费看成人aa片无码视频吃奶| 国产又大又粗又长免费视频 | 国产自偷在线拍精品热| 健身私教弄了好多次| 麻豆精品久久久久久久99蜜桃 | 国产免费久久精品久久久| 91精品久久久久久久久中文字幕| 无码中文字幕色专区| 久久国产三级精品| 欧美日韩国产在线人成| 午夜丰满少妇性开放视频| 99视频精品国在线视频艾草| 在线看的你懂的| 中文字幕无码免费久久9一区9| 日本高清视频色wwwwww色| 久久精品老司机| 毛片网站免费在线观看| 哒哒哒免费视频观看在线www| 色老板在线视频一区二区| 国产免费黄色片| 韩国福利视频一区二区| 国产在线视频国产永久视频| 黄色一级视频网| 国产成人午夜片在线观看| 国产精品永久免费10000| 国产片91人成在线观看| 亚洲欧洲另类春色校园网站| 国产精品一区二区久久不卡| AV无码免费一区二区三区|