很多人把IP的可用性作為購買的第一參考因素,事實(shí)上,市面上的IP資源基本上都是租用代理撥號服務(wù)器,IP可用率一般可以達(dá)到90%以上,都有類似的IP可用性,我們真正應(yīng)該關(guān)心的是業(yè)務(wù)成功率。
兩個(gè)不同的代理IP提供商使用10,000個(gè)IP,第一個(gè)捕獲5,000個(gè)條目,第二個(gè)捕獲1,000個(gè)條目,為什么會(huì)這樣。
結(jié)論:IP可用性≠商業(yè)成功率。
二次用戶太多,造成業(yè)務(wù)沖突。舉個(gè)例子,如果我抓取微博數(shù)據(jù),第二個(gè)有10個(gè)用戶抓取微博,我應(yīng)該如何抓取?都被擋住了,但是第一個(gè)沒有搶微博的用戶成功率是不一樣的。
為什么IP模擬器代理排名第一?高并發(fā)性要求、多終端支持和可用IP的數(shù)量。這些都是我的需求,而IP模擬器代理很好地滿足了這些需求。
為了競爭效率,我已經(jīng)運(yùn)行了60個(gè)終端,我每天需要大約8萬+IP。終端的數(shù)量將在未來不斷增加。IP模擬器代理每天可以重用100,000+個(gè)IP,一次可以提取1,000個(gè)IP,提取時(shí)間間隔沒有限制。用市面上那種一次提取幾十個(gè)IP的,我一天就算筋疲力盡也抓不到多少數(shù)據(jù),每秒5個(gè)并發(fā)和每秒1000個(gè)并發(fā)的效率是很不一樣的。IP模擬器代理不限制終端使用,并支持帳戶密碼驗(yàn)證,沒有額外費(fèi)用。
說到業(yè)務(wù)成功率,除了專屬IP,還有以IP模擬器為代表的IP池模式,自然隔離了業(yè)務(wù)沖突,解決了業(yè)務(wù)沖突帶來的低抓取問題。