1. 負(fù)責(zé)設(shè)計(jì)和開發(fā)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行多平臺(tái)信息的抓取和分析工作;
2.研究各種網(wǎng)站、鏈接的形態(tài),發(fā)現(xiàn)它們的特點(diǎn)和規(guī)律;
3.解決技術(shù)疑難問題,包括反反爬、驗(yàn)證碼、壓力控制等,提升抓取的效率和質(zhì)量。
4.負(fù)責(zé)爬蟲邏輯的開發(fā),以及API接口的對接,快速響應(yīng)業(yè)務(wù)變動(dòng)。
1. ??萍耙陨蠈W(xué)歷,計(jì)算機(jī)相關(guān)專業(yè),3年以上數(shù)據(jù)采集經(jīng)驗(yàn),1年以上Python開發(fā)和管理經(jīng)驗(yàn);
2. 有扎實(shí)的算法和數(shù)據(jù)結(jié)構(gòu)能力,有扎實(shí)python語言基礎(chǔ);
3. 熟悉爬蟲原理,常見的反爬蟲技術(shù),有公眾號、小程序等爬蟲項(xiàng)目開發(fā)經(jīng)驗(yàn),能夠解決封賬號、封IP、驗(yàn)證碼識別、圖像識別等問題;
4. 熟悉Linux操作,Re、Xpath等頁面解析工具,selenium、Appnium、Airtest等模擬工具,MySQL、Redis等常用數(shù)據(jù)庫;
5. 熟悉flask、Django后端技術(shù),有APP逆向;
6.對技術(shù)熱衷,工作積極主動(dòng),溝通交流能力強(qiáng),具有良好的團(tuán)隊(duì)合作精神;
7.有淘系等其他電商平臺(tái)采集經(jīng)驗(yàn)優(yōu)先;
8.有瀏覽器插件開發(fā)經(jīng)驗(yàn)優(yōu)化;
9.熟悉CEF,Webkit內(nèi)核,有瀏覽器開發(fā)經(jīng)驗(yàn)優(yōu)先。