后端開發(fā)工程師Python、java語言
工作職責:
1、設計和實現(xiàn)高效穩(wěn)定的爬蟲程序,收集海量數(shù)據(jù)并進行處理和分析。
2、負責多平臺信息抽取、數(shù)據(jù)清洗、入庫、服務化等研發(fā)和優(yōu)化工作。
3、解決實際開發(fā)過程中碰到的各類數(shù)據(jù)需求和接口問題。
4、參與業(yè)務需求討論,負責業(yè)務需求到技術實現(xiàn)的方案落地與實施。
5、監(jiān)控爬蟲運行狀態(tài),日常處理數(shù)據(jù)抓取的穩(wěn)定性和準確性問題。
任職要求
1、負責設計、開發(fā)和維護高效、穩(wěn)定的爬蟲系統(tǒng),提升數(shù)據(jù)采集的效率和質量。
2、負責多平臺信息抽取、數(shù)據(jù)清洗、入庫、服務化等研發(fā)和優(yōu)化工作。
3、熟悉各種爬蟲框架和工具,把握網(wǎng)絡爬蟲核心技術研究方向,研究優(yōu)化算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴展性。
4、熟練掌握 Python語言編程。
5、熟悉Linux基礎命令。
6、精通python編程語言,熟悉scrapy等常用數(shù)據(jù)抓取框架以及原理,熟悉網(wǎng)頁信息和APP數(shù)據(jù)抽取,能夠設計分布式爬蟲系統(tǒng)框架。
7、熟悉分布式系統(tǒng)的設計和應用,熟悉分布式、緩存、消息等機制。
8、精通 Charles等抓包工具,精通網(wǎng)頁抓取原理及技術,精通正則表達式,熟練從結構化和非結構化的數(shù)據(jù)中獲取信息。9、精通 selenium 、DrissionPage 等自動化抓取技術。