數(shù)據(jù)分析工程師
崗位職責(zé)
數(shù)據(jù)處理與分析
設(shè)計和實現(xiàn)數(shù)據(jù) ETL 流程 (抽取、轉(zhuǎn)換、加載),完成數(shù)據(jù)收集、清洗、標(biāo)準(zhǔn)化及深入分析。 對多源異構(gòu)數(shù)據(jù)進行特征提取、模式識別和異常檢測,挖掘數(shù)據(jù)潛在價值。
基于業(yè)務(wù)需求,編寫復(fù)雜 SQL 查詢,開展數(shù)據(jù)分析,生成高質(zhì)量數(shù)據(jù)報告并與相關(guān)方溝通反饋。
數(shù)據(jù)建模與標(biāo)準(zhǔn)化
參與 ODS 層和 DW 層的數(shù)據(jù)建模,構(gòu)建高效的數(shù)據(jù)倉庫架構(gòu)。
提出數(shù)據(jù)標(biāo)準(zhǔn)化和主題庫建設(shè)的規(guī)范建議,推動數(shù)據(jù)治理和一致性。
開發(fā)和優(yōu)化數(shù)據(jù)分析算法,提升模型的準(zhǔn)確率和召回率,生成動態(tài)分析結(jié)果。
業(yè)務(wù)數(shù)據(jù)分析與支持
實現(xiàn)業(yè)務(wù)數(shù)據(jù)的自動化比對與分析,構(gòu)建異常數(shù)據(jù)預(yù)警機制。
制定量化評估體系,分析業(yè)務(wù)關(guān)鍵指標(biāo),支撐決策優(yōu)化。
協(xié)助項目經(jīng)理輸出業(yè)務(wù)場景下的數(shù)據(jù)分析結(jié)果,推動業(yè)務(wù)目標(biāo)實現(xiàn)。
系統(tǒng)開發(fā)與交付
獨立完成產(chǎn)品經(jīng)理分配的數(shù)據(jù)分析模塊開發(fā),將分析結(jié)果可視化并集成至現(xiàn)有系統(tǒng)。
按要求將配套資源文件(如腳本、配置文件、文檔等)上傳至 SVN,交付測試部門。
使用 Apifox 或類似工具提供接口測試用例,協(xié)助測試工程師完成功能驗證。
運維與優(yōu)化
協(xié)助運維團隊處理線上數(shù)據(jù)相關(guān)問題,監(jiān)控分析模型運行效果并持續(xù)優(yōu)化。
編寫清晰的數(shù)據(jù)分析報告和技術(shù)文檔,確保信息傳遞準(zhǔn)確。
任職要求
基本要求
學(xué)歷與經(jīng)驗:本科及以上學(xué)歷,計算機科學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)、數(shù)據(jù)科學(xué)等相關(guān)專業(yè), 3年以上數(shù)據(jù) 分析或算法開發(fā)經(jīng)驗。
能力:優(yōu)秀的邏輯思維和問題解決能力,良好的溝通能力和團隊協(xié)作精神。
技術(shù)能力要求
數(shù)據(jù)分析與數(shù)倉經(jīng)驗:
。 具有 ETL、數(shù)據(jù)倉庫和大數(shù)據(jù)分析相關(guān)經(jīng)驗,熟悉數(shù)據(jù)處理全流程。
。 精通 Python 數(shù)據(jù)分析生態(tài)( Pandas、 NumPy、SciPy 等),熟悉常用機器學(xué)習(xí)算法和統(tǒng)計 分析技術(shù)。
。 具備數(shù)據(jù)清洗、特征工程和模型評估的豐富經(jīng)驗。
數(shù)據(jù)庫技能:
。 熟練使用 ClickHouse、Oracle、 MySQL 等數(shù)據(jù)庫,精通 SQL 語言,精通 ClickHouse 者優(yōu) 先。
熟悉 MongoDB 或其他非關(guān)系型數(shù)據(jù)庫的使用。
ETL 工具與流程:
。 熟練掌握 Kettle、 DataX、 DolphinScheduler(海豚調(diào)度) 等開源 ETL 工具,熟悉數(shù)據(jù) ETL 標(biāo)準(zhǔn)化流程。
。 能夠設(shè)計和優(yōu)化高效的 ETL 管道。
操作系統(tǒng):
。 熟練掌握 Linux 常用命令,能在 Linux 環(huán)境下進行數(shù)據(jù)處理和腳本開發(fā)。
算法與業(yè)務(wù)分析:
。 熟悉時間序列分析和異常檢測算法,能夠利用數(shù)據(jù)服務(wù)于不同業(yè)務(wù)場景。
。 有金融數(shù)據(jù)分析、物聯(lián)網(wǎng)數(shù)據(jù)分析或醫(yī)保業(yè)務(wù)分析經(jīng)驗者優(yōu)先。
。 能夠快速理解業(yè)務(wù)需求,轉(zhuǎn)化為分析方案,并形成清晰的數(shù)據(jù)分析報告。
工具與流程:
。 熟練使用 SVN/Git 等版本控制工具。
。 熟悉數(shù)據(jù)可視化工具(如 Matplotlib、Seaborn、 ECharts 等)。
。 有大數(shù)據(jù)處理經(jīng)驗(Hadoop、Spark)者優(yōu)先。
加分項
有金融業(yè)務(wù)、物聯(lián)網(wǎng)業(yè)務(wù)或醫(yī)保業(yè)務(wù)分析經(jīng)驗。 發(fā)表過相關(guān)領(lǐng)域數(shù)據(jù)分析或算法論文或?qū)@? 參與過完整的數(shù)據(jù)分析項目生命周期。
熟悉 Apifox 或類似工具進行數(shù)據(jù)接口管理和測試。
工作環(huán)境與團隊
與產(chǎn)品經(jīng)理、開發(fā)工程師、測試工程師等緊密協(xié)作。 有機會處理復(fù)雜業(yè)務(wù)場景和海量數(shù)據(jù)。
提供專業(yè)的數(shù)據(jù)分析工具和技術(shù)支持。