職位描述
崗位職責:
1、負責確保飛書IAM的產品、服務和系統(tǒng)在各種條件下都能保持穩(wěn)定、可靠和高效的運行,通過制定和執(zhí)行穩(wěn)定性策略、監(jiān)控系統(tǒng)性能、預防和解決故障,以及推動持續(xù)改進,保障業(yè)務的連續(xù)性和用戶滿意度;
2、穩(wěn)定性策略與規(guī)劃:制定并完善領域的穩(wěn)定性規(guī)劃,確保與團隊的業(yè)務目標和技術發(fā)展方向相一致,定義穩(wěn)定性的關鍵指標和目標,并建立相應的監(jiān)測和評估機制;
3、系統(tǒng)監(jiān)控與預警:建立和維護全面的系統(tǒng)監(jiān)控體系,包括性能指標、錯誤日志、異常檢測等,建立實時預警機制,確保在系統(tǒng)出現潛在問題或故障時能夠及時通知相關團隊;
4、故障預防與解決:進行定期的系統(tǒng)風險評估和漏洞掃描,制定并實施預防措施,降低故障發(fā)生的概率,領導和協(xié)調故障應急響應團隊,快速定位和解決系統(tǒng)故障,減少業(yè)務中斷時間;
5、性能優(yōu)化與容量規(guī)劃:分析系統(tǒng)性能數據,識別性能瓶頸,并提出優(yōu)化方案和改進措施,負責系統(tǒng)的容量規(guī)劃,確保資源能夠滿足業(yè)務增長的需求;
6、團隊協(xié)作與溝通:與開發(fā)、運維、測試等團隊緊密合作,提供穩(wěn)定性方面的技術支持和指導,定期組織穩(wěn)定性相關的培訓和分享會,提高團隊的穩(wěn)定性意識和技能水平;
7、持續(xù)改進:總結故障處理經驗和教訓,推動流程優(yōu)化和技術創(chuàng)新,提升整體穩(wěn)定性水平,跟蹤行業(yè)內的穩(wěn)定性最佳實踐,引入先進的技術和方法。
任職要求:
1、計算機科學、軟件工程或相關領域的本科及以上學歷;
2、具有3年以上系統(tǒng)穩(wěn)定性管理或相關領域的工作經驗,具有大型分布式系統(tǒng)的設計、開發(fā)和運維經驗者優(yōu)先;
3、精通系統(tǒng)架構、網絡、數據庫等相關技術,熟練掌握性能分析工具和監(jiān)控系統(tǒng)的使用,具備一定的工程能力;
4、具備出色的故障排查和解決問題的能力,能夠在壓力下迅速做出決策,具有良好的分析和歸納能力,能夠從復雜的系統(tǒng)問題中找出根本原因;
5、優(yōu)秀的團隊溝通和協(xié)作能力,能夠有效地與不同部門的人員合作,具備良好的領導力和項目管理能力,能夠推動穩(wěn)定性工作的順利開展;
6、具有高度的責任心和敬業(yè)精神,對系統(tǒng)穩(wěn)定性保障工作充滿熱情,能夠承受工作壓力,在緊急情況下保持冷靜并有效應對。