一、職位描述
1.負責針對特定行業(yè)的數(shù)據(jù)進行大規(guī)模預(yù)訓練模型(如GPT、BERT等)的微調(diào),以滿足業(yè)務(wù)需求。
2.設(shè)計并優(yōu)化基于檢索增強生成(RAG)的模型,提升生成內(nèi)容的準確性和上下文關(guān)聯(lián)性。
3.開發(fā)和優(yōu)化意圖識別模型,確保系統(tǒng)能夠精準理解用戶的意圖并提供合適的響應(yīng)。
4.集成和優(yōu)化大模型工具的調(diào)用,確保模型能夠與現(xiàn)有系統(tǒng)無縫對接,提升整體業(yè)務(wù)流程的智能化水平。
5.與數(shù)據(jù)團隊合作,指導數(shù)據(jù)標注、清洗和特征工程,確保模型訓練數(shù)據(jù)的高質(zhì)量。
6.監(jiān)控模型性能,進行A/B測試,并提出進一步優(yōu)化策略。
二、職位要求
1.35歲以下,本科及以上學歷,3年以上相關(guān)工作經(jīng)歷;
2.計算機科學、人工智能、機器學習或相關(guān)專業(yè)碩士及以上學歷,博士優(yōu)先。
3.1年及以上在機器學習、NLP、大模型微調(diào)方面的實際工作經(jīng)驗。
4.熟練掌握Python編程語言,熟練使用Transformers、LLama-Factory、XTuner 等一個或多個訓練框架。
5.了解大模型的部署、量化,熟練使用vLLM、LMDeploy、TensorRT-LLM等一個或多個部署框架。
6.具備豐富的大模型微調(diào)經(jīng)驗,熟悉RAG模型、reranker模型的優(yōu)化方法及其在實際業(yè)務(wù)中的應(yīng)用。
7.具有強大的意圖識別算法開發(fā)能力,熟悉常見的NLP任務(wù)(如命名實體識別、語義匹配等)。
8.良好的溝通能力和團隊合作精神,能夠與跨部門團隊緊密協(xié)作,推動項目進展。
9.具有快速學習和適應(yīng)新技術(shù)的能力,能在動態(tài)環(huán)境中不斷優(yōu)化模型和算法。
10.有特定行業(yè)(如政務(wù)、司法、工業(yè)等)的數(shù)據(jù)處理和分析經(jīng)驗優(yōu)先。
11.了解知識圖譜構(gòu)建與應(yīng)用,能夠?qū)⒔Y(jié)構(gòu)化數(shù)據(jù)與大模型相結(jié)合優(yōu)先。