崗位職責(zé)
1. 模型選型與評(píng)估: 深入研究、評(píng)估和選型適用于特定業(yè)務(wù)場(chǎng)景(尤其關(guān)注知識(shí)利用能力)的開(kāi)源和商用大語(yǔ)言模型(DeepSeek, Llama, ChatGLM, GPT系列等)。
2. 模型微調(diào)(SFT/RLHF): 設(shè)計(jì)并實(shí)施監(jiān)督微調(diào)和基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)策略,優(yōu)化模型在結(jié)合外部知識(shí)(RAG上下文)后的回答準(zhǔn)確性、可靠性、穩(wěn)定性和風(fēng)格一致性。
3. 提示工程(Prompt Engineering)優(yōu)化: 針對(duì)RAG場(chǎng)景,設(shè)計(jì)、開(kāi)發(fā)和優(yōu)化提示詞模板和策略,高效地將檢索到的知識(shí)整合到模型生成過(guò)程中,提升最終答案質(zhì)量。
4. 模型推理與性能優(yōu)化: 優(yōu)化模型的推理效率和服務(wù)部署,關(guān)注模型在知識(shí)注入后的推理行為。
5. 協(xié)同知識(shí)利用: 與知識(shí)圖譜工程師和數(shù)據(jù)工程師緊密合作,理解知識(shí)表示和檢索方式,為模型設(shè)計(jì)最佳的知識(shí)接入和利用機(jī)制。與數(shù)據(jù)工程師合作定義模型訓(xùn)練/微調(diào)所需的數(shù)據(jù)規(guī)格。
6. 前沿技術(shù)跟蹤: 持續(xù)跟蹤大模型訓(xùn)練、微調(diào)(SFT/RLHF)、提示工程、推理優(yōu)化等領(lǐng)域的最新進(jìn)展。
任職要求
1. AI技術(shù)棧:
深入理解主流LLMs架構(gòu)、訓(xùn)練/微調(diào)原理及應(yīng)用場(chǎng)景。
精通大模型微調(diào)技術(shù)(SFT, RLHF, PPO, DPO等)及其工程實(shí)踐。
精通提示工程(Prompt Engineering)技術(shù),尤其在結(jié)合檢索結(jié)果(RAG Context)進(jìn)行回答生成時(shí)的優(yōu)化技巧。
熟悉Langchain/LlamaIndex等框架在模型集成與調(diào)用方面的應(yīng)用。
經(jīng)驗(yàn)要求:
2年以上大模型應(yīng)用、微調(diào)(特別是SFT/RLHF)或訓(xùn)練經(jīng)驗(yàn)。
有成功應(yīng)用或優(yōu)化LLM于復(fù)雜任務(wù)(特別是需要外部知識(shí)的任務(wù))的項(xiàng)目經(jīng)驗(yàn)。
具備模型性能調(diào)優(yōu)和推理優(yōu)化的經(jīng)驗(yàn)。
2. 核心技能:
模型評(píng)估與選型能力。
強(qiáng)大的模型微調(diào)(SFT/RLHF)工程能力。
高級(jí)提示工程(Prompt Engineering)能力(RAG場(chǎng)景重點(diǎn))。
模型推理優(yōu)化能力。