崗位職責(zé):
1、 參數(shù)數(shù)學(xué)模型數(shù)據(jù)清洗方面的工作,包括收集、整理與清洗等內(nèi)容,優(yōu)化數(shù)據(jù)質(zhì)量
2、 參數(shù)數(shù)學(xué)模型數(shù)據(jù)合成方面的工作,包括預(yù)訓(xùn)練數(shù)據(jù)、后訓(xùn)練數(shù)據(jù)等內(nèi)容
3、 參與數(shù)學(xué)模型預(yù)訓(xùn)練驗(yàn)證相關(guān)工作,對(duì)數(shù)據(jù)配比、數(shù)據(jù)調(diào)度等方向進(jìn)行優(yōu)化
4、 參與數(shù)學(xué)模型后訓(xùn)練對(duì)齊相關(guān)工作,包括指令微調(diào)、強(qiáng)化學(xué)習(xí)方面的內(nèi)容
任職要求:
1、熟悉大模型、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等相關(guān)領(lǐng)域的基本概念和技術(shù)。
2、具備較強(qiáng)的編程能力,熟悉Python,對(duì)TensorFlow、PyTorch等主流深度學(xué)習(xí)框架有一定的使用經(jīng)驗(yàn)。
3、掌握業(yè)界領(lǐng)先大模型的基本原理和訓(xùn)練以及微調(diào)方法,如LLaMA、Qwen、deepseek等模型的訓(xùn)練過(guò)程及LoRA微調(diào)等。
4、對(duì)大模型的數(shù)據(jù)合成、數(shù)據(jù)處理、數(shù)據(jù)質(zhì)量評(píng)估等方面具有相應(yīng)的研究經(jīng)驗(yàn)。