工作職責(zé):
1.參與大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的研發(fā)工作, 包括模型設(shè)計(jì)、數(shù)據(jù)集構(gòu)建、超參數(shù)優(yōu)化等;
2.研究和實(shí)現(xiàn)機(jī)器學(xué)習(xí)等相關(guān)技術(shù),不斷提升大模型Agent應(yīng)用的性能和用戶(hù)體驗(yàn);
3.追蹤學(xué)術(shù)界和工業(yè)界大模型最近的研究和應(yīng)用, 在大模型預(yù)訓(xùn)練、有監(jiān)督微調(diào)、增強(qiáng)學(xué)習(xí)等方向的算法、數(shù)據(jù)、評(píng)測(cè)等維度進(jìn)行持續(xù)的創(chuàng)新和優(yōu)化;
4.參與算法和技術(shù)方案設(shè)計(jì)以及專(zhuān)利編寫(xiě)。
任職要求:
1.相關(guān)專(zhuān)業(yè)碩士以上學(xué)歷, 如人工智能、數(shù)學(xué)、計(jì)算機(jī)、軟件工程等;
2.熟練使用Python進(jìn)行代碼開(kāi)發(fā),熟悉LLM全流程的工作原理;
3.熟悉常用LLM,如ChatGPT,Claude,DeepSeek,Qwen等,熟悉LLM本地化部署,包括英偉達(dá)、華為芯片等部署環(huán)境;
4.熟悉AIGC的前沿應(yīng)用,有Agent、MCP等相關(guān)開(kāi)發(fā)經(jīng)驗(yàn),了解目前LLM領(lǐng)域的前沿趨勢(shì);
5.對(duì)大語(yǔ)言模型有著強(qiáng)烈的熱愛(ài)和興趣,并看好這個(gè)方向的發(fā)展。