職位名稱:算法實(shí)習(xí)生(音視頻與語音技術(shù)方向)
職位描述:
我們正在尋找一位對(duì)音視頻處理、語音識(shí)別、語音合成、大模型文本翻譯及口唇同步等技術(shù)充滿熱情的算法實(shí)習(xí)生。加入我們的團(tuán)隊(duì),你將有機(jī)會(huì)參與前沿AI技術(shù)的研發(fā)與落地,探索多模態(tài)交互的未來。
工作職責(zé):
1. 參與音視頻信號(hào)處理算法的研究與優(yōu)化,包括但不限于語音增強(qiáng)、降噪、回聲消除等。
2. 探索語音識(shí)別(ASR)和語音合成(TTS)技術(shù),優(yōu)化模型性能與實(shí)時(shí)性。
3. 研究大語言模型(LLM)在文本翻譯、語音生成等任務(wù)中的應(yīng)用與優(yōu)化。
4. 開發(fā)口唇同步(Lip Sync)技術(shù),提升虛擬人的自然交互體驗(yàn)。
5. 協(xié)助團(tuán)隊(duì)進(jìn)行算法部署與性能調(diào)優(yōu),推動(dòng)技術(shù)在實(shí)際場(chǎng)景中的應(yīng)用。
任職要求:
1. 學(xué)歷背景:計(jì)算機(jī)科學(xué)、人工智能、電子工程、信號(hào)處理等相關(guān)專業(yè)的碩士或博士在讀生。
2.技術(shù)能力:
- 熟悉Python/C++,具備扎實(shí)的編程和算法基礎(chǔ)。
- 熟悉深度學(xué)習(xí)框架(如PyTorch、TensorFlow),有語音/視頻相關(guān)項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
- 了解語音識(shí)別(如Whisper)、語音合成(如VITS)、大模型(如GPT、LLaMA)或口唇同步(如Wav2Lip)等技術(shù)。
- 有音視頻編解碼(FFmpeg)、信號(hào)處理或多媒體開發(fā)經(jīng)驗(yàn)者加分。
3. 學(xué)習(xí)能力:對(duì)AI技術(shù)有強(qiáng)烈興趣,具備快速學(xué)習(xí)新技術(shù)的能力。
4. 團(tuán)隊(duì)協(xié)作:良好的溝通能力,能與團(tuán)隊(duì)高效配合。
加分項(xiàng):
- 在頂級(jí)會(huì)議(ICASSP、Interspeech、CVPR等)發(fā)表過相關(guān)論文。
- 有開源項(xiàng)目貢獻(xiàn)或相關(guān)競(jìng)賽(如Kaggle)獲獎(jiǎng)經(jīng)歷。
實(shí)習(xí)收獲:
- 深入?yún)⑴cAI前沿技術(shù)的研發(fā),積累實(shí)戰(zhàn)經(jīng)驗(yàn)。
- 與行業(yè)頂尖團(tuán)隊(duì)共事,獲得專業(yè)指導(dǎo)。
- 表現(xiàn)優(yōu)異者有機(jī)會(huì)獲得轉(zhuǎn)正機(jī)會(huì)。
工作地點(diǎn) & 時(shí)間:
- 地點(diǎn):可遠(yuǎn)程或線下(具體根據(jù)公司政策)
- 時(shí)長:3個(gè)月及以上,每周至少4天
---
如何申請(qǐng):
請(qǐng)將簡歷、項(xiàng)目/論文鏈接發(fā)送至:[郵箱地址],郵件標(biāo)題注明“算法實(shí)習(xí)生申請(qǐng)-姓名-學(xué)?!?。