

職位描述
字節跳動豆包大模型團隊成立於 2023 年,致力於開發業界最先進的 AI 大模型技術,成爲世界一流的研究團隊,爲科技和社會發展作出貢獻。
豆包大模型團隊在AI領域擁有長期願景與決心,研究方向涵蓋NLP、CV、語音等,在中國、新加坡、美國等地設有實驗室和研究崗位。團隊依託平臺充足的數據、計算等資源,在相關領域持續投入,已推出自研通用大模型,提供多模態能力,下游支持豆包、釦子、即夢等50+業務,並通過火山引擎開放給企業客戶。目前,豆包APP已成爲中國市場用戶量最大的AIGC應用。
1、支持語音識別技術在字節跳動公司內外豐富的業務場景落地,解決落地過程中的前沿問題,持續優化語音識別核心技術效果;
2、搭建音頻理解核心技術體系,專注語音識別的前沿技術和算法效果,追求和探索業界最前沿算法。
職位要求
1、熟悉語音識別算法,對語音識別系統落地和業務效果優化有實際經驗;
2、對工業級大規模數據有實際處理經驗,有使用海量數據優化實際業務模型的動手經驗;
3、對深度學習技術有深度瞭解和豐富的實戰經驗,熟悉 PyTorch、Tensorflow、Kaldi 等平臺,有端到端語音識別框架(Transformer、RNN-T、LAS、CTC 等)的調優經驗;
4、有不錯的編碼能力,熟悉 Linux 開發環境,熟悉 C++ 和 Python 語言;
5、有獨立工作能力並同時能與團隊融洽相處。
加分項:
- 在會議、智能硬件等場景有大規模的語音識別系統落地和優化經驗;
- 對前沿的端到端語音識別系統有優化經驗,熟悉 RNN-T、Encoder-Decoder 等端到端語音識別算法;
- 有優化語音識別解碼器並實際落地的經驗;
- 在相關國際會議或主流期刊上發表論文(ICASSP、Interspeech、ASRU、IEEE/ACM Transactions等);
- 語音相關比賽或機器學習相關比賽拿到國際領先名次、ACM/NOI/IOI/TopCoder 等編程比賽獲獎;
- 參與過有影響力開源項目
- 落地語音識別
- 構建音頻理解
- 優化語音識別
- 調優端到端