職位描述

字節跳動豆包大模型團隊成立於 2023 年，致力於開發業界最先進的 AI 大模型技術，成爲世界一流的研究團隊，爲科技和社會發展作出貢獻。
豆包大模型團隊在AI領域擁有長期願景與決心，研究方向涵蓋NLP、CV、語音等，在中國、新加坡、美國等地設有實驗室和研究崗位。團隊依託平臺充足的數據、計算等資源，在相關領域持續投入，已推出自研通用大模型，提供多模態能力，下游支持豆包、釦子、即夢等50+業務，並通過火山引擎開放給企業客戶。目前，豆包APP已成爲中國市場用戶量最大的AIGC應用。

1、支持語音識別技術在字節跳動公司內外豐富的業務場景落地，解決落地過程中的前沿問題，持續優化語音識別核心技術效果；
2、搭建音頻理解核心技術體系，專注語音識別的前沿技術和算法效果，追求和探索業界最前沿算法。

職位要求

1、熟悉語音識別算法，對語音識別系統落地和業務效果優化有實際經驗；
2、對工業級大規模數據有實際處理經驗，有使用海量數據優化實際業務模型的動手經驗；
3、對深度學習技術有深度瞭解和豐富的實戰經驗，熟悉 PyTorch、Tensorflow、Kaldi 等平臺，有端到端語音識別框架（Transformer、RNN-T、LAS、CTC 等）的調優經驗；
4、有不錯的編碼能力，熟悉 Linux 開發環境，熟悉 C++ 和 Python 語言；
5、有獨立工作能力並同時能與團隊融洽相處。
加分項：
- 在會議、智能硬件等場景有大規模的語音識別系統落地和優化經驗；
- 對前沿的端到端語音識別系統有優化經驗，熟悉 RNN-T、Encoder-Decoder 等端到端語音識別算法；
- 有優化語音識別解碼器並實際落地的經驗；
- 在相關國際會議或主流期刊上發表論文（ICASSP、Interspeech、ASRU、IEEE/ACM Transactions等）；
- 語音相關比賽或機器學習相關比賽拿到國際領先名次、ACM/NOI/IOI/TopCoder 等編程比賽獲獎；
- 參與過有影響力開源項目

語音識別算法工程師-豆包大模型