小米(1810)上周傳出將大力投入AI大模型,內媒報道創辦人兼董事長雷軍親自出馬「搶人才」,開出千萬元人民幣年薪,挖角被譽為「AI天才少女」的95後羅福莉,任命其為小米AI實驗室大模型團隊的負責人,展現出小米在AI領域的決心。據報羅福莉是內地國產大模型DeepSeek「DeepSeek-V2」的關鍵開發者之一。
領軍小米AI大模型團隊
來自四川的羅福莉被喻為95後AI「天才少女」。公開資料顯示,她本科就讀於北京師範大學電腦專業,碩士畢業於北京大學電腦語言學專業。她2019年在北大讀碩士時,在人工智能領域頂尖國際會議ACL發表了8篇論文(其中兩篇是第一作者),登上知乎熱搜,她提出的詞義消歧方法和文本風格轉換框架在業界引發轟動。羅福莉當時用知乎帳號回應稱,「這次投稿ACL是我近一年的產出,所以我認為自己是付出了足夠的努力的,當然也可能也有運氣成分加持。」
AI頂尖國際會議發表8篇論文
羅福莉碩士畢業後,進入阿里達摩院做人工智能研究,從事預訓練語言模型相關工作,負責阿里達摩院AliceMind開源項目,主導開發多語言預訓練模型VECO。2022年,她加入幻方量化從事深度學習相關策略建模與演算法研究,後來跳槽到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。
並不希望被神化
羅福莉曾談及被譽為「天才AI少女」時說到,並不希望被神化。「突然之間千奇百怪的機會都來了,有找我出書的、有找我錄公開課的,甚至有經紀公司找來的。」
傳小米正搭建GPU萬卡集群
《新浪財經》引述知情人士透露,雷軍認為小米在AI大模型領域發力太晚,於是親自出馬挖角,重金招募能領導小米大模型的人才,薪酬水平高達千萬人民幣。報道指,為了邀請羅福莉加入小米,雷軍展現極大誠意熱情,安排一場精心準備的會面,地點選在小米總部的科技展廳,該地展示小米最新的科技成果和未來的願景。
小米AI實驗室的大模型團隊自2023年4月成立以來,已壯大至1,200多人,單是北京就開放了59個大模型相關職位。另有媒體報告稱,小米目前擁有6,500張圖像處理器(GPU)的算力資源,並計劃建置萬卡級GPU集群。