商湯科技(020)今日舉辦技術交流日活動,分享以「大模型+大算力」推進AGI (通用人工智能)發展的戰略布局,並公布了在該戰略下的「日日新SenseNova」大模型體系,推出自然語言處理、內容生成、自動化數據標注、自訂模型訓練等多種大模型及能力。活動上,集團展示了「日日新SenseNova」大模型體系下的語言大模型,以及AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用,並公布依託AI大裝置SenseCore實現「大模型+大算力」融合創新的研發體系。
商湯指,歷時5年建設了業界領先的AI大裝置,大裝置上總共有2.7萬塊的GPU芯片卡,可以輸出5,000P的總算力,是亞洲目前最大的智能計算平台之一。基於大裝置的能力,商湯目前已構建了計算機視覺、自然語言處理、AI內容生成、多模態、決策智慧等多個領域的大模型,持續演進能力並廣泛支持各種應用。
CEO徐立:多模態令算力需求劇增
商湯科技董事長兼CEO徐立表示,在AI大模型時代,數據、算法和算力這三要素也在經歷新的演變,大模型參數量將以指數級的速率提升,而數據量隨多模態的引入也將大規模增長,因此就必然會導致對算力需求的劇增。集團以AI大裝置SenseCore打造AGI時代的基礎設施,並基於此將大模型體系命名為「日日新SenseNova」,寓意「苟日新、日日新、又日新」,希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能。