財經
2025-01-28 16:23:00

DeepSeek|一文認識DeepSeek是甚麼?「80後」創始人梁文鋒背景 如何顛覆美國AI布局

分享:
內地AI初創公司DeepSeek以低成本開發的DeepSeek-R1模型震驚全球。(AP)

內地AI初創公司DeepSeek以低成本開發的DeepSeek-R1模型震驚全球。(AP)

內地人工智能初創公司DeepSeek(深度求索)以低成本開發的DeepSeek-R1模型震驚全球,並在中國和美國的蘋果AppStore免費下載榜上名列首位,超越了ChatGPT。消息導致美股納指重挫,周一(27日)跌逾600點,「股王」輝達(Nvidia)重挫16%,市值一夜蒸發破紀錄的5,890億美元。到底DeepSeekR1究竟是甚麼?創始人梁文鋒有何獨特背景?又如何顛覆美國的AI佈局?本文將為您一一剖析。

DeepSeek創始人梁文鋒(右)。圖為梁文鋒在今年1月20日國務院一個座談會上發言。(網上圖片) DeepSeek在蘋果App Store免費榜上已經排在第一位,力壓先前霸榜的ChatGPT。(網上圖片) 美國AI龍頭ChatGPT遭DeepSeek挑戰。(資料圖片)

DeepSeek|成本效益驚人比肩ChatGPT

DeepSeek R1是一款基於先進算法的人工智能(AI)模型,專注於自然語言處理和數據分析。它能夠理解和生成人類語言,並從大量數據中提取有價值的信息,幫助用戶高效完成任務。其應用場景廣泛,包括但不限於智能問答、對話交流、內容創作和數據分析等。DeepSeekR1與ChatGPT類似,都基於深度學習和自然語言處理技術,能夠實現流暢的人機交互和智能化的信息處理。

然而,DeepSeek的成功不僅在於其技術突破,更在於其極具競爭力的成本優勢。據悉,DeepSeek僅花費了557萬美元就完成了模型訓練,成本僅為OpenAI旗下GPT-4的約5%。這使得DeepSeek能夠以更親民的價格推向市場,讓更多用戶體驗到人工智能技術的便利。

其低成本優勢主要歸功於高效的訓練策略。據報道,DeepSeek僅使用了2,048張H800顯示卡組成GPU(圖形處理)叢集,在不到兩個月的時間內就訓練出了擁有6,710億參數的DeepSeek-V3模型。與Meta的Llama2模型相比,後者使用了1.6萬塊H100顯示卡,耗時54天訓練出的模型參數為4,050億,DeepSeek的訓練時間縮短了近一半,成本效益顯著提升。

根據多項第三方評測,DeepSeek-R1以極低成本實現與OpenAI去年底才發布的最新模型GPT-4同等性能。對於一款在當前國際環境下面臨挑戰的中國大模型來說,DeepSeek-R1能夠在美國市場比肩ChatGPT,業界普遍認為這是中國人工智能(AI)發展的里程碑事件。

DeepSeek|創始人靠AI交易掌千億私募基金

DeepSeek的一鳴驚人,離不開創始人梁文鋒的遠見。梁文鋒1985年出生於廣東湛江,2002年以高考狀元身份進入浙江大學電子信息工程專業,並對AI產生濃厚興趣。碩士期間,他將AI應用於量化交易,畢業後創立的「幻方量化」迅速成為行業龍頭,2021年資產管理規模突破千億人民幣,躋身國內量化私募領域的「四大天王」之列。2023年,梁文鋒抓住全球AI熱潮,創立DeepSeek,專注於AI大模型研發。

DeepSeek發展迅速,2023年5月發布DeepSeek-V2,12月推出性能更強的DeepSeek-V3。到今年1月,DeepSeek發布R1模型,憑藉卓越性能和親民價格震驚全球,成為中國AI大模型領域的里程碑。

據報道,DeepSeek團隊僅有139名研發人員,規模遠小於OpenAI的1,200人,但團隊年輕化程度高,75%為「90後」,過半為「95後」,近期熱議的「雷軍千萬年薪挖角95後AI天才少女」事件,主角正是DeepSeek團隊成員。

adblk6
特朗普聯同3間公司高層公布AI投資計劃,右起為OpenAI行政總裁阿爾特曼、甲骨文聯合創辦人艾利森及軟銀創始人孫正義。(AP) DeepSeek近日遭到大規模惡意攻擊。(網上圖片) 內地AI初創公司DeepSeek以低成本開發的DeepSeek-R1模型震驚全球。(微博)

DeepSeek|如何顛覆美國AI布局?

DeepSeek的崛起對美國AI行業產生了深遠影響,引發了市場對美國人工智能(AI)及芯片管制措施以及「護城河」的有效性的質疑,並對經濟學所謂「完全競爭」(Perfect Competition)理論的再度審視。美國是否仍能在AI行業保持壟斷地位,成為市場關注的焦點,這也可能導致在美國上市的芯片龍頭企業面臨重新估值的危機。

此前,拜登臨卸任美國總統時,設下晶片三級管制,將中國及俄羅斯等國列為第三級,禁止其獲取美國先進芯片,據悉此舉旨在阻止中國通過黑市獲得芯片。現任總統特朗普更進一步,要求 OpenAI、甲骨文及日本軟銀共同出資5,000億美元,建立「史上最大」的AI基礎設施。然而,DeepSeek的出現,使得市場開始質疑美國是否仍能在AI行業維持其「獨市」地位。

受DeepSeek R1 AI模型迅速崛起的影響,美國納斯達克指數於周一(27 日)大幅下挫逾600點,與AI相關股票遭受沽壓。其中,輝達(Nvidia或稱英偉達)跌幅最為顯著,市值單日蒸發創紀錄的5,890億美元;台積電(TSM)亦急挫逾一成,技術上跌破上升趨勢線。這表明精明投資者已提前採取措施,以應對DeepSeek R1對原有AI市場需求格局的潛在衝擊。

農曆新年|拍拖未?結婚未?如何回應親戚問題而不尷尬?(am730製圖) 農曆新年|拍拖未?結婚未?如何回應親戚問題而不尷尬?(am730製圖) 農曆新年|拍拖未?結婚未?如何回應親戚問題而不尷尬?(am730製圖) 農曆新年|拍拖未?結婚未?如何回應親戚問題而不尷尬?(am730製圖) 農曆新年|拍拖未?結婚未?如何回應親戚問題而不尷尬?(am730製圖) 農曆新年|拍拖未?結婚未?如何回應親戚問題而不尷尬?(am730製圖) 農曆新年|拍拖未?結婚未?如何回應親戚問題而不尷尬?(am730製圖)

am730「ESG綠色發展及碳中和大獎2024」現正接受報名 立即了解更多

am730「ESG綠色發展及碳中和大獎2024」現正接受報名 立即了解更多