2025-01-28 16:23:00

DeepSeek｜一文認識DeepSeek是甚麼？「80後」創始人梁文鋒背景　如何顛覆美國AI布局

內地AI初創公司DeepSeek以低成本開發的DeepSeek-R1模型震驚全球。(AP)

內地人工智能初創公司DeepSeek(深度求索)以低成本開發的DeepSeek-R1模型震驚全球，並在中國和美國的蘋果AppStore免費下載榜上名列首位，超越了ChatGPT。消息導致美股納指重挫，周一(27日)跌逾600點，「股王」輝達(Nvidia)重挫16%，市值一夜蒸發破紀錄的5,890億美元。到底DeepSeekR1究竟是甚麼？創始人梁文鋒有何獨特背景？又如何顛覆美國的AI佈局？本文將為您一一剖析。

DeepSeek創始人梁文鋒(右)。圖為梁文鋒在今年1月20日國務院一個座談會上發言。(網上圖片)

DeepSeek在蘋果App Store免費榜上已經排在第一位，力壓先前霸榜的ChatGPT。(網上圖片)

DeepSeek｜成本效益驚人比肩ChatGPT

DeepSeek R1是一款基於先進算法的人工智能(AI)模型，專注於自然語言處理和數據分析。它能夠理解和生成人類語言，並從大量數據中提取有價值的信息，幫助用戶高效完成任務。其應用場景廣泛，包括但不限於智能問答、對話交流、內容創作和數據分析等。DeepSeekR1與ChatGPT類似，都基於深度學習和自然語言處理技術，能夠實現流暢的人機交互和智能化的信息處理。

然而，DeepSeek的成功不僅在於其技術突破，更在於其極具競爭力的成本優勢。據悉，DeepSeek僅花費了557萬美元就完成了模型訓練，成本僅為OpenAI旗下GPT-4的約5%。這使得DeepSeek能夠以更親民的價格推向市場，讓更多用戶體驗到人工智能技術的便利。

其低成本優勢主要歸功於高效的訓練策略。據報道，DeepSeek僅使用了2,048張H800顯示卡組成GPU(圖形處理)叢集，在不到兩個月的時間內就訓練出了擁有6,710億參數的DeepSeek-V3模型。與Meta的Llama2模型相比，後者使用了1.6萬塊H100顯示卡，耗時54天訓練出的模型參數為4,050億，DeepSeek的訓練時間縮短了近一半，成本效益顯著提升。

根據多項第三方評測，DeepSeek-R1以極低成本實現與OpenAI去年底才發布的最新模型GPT-4同等性能。對於一款在當前國際環境下面臨挑戰的中國大模型來說，DeepSeek-R1能夠在美國市場比肩ChatGPT，業界普遍認為這是中國人工智能(AI)發展的里程碑事件。

DeepSeek｜創始人靠AI交易掌千億私募基金

DeepSeek的一鳴驚人，離不開創始人梁文鋒的遠見。梁文鋒1985年出生於廣東湛江，2002年以高考狀元身份進入浙江大學電子信息工程專業，並對AI產生濃厚興趣。碩士期間，他將AI應用於量化交易，畢業後創立的「幻方量化」迅速成為行業龍頭，2021年資產管理規模突破千億人民幣，躋身國內量化私募領域的「四大天王」之列。2023年，梁文鋒抓住全球AI熱潮，創立DeepSeek，專注於AI大模型研發。

DeepSeek發展迅速，2023年5月發布DeepSeek-V2，12月推出性能更強的DeepSeek-V3。到今年1月，DeepSeek發布R1模型，憑藉卓越性能和親民價格震驚全球，成為中國AI大模型領域的里程碑。

據報道，DeepSeek團隊僅有139名研發人員，規模遠小於OpenAI的1,200人，但團隊年輕化程度高，75%為「90後」，過半為「95後」，近期熱議的「雷軍千萬年薪挖角95後AI天才少女」事件，主角正是DeepSeek團隊成員。

特朗普聯同3間公司高層公布AI投資計劃，右起為OpenAI行政總裁阿爾特曼、甲骨文聯合創辦人艾利森及軟銀創始人孫正義。(AP)

DeepSeek｜如何顛覆美國AI布局？

DeepSeek的崛起對美國AI行業產生了深遠影響，引發了市場對美國人工智能(AI)及芯片管制措施以及「護城河」的有效性的質疑，並對經濟學所謂「完全競爭」(Perfect Competition)理論的再度審視。美國是否仍能在AI行業保持壟斷地位，成為市場關注的焦點，這也可能導致在美國上市的芯片龍頭企業面臨重新估值的危機。

此前，拜登臨卸任美國總統時，設下晶片三級管制，將中國及俄羅斯等國列為第三級，禁止其獲取美國先進芯片，據悉此舉旨在阻止中國通過黑市獲得芯片。現任總統特朗普更進一步，要求 OpenAI、甲骨文及日本軟銀共同出資5,000億美元，建立「史上最大」的AI基礎設施。然而，DeepSeek的出現，使得市場開始質疑美國是否仍能在AI行業維持其「獨市」地位。

受DeepSeek R1 AI模型迅速崛起的影響，美國納斯達克指數於周一(27 日)大幅下挫逾600點，與AI相關股票遭受沽壓。其中，輝達(Nvidia或稱英偉達)跌幅最為顯著，市值單日蒸發創紀錄的5,890億美元；台積電(TSM)亦急挫逾一成，技術上跌破上升趨勢線。這表明精明投資者已提前採取措施，以應對DeepSeek R1對原有AI市場需求格局的潛在衝擊。