這兩周,AI市場的發展再次成為科技界的焦點。英偉達(Nvidia)在最新財報中表現亮眼,第一財季收入達到260億美元,超出分析師預期的247億美元。這主要得益於數據中心部門的增長。英偉達的收入大部分來自於OpenAI、Google、Amazon、Meta和Microsoft等AI巨頭,這些公司貢獻了輝達約40%的銷售額。
讓我們看看OpenAI和Google在過去兩周的動向。Google在5月18日的I/O開發者大會上,展示了其在消費者科技和雲計算服務中整合AI的最新進展,包括Gemini 1.5 Pro和Gemini 1.5 Flash的發布,以及備受矚目的Astra。Gemini 1.5 Pro增強了多模態能力,能夠處理和理解文本、圖像、音頻和視頻,成為多功能工具,適用於各種應用。該模型通過整合到多個Google產品中,顯著提升了Gemini Advanced和Google Workspace應用的用戶體驗,並採用多模式混合專家MoE(Mixture-Of-Experts)架構,在保持高性能的同時降低了計算成本。Gemini 1.5 Flash則強調速度和效率,適用於需要快速響應的任務,如文檔和表格的大規模數據提取,成為追求低延遲和高成本效益AI解決方案的首選。Project Astra專注於提升AI助手的能力,特別是在快速響應和複雜交互方面。
OpenAI在5月14日提前發布了GPT-4o模型,這是一個更快速且成本更低的AI模型。新模型整合語音、文本和視覺,比前一代更快且效率更高。展示中,GPT-4o能實時應對各種輸入,使對話更加流暢,並展示了即時翻譯和唱出故事的能力。
兩位巨頭的執行長在過去兩周內也頻繁接受訪問,分享他們對AI未來的看法。OpenAI執行長Sam Altman強調,人工智慧的未來在於多模態技術與持續改進。他指出,最新的多模態GPT-4o整合了文本、語音和視覺,提升了人機互動的自然性和效率,預示著電腦使用方式的革命性變革。Altman認為,AI的逐步改進和廣泛應用將促進各行各業的發展,同時他也強調了對AI基礎設施的需求,以支持技術進步和更高效的社會運作。他還表示,具備推理能力的通用AI模型在未來將更具價值,並主張在推動創新與確保安全和倫理標準之間取得平衡。Google執行長Sundar Pichai則表示,公司自2016年起就確立了「AI優先」的戰略,並將AI技術深植於各項業務。新一代多模態AI模型Gemini在處理音頻、視頻、文本和圖像等方面具有強大能力,並認為多模態AI將在未來的技術週期中展現巨大潛力。Pichai也提到,儘管AI生成內容在創意方面表現出色,但仍須改進其事實準確性。他強調,AI的發展需要負責任的創新,並呼籲全球制定框架來確保AI的安全使用。
正如Altman在GPT-4o發布會結束後在X上寫道:「我們很快會有更多的東西分享。」隨著人工智慧技術的迅猛發展,我們正站在一個革命性變革的邊緣,未來的可能性無限。我們翹首以待,期待AI帶來更多令人驚嘆的創新和突破。
文:劉偉良(Eden)/社交媒體商業應用公司天勤(Tocanan)首席執行官