有說人工智能(AI)三大發展的基石,涉及數據,算力,算法。特別是生成式AI的發展。
數據是人工智能發展的飼料,因為涉及人工智能發展主要訓練資料,這些方面都是用來提高算法的準確性同廣泛化的重要指標,因為很多時候須要深度學習及自然語言處理。這些領域方面的數據,亦用於訓練模型,將性能提高後,可以實現各種複雜任務指令。人工智能很多時需要分析大量的文本數據,嘗試學習人類語言,去理解上文下理,才能最終準確地理解並生成答案。但最大的限制在於模型的正確度和普泛化能力。
至於算法,可以說是人工智能技術發展的推手。嚴格來說亦是發展的動力來源。算法是用於連接數據和機器之間發揮作用。算法通過訊息內容建立出模型,去模仿人的認知,如何分析在作出判斷力。算法會影響如何構造數據引入使用的渠道,及去捕捉使用者心目中的應用場景(思維模式)。
算力很多時是視為人工智能發展的基礎設施,亦代表了處理數據的能力高低。因為涵蓋了如何支持數據及算法的應用。市場多數評價芯片的技術進步,如何能降低模型運算的成本。因為很多時人工智能的發展之中,就算提出了可行嘅計算方案。但另一方面計算機嘅運算能力未必足已有能力應付複雜龐大的模型組合。所以如果算力上的提升有機會,令到模型擴大的範圍更廣。算力最大的限制就是模型的運算與成本。
算法的改良,有助令算力提升之餘,因降低模型的成本。2022年全球總算力達906EFLops。有預計認為,到2025年全球總算力規模或超過3ZFlops,算力規模擴大會提升了周邊的經濟效益。
當大家在留意DeepSeek,及阿里巴巴(9988)推出的通義千問模型如何先進,及衝擊半導體需求時,換過角度去看,可能用以往同樣的半導體會做到更加多的事,亦令參與人工智能發展的門檻降低。模型的成本降低有助於AI發展應用方面的涵蓋度和可能性。不過要注意的是,由於內容生成普及化,兌現盈利能力或會降低,所以日後愈是專門化的人工智能,應用會愈吃香。