近年深度學習(Deep learning)技術的突破,專家預計在不久的將來,無人車將會取代司機,但究竟甚麼是「深度學習」?回顧上週所提及的「機器學習」是人工智慧的一部分,至於深度學習其實就是屬於機器學習的其中一種。要明白「深度學習」的運作,我們可以先由「人工神經網路」入手,再了解符號及意義的關系。
人工神經網路(Artificial Neural Network)
人工神經網路(ANN),又稱為「類神經網路」,是一種模仿生物神經網路結構;以及其功能的「數學模型」,用於對「函式-Function」進行評估或近似運算,是目前人工智慧最常使用的一種「模型」。科學家模仿人類大腦的神經網路,提出了「赫布理論-Hebbian Theory」,是一個神經科學理論,解釋了在學習的過程中腦中的神經元所發生的變化。用這理論描述了「突觸可塑性」的基本原理,即突觸前神經元向突觸後神經元的持續重複的刺激,可以導致突觸傳遞效能的增加…這稱之為人工神經網路上的「權重-Weight」。

(照片由作者提供)
以上方圖像參考,電腦可仿效人類大腦的「神經-Neural」把人類大腦複雜的神經元簡化成一個圓圈和一個箭號,圓圈內的數字代表這個神經元的神經衝動強度,箭號旁的數字代表這個神經元突觸傳遞效能,也就是「權重」,則大腦內複雜的神經網路就可以簡化成人工神經網路,並一層層的連結起來。以手寫辨識數字為例,「輸入層」就是我們手寫的數字,「輸出層」就是識辨的結果數字0~9。
符號與意義
當然只有仿神經元識辨就談不上甚麼高科技智慧,若電腦能自行分析資料找出特徵值,那就更接近目標了,即人工創造出來可以思考的電腦。例如電腦會自動分析資料,理解「有斑紋的馬」這個特徵,只要人類告訴電腦這個特徵所使用的符號叫「斑馬」,就把符號與它所代表的意義相互連結了。
再以一圖為例,符號「貓」或「CAT」,意義是指尖耳朵、尖眼睛、長鬍子的一種動物,這些就是「特徵值」。人工智慧面臨許多問題就是因為電腦無法自行理解符號的「意義」,而最近發展的「深度學習」已經可以讓電腦自行分析資料找出其「特徵值」。

(照片由作者提供)
深度學習實例
「深度學習」常常被看作是通向真正人工智能的重要一步,顧名思義是讓電腦可以自行分析資料找出「特徵值」,而不是由人類來決定特徵值,有如電腦可以有「深度」的「學習」一樣。許多機構對深度學習的實際應用抱有濃厚的興趣。Google公司於2012 年就研發此技術做了一個實驗,命名為「貓臉辨識計畫」。
Google利用旗下的大數據平台YouTube的影片,取出1,000萬張圖片,動用1,000台電腦(即16,000個處理器),使用具有100億個神經元的深度學習神經網路,最終運算了3日才完成。

(照片由作者提供)
1,000萬張圖片輸入了深度學習神經網路,經由數層神經網路使電腦自動學習,找出「特徵值」並辨識「對角斜線-Diagonal Line Node」。再經由數層神經網路使電腦能夠辨識「人臉」,以及「貓臉」,形成抽象度愈高的「特徵值」,最後經由特徵值理解這個東西的「意義」。
只要我們告訴電腦具有上圖Face Node這個特徵值的東西稱為「人」的符號;而Cat Node這個特徵值的東西稱為「貓」的符號,電腦就能夠將符號與意義產生連結,將來只要我們再輸入其他照片,電腦就能自行判斷那個是「人」,那個是「貓」。
結語
本人並非電腦工程專家,但相信身處數碼世紀,創新科技和創意產業將會是經濟發展的重要動力,這次作跨專業學習是希望更了解創科上的技術。這十年間AI已完全滲入我們的生活中,但似乎普遍港人對它的認識還是非常有限。加上近年香港社會經常提倡發展創新科技及智慧城市,大家都認為香港是中西文化薈萃的國際大都會,資訊發達,時刻都能緊貼環球最新時尚潮流和科技玩意,然而每天機不離手的港人,一討論到創科議題,反應都是「這麼近、那麼遠」,都不知從何入手…