新聞
2018-01-04 11:00:00

Smart Tips: 與人工智慧的距離(上)

分享:

身處於數據轉型年代,不論身處那個行業,對AI的認識尤其重要。不妨反思一下您對它的認識有多深?在生活上有沒有察覺或感受到它的智慧?它們在的思考及學習跟我們有何差別?我們該如何利用AI來突破工作上的領域?一連兩個星期為大家淺談一下人工智慧技術。

©thinkdigital (照片由作者提供)

©thinkdigital (照片由作者提供)

Artificial Intelligence—人工智慧,是指人類製造出來的機器所表現出來的智慧。由早期研發出機器手臂來取代工廠裡的勞工,到現在機器學習(Machine learning)…它會替我們過濾垃圾郵件;分析我們的行為並且為我們選擇感興趣的廣告等。但到底甚麼是「機器學習」?

©answerforce.com (照片由作者提供)

©answerforce.com (照片由作者提供)

 

機器學習Machine learning

顧名思義就是要讓電腦像人類一樣具有學習的能力,要了解機器如何學習,就先回頭看看人類學習的過程…回想小時候我們是如何學會辨識一隻貓呢?

大致上可以分為「訓練」(Training)與「預測」(Predict)兩個步驟:

  • 訓練:小時候父母教我們辯認標註了動物名字的圖片,當我們看到一隻小動物有四隻腳、尖耳朵、長鬍子等,對照圖片上的文字就知道這是貓,如果我們不小心把老虎的照片當成貓,父母會從旁糾正我們,因此我們就自然地學會辨識貓了,這就是我們學習的過程,即是代表父母在「訓練」我們。
  • 預測:待我們學會了辨識貓,假設到動物園時看到一隻有四隻腳、尖耳朵、長鬍子的小動物,便會認為這是貓,但如果我們不小心把老虎當成貓,父母會再次糾正我們,又或者在自己反覆比較下,發現其實老虎和貓是不同的,即使父母沒有告訴我們,我們亦會自行學習判斷,這就是我們在「預測」事物的過程。

要讓機器像人類一樣具有學習與判斷的能力,就要把人類大腦學習與判斷的流程轉移到電腦,就是運用數據進行「訓練」與「預測」,主要包括下列四個步驟:

  • 獲取數據:人類的大腦經由五個感官收集大量的數據,才能進行處理及分析,機器學習也必須先收集大量數據才可進行訓練。
  • 分析數據:人類的大腦分析收集到的數據找出可能的規則定律,例如:下雨之後某個溫度與濕度下會出現彩虹,彩虹出現在與太陽相反的方向等。
  • 建立模型:人類的大腦找出可能的規則定律後,會利用這個規則定律來建立經驗,按上述的例子,就是大腦經由學習而來的經驗,而機器則會透過學習來建立「模型」,情況有如我們所謂的「經驗」。
  • 預測未來:待上述學習完成後,再將新的數據輸入模型就可以預測未來,例如:以後只要下雨,溫度與濕度達到標準,就可以預測與太陽相反的方向就可能會看到彩虹。

機器學習和人類學習的過程相似,要先進行「分類」,才能分析理解並且進行判斷,再按其判斷執行。分類的過程其實是一種Yes or No的是非題。機器學習是由電腦執行程式自行學習,一邊處理大量資料,一邊自動學會分類方式,如同人類在學習一樣,故機器學習即自動進行資料處理。機器學習的種類主要分為三種,有監督式學習(Supervised learning);非監督式學習(Un-supervised learning);及半監督式學習(Semi-supervised learning)。

©mindful-user-experience.ghost.io (照片由作者提供)

©mindful-user-experience.ghost.io (照片由作者提供)

 

  • 監督式學習:所有資料都有標準答案,可以提供機器在學習時的判斷誤差,預測會比較精準。例如:我們任意選出100張照片並且「標註」那些是貓那些是狗,輸入電腦後讓電腦學習認識貓與狗的外觀,電腦只要把照片內的「特徵」取出來,將來做預測時只要尋找這個特徵(四肢腳、尖耳朵、長鬍子)就可以識辨了。這種方法等於是人工「分類」,對電腦而言最簡單,但對人類則最為困難。
  • 非監督式學習:所有資料都沒有標準答案,無法提供機器學習輸出判斷誤差使用,機器必須自己尋找答案,預測時較不準確。例如:我們任意選出100張沒有「標註」的照片,輸入電腦後讓電腦學習認識貓與狗的外觀,由於照片沒有「標註」,因此電腦必須自己嘗試把照片內的「特徵」取出來,同時再自己進行「分類」,將來做預測時只要尋找這個特徵(四隻腳、尖耳朵、長鬍子)作識辨。這種方法不必人工分類,對人類來說最為簡單,但是對電腦則為之困難,而且判斷誤差比較大。
  • 半監督式學習:少部分資料有標準答案,可提供機器學習輸出判斷誤差使用;再配上大部分資料沒有標準答案,過程中電腦必須自己尋找答案,相對是結合監督式與非監督式的學習優點。例如:我們任意選出100張照片,其中10張「標註」了那些是貓那些是狗,輸入電腦後讓電腦學習認識貓與狗的外觀,電腦只要把照片內的「特徵」取出來,再嘗試把另外90張照片內的「特徵」取出來,並同時進行分類。這種方法只需要少量的人工分類,又可以達致較準確的預測,是目前最為常用的一種機器學習模式。

過去二十年,人類已習慣把半監督式的機器學習技術引入工作及生活中來互補人類和機器的「先天不足」條件,處理繁複工作或生活細節時更事半功倍,技術已發展得相當成熟,至於更進一步的「深度學習Deep learning」則下週再續。

adblk6