香港人常用社交平台Facebook(FB)、Instagram(IG)和WhatsApp周一深夜11時40分突然死機,並席捲全球,影響逾35億用戶,6小時後服務才恢復正常,服務中斷時間之長和規模可說是罕見。事件一度惹起網絡攻擊疑雲,FB在事發多個小時後,才解釋集團旗下三大平台死機,是因為協調各數據中心連接的路由器更新出錯。
死機事件在美國東岸時間周一早上11時40分開始,即香港時間周一晚11時40分,有香港網民用電腦進入FB時,網頁出現「無法連上這個網站」字句,IG則顯示「5xx Server Error」,WhatsApp則無法收發訊息。有網絡監察專家形容今次事故「巨大」,指對上一次重大互聯網中斷事件發生在6月,全球不少知名網站斷線,持續時間不足1小時。網絡監察組織Downdetector稱,全球逾1,060萬人次報告FB未能登入的問題,是歷來最大規模。
骨幹路由器更新出錯
FB和創辦人朱克伯格初時只發道歉聲明,至美國時間周一深夜,FB基建設備副總裁Santosh Janardhan才在網誌稱,死機最根本原因是配置變更(configuration change)出錯。
他指,連接各數據中心的骨幹路由器的配置變更,是造成斷線的原因,並對數據中心的連線帶來連鎖效應,導致FB的各項服務中斷,但沒有說明甚麼變更出錯。他又強調在服務停頓期間,無造成用戶資料外洩。網絡安全專家指,這是十分重大的配置錯誤,死機期間FB基本上不存在於網上。另有指WhatsApp、IG和FB即時通迅軟件Messenger由同一後端設施運作,有故障時便一齊「炒車」。
有指有關路由器更新出錯導致伺服器與互聯網「斷線」,只是問題的開始,FB透過同一伺服器運作其系統,這表示從數碼工程工具,以至通訊服務,甚至員工的門卡都離線,一切都須修復。不過,當工程師返回公司數據中心打算人手重設伺服器時,卻發現無法用門卡進入,導致全球大死機6小時。有專家形容,「Facebook基本上是將車匙留在上鎖的車廂內」。有內部人士稱,疫情下在家工作令問題加大,在家工作的員工也須花時間趕回數據中心;有員工透露,工程師直至美國時間下午5時45分才成功重設伺服器。
用戶:10分鐘不斷切換WiFi和流動數據
FB、IG和WhatsApp同時不能使用,不少香港網民以為手機故障;在美國,有網民以為數據接收有問題,花了10分鐘不停切換WiFi和流動數據。香港的服務在早上陸續恢復,影響較細,但在美國等地區卻非發生在深夜,影響FB的商業客戶做生意,有用戶批評朱克伯格未有認真看待事件。
有在美國經營手織衣服的商戶稱,他在IG有3.2萬追隨者,在IG死機前約1小時上載了產品圖片,過去他上載照片後,通常可賣出一、兩件,賺2,000至3,000港元。今次事件令他察覺社交網可「控制」其生意。
FB是除Google之外的最大網上廣告商,死機6小時估計收入損失或高達1億美元(約7.8億港元)。FB目前擁有逾35億用戶,2008年曾因電腦病毒斷線近1天,當年影響8,000萬用戶;2019年也發生類似今次的事故,服務中斷約1小時。雖然有不少競爭對手加入市場,如Twitter、Telegram、Signal、TikTok和Snapchat,但仍未能動搖FB過去17年建立的強大市場地位。