「科技創新服務」涉及研究項目的管理、研究成果的推廣與技術轉移等範疇,卻因不同資訊系統的數據難以共享,遇到科研資訊「碎片化」挑戰。香港城市大學開發生成式人工智能(GenAI)技術,建立「科創GPT」,通過創建科研知識圖譜,勾勒出科研項目、論文、專利等之間的關係,並在數據安全及私隱保障前設下,助成立不同領域的知識庫,促進知識共享。
城大資訊系統學系教授馬建及團隊自2007年起致力開發並不斷改良「科研之友」(ScholarMate.com)平台,連繫政府資助機構、大學、科研機構及科創公司,讓學術論文與專利等科研成果共用。科研之友迄今有逾800萬名註冊用戶,收錄達 7,800 萬項研究成果。馬建團隊以此為基礎,正開發新一代的「聯邦學習技術」(Federated Learning Technology),結合了科研知識圖譜(knowledge graphs)與大型語言模型(Large Language models,LLMs),同時以去中心化模式,促進創新網絡平台上的用戶,共同訓練及微調上述圖譜及模型,推動及實現科技創新服務的數碼化轉型,釋放生成式人工智能的力量。
科研知識圖譜生成全面知識庫
新平台將專注於創立及構建內容全面的科研知識圖譜,即以圖譜方式,勾勒出全球各間大學、研究機構和科技公司內部的研究人員、科研項目、研究論文和專利等之間的關係。按照國家研究學科的標準和相關新興產業來組織數據,目標利用科研知識圖譜,生成針對特定領域的全面知識庫。城大科研團隊將進一步訓練和微調一個基於大型語言模型的專業領域「科創 GPT」,即 STIGPT(Science, Technology and Innovation GPT)。「科創 GPT」能夠利用語意搜索、智能推薦和度身訂造的個人化內容生成,為研究機構和科研人員,提供可促進知識共創的人工智能助理服務。
同時,團隊將開發「聯邦學習技術」,以去中心化的訓練方法,促進平台上的用戶,共同訓練及微調科研知識圖譜和大型語言模型。另外,城大團隊亦將開發一個「低代碼智能系統開發平台」,可以簡化及降低程式編寫的難度,令機構用家能夠以最少的編程工作量,制定及實現數碼轉型解決方案。
研究團隊預期,通過整合科創 GPT 與科研之友,可以打造出全球首個具有生成式人工智能的智慧協同創新網絡平台,以連繫各間大學和企業的研究人員,共同創造知識產權。研發成果也可以推動、加速各種科技創新服務的數碼化轉型,包括智慧科研管理、學術會議出版服務、研究成果推廣,以及技術轉移服務等。