搜狗昨日在世界互聯網大會上宣布與新華社合作推出的全球第一個全倣真智能虛擬主持人「AI虛擬主播」並在烏鎮首次亮相。
現場示範,只要輸入一句新聞文本,屏幕上就會出現一位虛擬的新華社新聞主播,他不僅會用和真人一樣的聲音進行報道,連唇形、面部表情也能完全吻合。
視頻中,AI主播表示:「我不是冷冰冰的機器人」,他面對鏡頭說:「我的外型脫胎於新聞主播邱浩,只需要提供文字,我可以365天,24小時的提供服務,還能用無數個分身,在不同的現場為你帶來資訊。」
搜狗表示,跟微軟小冰這樣的虛擬主播不同,這個合成主播在「搜狗分身」技術的支持下,通過人臉關鍵點檢測、人臉特徵提取、人臉重構、唇語識別、情感遷移等多項前沿技術合成。對個人語料的採集很小,十幾分鐘採錄聲音就能模擬這樣一個主播。他認為,語音識別主要分感知與認知兩方面,淺層感知是會被機器取代的,但知識、推理以及思考是機器目前無法完成的。合成主播這個細分產品,仍然需要新華社的編輯提供稿子輸出,但相對深度的表情還不會表達。
搜狗說,AI合成主播的誕生,將為媒體生產端帶來無限想象空間,是智能時代大幅提升新聞生產、傳播效率、新聞價值的有效手段。