原創?新熵
作者丨思原 編輯丨龍葵
2024年,是AI應用集中爆發的一年,智能搜索、文生視頻、日常聊天,這些已經融入到了我們的日常生活、工作之中,讓我們享受到了便利。
但對于起調頗高的AI,也不禁會有質疑,AI也不過如此。但如果說,現在的AI能夠判斷煤氣是否泄漏,能夠讓愛因斯坦出現在課堂之上,亦能夠讓李白“親自”朗誦詩詞,這是否會讓你感到詫異?
其實這些看似天馬行空的事情,離我們已經越來越近。
在12月29日晚間,中央廣播電視總臺首屆《中國科技創新盛典》(總臺“科晚”)播出,這場“科技春晚”以“新質生產力”為核心關鍵詞,匯聚了新質生產力代表性的新興產業、科技企業。
其中科大訊飛董事長劉慶峰作為杰出代表出席了此次“科晚”,并且用一系列精彩的現場演示,展示了最新的人工智能技術應用成果,讓更多人看到了人工智能是如何解放生產力,如何為我們的生活創造更多價值。
AI張騰岳,飆起3種方言
這次科晚上有這樣一幕,舞臺上突然出現了主持人張騰岳的“分身”,兩個張騰岳同時出現的情形著實讓觀眾為之震驚。
但其實這是由訊飛智作打造的 AI 虛擬數字人,不但能夠與真人主持人神態自若地互動對話,更是以其出色的方言朗誦能力驚艷全場,帶來了一場跨越語言與方言的精彩表演。
舞臺上,AI張騰岳用陜西、廣東、河南三地方言分別演繹了《靜夜思》《望月懷遠》《滿江紅》等經典詩詞,字正腔圓、韻味十足,仿佛一位來自當地的文化傳承者,將詩詞中的情感與意境通過方言的獨特魅力展現得淋漓盡致。
除了讓人驚喜的語言能力外,“AI張騰岳” 在與真人主持人的互動以及自身的形象動作展現方面同樣表現優秀。它能夠神態自若地與主持人進行對話交流,準確理解對方的話語并迅速做出恰當回應,其流暢自然的程度讓人幾乎難以察覺這是一個虛擬的存在。
在形象上,“AI張騰岳” 可以說是1:1的精準復刻,再現了真實主持人張騰岳的聲音、表情和動作,從細微的面部表情到肢體的一舉一動,都與真人高度相似,具備自然的表情、流暢的動作和真實的聲音表現。
據了解,AI張騰岳融合了科大訊飛先進的語音合成、語音識別、語義理解、唇形預測、圖像處理等前沿人工智能技術。通過深度學習,精準還原了表情和動作,再加上先進的語音合成技術,使得“AI張騰岳”擁有逼真的表情、流暢的動作和生動的聲音表現。
“AI張騰岳”的出現,也意味著虛擬數字人已經實現了從“形似”到“神似”的跨越。
而這令人眼前一亮的表演,也與科大訊飛深厚的多語種技術積累有關。今年,科大訊飛作為第一完成單位的“多語種智能語音關鍵技術及產業化”項目獲得年度國家科技進步一等獎。這是深度學習引發全球人工智能浪潮以來,過去十年人工智能領域的首個國家科技進步一等獎,標志著中國在多語種AI技術領域已達到國際領先水平。
多年來,科大訊飛在多語種技術領域屢創佳績:連續5屆獲得國際多通道語音分離識別比賽CHIME冠軍;榮獲世界互聯網大會首屆杰出貢獻獎、創新突破獎;在國際聲學場景及分類挑戰賽、IEEE國際多媒體博覽大會等多個語音識別競賽中,斬獲多項冠軍。
其實在今年的科大訊飛全球1024開發者節上,科大訊飛便率先推出了超擬人數字人,不僅在口唇、表情、動作上更為靈活自然,在制作模式上,與傳統的數字人需要依賴預先錄制的模板動作不同,訊飛數字人僅需一張照片即可完成形象的定制,并且用戶可以直接在訊飛智作平臺上體驗這一技術,減少了用戶的操作路徑和使用門檻與成本。
隨著大模型賦能數字人的飛速發展,虛擬人應用也可以在日常生活中很直觀的感受到,從營銷到金融,從文旅到電商,越來越多虛擬人開始承擔著導游、客服、主播等多元角色,出現在金融、文旅、媒體、政企等常見場景。
目前訊飛多場景虛擬數字人結合星火認知大模型的最新技術已經賦能多個領域,從國際賽事巴黎奧運會到非遺文化北京中軸線,從行業活動天津智博會到智慧展廳山東高速,都能看到其身影。而以AI虛擬人交互平臺為代表的平臺化產品,也已在央國企(企業數字化)、教育培訓、文化旅游、電子商務、金融服務等多個行業領域內成功落地,其應用的廣度與深度均在持續拓展之中。
未來隨著企業、行業應用數字人的深入,對數字人的需求模式也在分層,而隨著科大訊飛圍繞數字人產品的商業模式和打法策略的更新,相信未來可以幫助更多個人及企業實現更智能、更創新、更可靠的一站式的數字人解決方案。
智慧黑板,讓教學更立體
在本次科晚上,除了AI張騰岳的出現,劉慶峰還演示了AI在教育領域的能力。
舞臺上,劉慶峰站在智慧黑板前做了一個畫圓的動作,一個完美的圓形立即呈現在黑板上。隨后,他隨手畫下一個能夠360度旋轉的立方體,讓抽象的幾何概念變得生動具體。
其實這利用到的便是AI多模態理解。基于科大訊飛自主研發的3D剖分與動態渲染引擎,直觀呈現空間構圖,進行圖形分割,動態展示截面與立方體的空間變化,在不改變老師的書寫習慣的同時,將抽象知識進行直觀展示,培養學生數學建構能力。
需要注意的是,虛擬人也是這塊智慧黑板的“靈魂”所在。
晚會現場,愛因斯坦、李白等虛擬形象出現在了智慧黑板上,主持人與現場觀眾也實現了與歷史名人的“隔空對話”。
從本質上來看,虛擬人輔教便是典型的AI數字人應用。虛擬人可以與學生實時進行情景對話、語音評測,還支持啟發式讀寫拓展;同時也可以實時回答學生的奇思妙問,激發學生的好奇心與求知欲。課下,虛擬人助教還可以帶領學生進行課間活動,比如唱紅歌、課桌操、古詩詞朗誦等等,助力實現五育并舉。
在教育領域,科大訊飛已為全國32個省級行政區的5萬余所學校提供常態化應用。此次“科晚”展示的星火智慧黑板不僅獲得全球智慧教育創新獎,更成功入選2024世界人工智能大會SAIL獎(Super AI Leader,卓越人工智能引領者)TOP30榜單,并作為“AI+教育”賽道唯一獲獎者入選“人工智能+”議題6項最具代表性項目之一。
AI機器狗,成工業安全員
搭載聲學成像儀的巡檢機器狗“小汐”,也出現在了這次科晚舞臺上,并且劉慶峰親自展示了小汐在工業安全領域的可能性。
在工廠模擬場景中,劉慶峰邀請知名主持人張騰岳進行了一場尋找泄漏點的實驗。面對一堵模擬的煤氣管道和危險品運輸管道墻,盡管張騰岳貼近管道、全神貫注地聆聽,卻仍未能察覺到任何異常聲音。然而,小汐僅用了短短幾秒鐘就精準鎖定了泄漏位置,展現出其在工廠安全巡檢和設備故障預警中的巨大潛力,讓全場觀眾驚嘆不已。
小汐之所以有如此出色的排查能力,得益于訊飛潮汐力的工業AI聲學成像儀,再融合高精度麥克風和超聲波聲源定位技術。通過聲像圖與可見光圖像疊加的成像方式,實時展示聲源的分布狀態,迅速辨別出細微聲音。
這一技術不僅可以在工業安全領域實現精準檢測泄漏、進行設備故障預警;在環境監測方面還能定位噪音源、檢測危險氣體;在安防監控領域可識別異常聲音、輔助應急救援;在智能巡檢中能替代人工巡檢、進行數據采集與分析。
除了“小汐”,科大訊飛還依托工業六感技術,打造了AI聲學成像儀、AI工業內窺鏡等一系列工業AI傳感儀器。這些產品不僅入選了工信部智能檢測裝備創新產品目錄(第一批)、2024水利部先進實用技術推廣目錄,還獲得中國電科院科學技術一等獎等獎項。
在全球元宇宙和數字經濟加速發展的背景下,通過人工智能的賦能,科大訊飛憑借國家級技術背書、全球領先的多語種能力和成熟的產業生態,在直播、服務、影視、教育、電力、制造等眾多行業,成功打造了多個數字化轉型標桿項目,為行業轉型升級注入了新的活力。?
從這次科晚我們也能看到,科大訊飛正以創新為驅動,不斷拓展人工智能的應用邊界。在未來,我們有理由相信,科大訊飛將繼續引領科技潮流,為我們的生活、工作和社會發展帶來更多的驚喜與變革,讓人工智能真正成為推動人類進步的強大力量。