“手語播報數(shù)字人”為聽障人士報道冬奧會
根據(jù)全國第二次殘疾人抽樣調查數(shù)據(jù),中國有超過2700萬名殘疾性聽力障礙人士,他們也期待及時了解北京冬奧會的比賽資訊。2月5日開始,采用我國首個超大規(guī)模智能信息模型和虛擬數(shù)字人技術,為聽障人士打造的“冬奧手語播報數(shù)字人”每天亮相北京衛(wèi)視的“冬奧賽事集錦”和“一起看冬奧”兩檔節(jié)目,幫助聽障人士感受奧運盛會的精彩,用科技為殘疾人平等參與社會生活創(chuàng)造無障礙環(huán)境。
“冬奧手語播報數(shù)字人”是在北京市科委、中關村管委會支持下,由智譜AI、凌云光和北京廣播電視臺聯(lián)合打造的,清華大學賈珈教授團隊和中科院計算所陳益強研究員團隊也參與了關鍵技術的研發(fā)。這一系統(tǒng)以超大規(guī)模預訓練模型為核心技術,自主搭建多模態(tài)肢體動作、表情、手指同步采集系統(tǒng),運用跨模態(tài)擬人生成算法、超高精度寫實數(shù)字人等行業(yè)領先技術,實現(xiàn)冬奧期間賽事新聞的專業(yè)手語翻譯播報。
“冬奧手語播報數(shù)字人”系統(tǒng)完成了《國家通用手語詞典》收錄的8214條通用手語的采集和錄制,并且語法都以聽障群體習慣打法為準,以確保手語播報成果的準確性和專業(yè)度。由于當前國內缺少較完善的手語語料數(shù)據(jù),研發(fā)人員在北京市殘聯(lián)及其聾人協(xié)會的支持下,邀請超過40余位聾人老師及手語專家進行手語文本轉寫和技術指導,并進行大范圍的聽障群體評測,最終構建了符合國家通用手語規(guī)范的國內最大規(guī)模多模態(tài)手語語料庫,詞匯及語句總規(guī)模超10萬。
為了構建能夠理解、翻譯語音和手語的智能數(shù)字大腦,“冬奧手語播報數(shù)字人”系統(tǒng)以超大規(guī)模預訓練模型為核心技術,通過語義蒸餾及手語翻譯快編模型,實現(xiàn)新聞播報語音蒸餾成語義高度接近的手語文字,并翻譯成符合手語習慣的語序。最終,手語數(shù)字腦可以通過計算機模仿聽障人士的大腦,進行手語播報驅動。
為了實現(xiàn)高精度、高自然度的人物形象和手語動作姿態(tài),研發(fā)團隊還自主搭建了多模態(tài)肢體動作、表情、手指同步采集系統(tǒng)。通過采集多模態(tài)動作捕捉數(shù)據(jù),運用跨模態(tài)擬人生成算法對超寫實數(shù)字人進行自然、流暢的驅動和渲染,實現(xiàn)對文本內容的手語播報。其中,通過肌肉綁定技術驅動實現(xiàn)面部采集,結合業(yè)內領先的語音識別及高清視頻合成等技術,呈現(xiàn)給聽障人群親切自然的冬奧手語播報服務。“冬奧手語播報數(shù)字人的應用展現(xiàn)了我們‘讓機器像人一樣思考’的愿景,不僅使聽障人士能快捷獲取冬奧資訊,還將無障礙環(huán)境的理念傳遞到數(shù)億人群,讓科技更有溫度?!敝亲VAI的首席技術官張鵬說。
版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。
- 北方防沙帶專項建設規(guī)劃發(fā)布 京津冀協(xié)同布局四大重點項目
- 京平:志愿微光競芳華
- 北京延慶:三級診療流程為涉奧人員提供及時醫(yī)療服務
- 春節(jié)期間,北京市市場供應總體穩(wěn)定 10種“當家菜”保價至元宵節(jié)
- 北京:收費型旅游等級景區(qū)將實施門票網絡預約限流
- 北京豐臺19處封控、管控區(qū)解封
- 北京海淀區(qū)學院路街道:掃描“神器”提速核酸檢測
- 北京:不受學歷和現(xiàn)職稱限制 9名職業(yè)農民獲評農業(yè)專業(yè)技術職稱
- 北京市市場監(jiān)管局:嚴禁借冬奧會變相發(fā)布商業(yè)廣告
- 北京冬奧會成為場館再利用典范