11月6日,2025世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎?wù)浇視?,百?ldquo;劇本驅(qū)動多模協(xié)同的高擬真數(shù)字人技術(shù)”獲獎,這也是百度大模型繼2023年“知識增強大語言模型關(guān)鍵技術(shù)”和2024年“文心智能體技術(shù)”之后,連續(xù)三年獲得該獎項。
本屆大會共收到來自34個國家和地區(qū)的424項科技成果申報,最終經(jīng)專家評審選出17項年度領(lǐng)先科技獎。
會上,百度首席技術(shù)官王海峰作為發(fā)布人出席頒獎典禮。他介紹,百度劇本驅(qū)動多模協(xié)同的高擬真數(shù)字人技術(shù),包括融合多模規(guī)劃與深度思考的劇本生成、動態(tài)決策的實時交互、文本自控的語音合成、高一致性超擬真數(shù)字人長視頻生成等技術(shù)創(chuàng)新。該技術(shù)突破了多模態(tài)實時協(xié)同、復(fù)雜動態(tài)交互等技術(shù)難題,實現(xiàn)了數(shù)字人語言、聲音和形象的協(xié)調(diào)一致,提升了數(shù)字人直播內(nèi)容的質(zhì)量和交互能力,具有“高情商、強互動、長續(xù)航、更專業(yè)”的特色,效果超過真人。
最新數(shù)據(jù)顯示,基于百度數(shù)字人技術(shù)已生產(chǎn)超過10萬個數(shù)字人,應(yīng)用于電商、教育、法律等各行各業(yè),幫助降低開播成本達80%,提升直播轉(zhuǎn)化率31%。在6月15日百度優(yōu)選羅永浩數(shù)字人首場直播中,運用該技術(shù)打造的羅永浩與朱蕭木數(shù)字人,成功完成長達6小時的超擬真直播,觀播人數(shù)達1300萬,GMV突破5500萬。
目前,該技術(shù)已在百度電商場景的明星、圖書和健康直播上落地應(yīng)用,幫助眾多商家拓寬了銷售渠道,降低直播成本,提高運營效率。數(shù)字人可以24小時不間斷直播,增加了商品的曝光時間和銷售機會,進一步提升了經(jīng)濟效益。
公開資料顯示,自2016年以來,百度已憑借百度大腦、小度助手(DuerOS)、Apollo、飛槳、知識增強大語言模型、文心智能體技術(shù)、劇本驅(qū)動多模協(xié)同的高擬真數(shù)字人技術(shù)等創(chuàng)新成果七次獲得世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎。