C114訊 4月25日消息(南山)作為AI技術的重要應用方向,數字人去年以來迅速崛起,憑借“24小時直播”、“只需一部手機即可直播”、“低成本高收益”等賣點,成為電商、營銷、文旅等一眾行業的新寵。但問題也隨之浮現:數字人不夠真實,直播效果不佳;供應商魚龍混雜,軟件價格暗藏陷阱;電商平臺態度不一等,為商家采用這一新型AI技術帶來了很多困擾。
很顯然,電商直播數字人市場還處于草創時期。百度嘗試通過AI技術創新實現引領,在4月25日舉辦的“Create 2025百度AI開發者大會”上,百度創始人李彥宏發布了高說服力數字人,他介紹說,高說服力數字人具備聲形超擬真、內容更專業、互動更靈活的特點,相比傳統數字人文案枯燥、動作少、機器音重等問題,高說服力數字人在表情、語氣、動作等都非常自然,甚至表現力超過真人。
而在這背后,發揮作用的重要是 “劇本生成”能力,能讓表情、語氣、動作都匹配臺詞內容實時調整,讓數字人的情緒轉折和動作切換順暢。
比如現場演示的高說服力數字人講《蘇軾十講》視頻,可以看到慧播星生成的艾彌兒數字人非常逼真,表情、語氣、動作都十分真實,和真人無異,匹配臺詞實時調整,情緒轉折和動作切換都很順暢,直播表現力甚至超越真人。
據悉,在文心4.5 Turbo和文心X1升級版的基礎上,通過視頻生成、劇本驅動多模匹配、高感染力TTS等能力建設,打造出的一種超擬真、會思考、能協同的數字人。
讓數字人超越真人,無疑極具吸引力,帶來了巨大的想象空間。問題在于,這是現在,還是未來?
逼近真人與超越真人
相比以前的數字人,在百度App電商平臺中直播的數字人,不僅外形如同真人,言談舉止甚至一些不經意的小動作,也和真人一般無異,還能夠和買家互動,渾然讓人忘記對面其實是一個虛擬人物,
可以看到不少數字人主播已經“營業”,效果極為擬真,不僅外形如同真人,言談舉止甚至一些不經意的小動作,也和真人一般無異,還能夠和買家互動,渾然讓人忘記對面其實是一個虛擬人物。
筆者基于個人的4分鐘視頻信息,創建了一個自己的慧播星電商直播數字人,并基于自己撰寫的文案一鍵開播。視頻直播中如同一個全新的自己:相貌一模一樣,說話方式也幾乎一樣,談論的內容則遠非自己所能,讓筆者感到新鮮的同時也感到震驚。
在動態的直播環境中,慧播星數字人的呈現效果,足夠驚艷。百度副總裁、百度電商總經理平曉黎接受C114等媒體采訪時表示,慧播星數字人直播基于真人底板,因而視覺感知實現了和真人直播一樣的效果;同時,基于語音大模型,聲音也實現了類似真人的表達感染力;基于預設的劇本,數字人的動作也更加協調、自然,除了直播,也會通過一些細節,例如翻看手機,展現出更好的親和力。
百度慧播星數字人不僅擁有擬真的外貌和表現,它還擁有基于龐大云端知識庫的豐富知識儲備,從而做到“美貌與實力并存”。因此,在某種程度上來看,畫慧播星數字人直播能夠實現超越真人直播的效果。
上述逼近真人的表現之外,慧播星數字人還有龐大的云端知識庫,無疑比真人主播更加“博學”、更具文采,從而在某些方面實現超越真人直播的效果。平曉黎提到,電商直播具有一定的門檻,滲透率還比較低,而通過慧播星數字人,大量商家將直接擁有直播能力,切入這一領域,從而實現銷售額的增長。百度采取開放的態度,為商家打造了強大的數字人直播平臺。
數字人有望迎來“DeepSeek時刻”
高說服力數字人的概念,建立在多項AI技術取得突破的基礎之上。相比建模、綁定、渲染等傳統數字人技術,以及上一代的語音交互、自然語言處理、視覺等AI技術,新一代大模型帶來了多模態融合、腳本智能創作、自主思考決策、多智能體調度等核心技術,使得數字人能力、制作時間、成本等一降再降低,效果也迎來質的飛躍。
平曉黎重點講解了兩大新應用:一方面基于多模態融合,從大模型驅動的腳本模式,演進到了劇本模式。劇本模式在生成上不僅指導數字人主播表達的語言腳本,更是進入了劇本,直播時用什么樣的表情和動作,語調是激情澎拜還是娓娓道來,均可通過“克隆”實現,以及業內領先的唇動生成技術,用戶上傳真人視頻,可一鍵克隆真人聲音、形象與直播間裝修,0門檻開啟24小時數字人直播。
另一方面多智能體協同實現了AI大腦,配合主播的口播文案,AI大腦能夠實時調度素材,展現和文本一一對應的內容。而當用戶提問時,AI大腦也能及時根據用戶需求,調度視頻來呈現用戶想要看到的畫面。這種毫秒級的響應能力,讓專業講解變得可視化、記憶點十足,同時主播還能夠根據用戶歷史行為,主動發起提問和用戶互動,且能夠持續互動,從而說服用戶“買買買”。
基于文心4.5turbo等大模型作為底座能力,百度慧播星上線了“一鍵開播”、“一鍵克隆”等新功能,每一位入駐百度電商平臺的商家,無需付費購買軟件,均可0成本制作數字人主播,且靈活切換主播風格,從而帶來業務的增長。亂象橫生的電商直播數字人市場,可能迎來了“DeepSeek時刻”,人人皆可直播,帶來了巨大的創造力。
AI大模型的“殺手級應用”
在Create 2025上演講時,李彥宏認為數字人是2025 年最令人激動的突破性應用之一。
基于高說服力數字人所呈現的突破性創新,筆者看到了數字人徹底擺脫傳統動作神情呆板、聲音機械化缺乏情感等形象,變得“有血有肉”,甚至展現出一個有趣的靈魂,有望成為AI大模型的“殺手級應用”。
百度做了大量工作。在技術側,百度慧播星在IDC評選的綜合實力排名行業第一基礎上再度升級,高說服力數字人首先說服的是廣大商家,再由商家說服顧客;在市場側,據平曉黎透露,百度正在通過業務部署,正在與外貿商家密切溝通,幫助他們出口轉內銷,打開新渠道。數字人是重要一環,可以幫助外貿商家更低成本、更快地適應國內電商市場,無需招聘直播團隊、準備直播場地,即可開展直播電商業務。
盡管和真人主播、尤其是頭部大主播的人設打造、粉絲經營相比,數字人主播還存在不足,但從新一輪技術突破的角度看,數字人主播已能成為商家直播電商的重要幫手,起到輔助甚至主攻的作用,也擁有了成為頭部主播的潛力。尤其是教育、圖書、醫療、法律等考驗主播的文化素養或知識技能的領域,數字人直播憑借擁有云端知識庫的AI大腦,能力已整體超過真人主播。
用戶用百度慧播星創造一個數字人直播,或者在百度App上觀看幾場數字人直播,就會直觀地感受到數字人技術的巨大突破。隨著AI技術迭代,數字人直播電商市場有望快速越過草創期,進入行業走向規范、繁榮的發展期。