近日,阿里巴巴在數(shù)字人領(lǐng)域動(dòng)作頻頻,推出了多款創(chuàng)新產(chǎn)品和技術(shù),進(jìn)一步推動(dòng)了數(shù)字人技術(shù)的發(fā)展和應(yīng)用。
其中,EchoMimicV2實(shí)現(xiàn)了從數(shù)字人頭到數(shù)字人的飛躍。用戶只需輸入圖片、手勢(shì)視頻和音頻,即可生成一個(gè)完整的數(shù)字人。這一技術(shù)的突破,使得數(shù)字人的生成更加便捷和高效,為數(shù)字人在各個(gè)領(lǐng)域的應(yīng)用提供了更廣闊的空間。
同時(shí),阿里云推出的Live Portrait數(shù)字人視頻生成工具也備受關(guān)注。該工具允許用戶通過上傳照片和文本或語音,即可生成數(shù)字人視頻。這一工具的應(yīng)用場(chǎng)景非常廣泛,可以用于在線教育、虛擬主播、數(shù)字營(yíng)銷等多個(gè)領(lǐng)域,為用戶帶來更加生動(dòng)、真實(shí)的數(shù)字人體驗(yàn)。
此外,阿里巴巴還在積極研發(fā)“數(shù)字人+終端”新形態(tài),探索數(shù)字人在可持續(xù)、大規(guī)模、組合式場(chǎng)景與用戶的交互。這一舉措將進(jìn)一步推動(dòng)數(shù)字人技術(shù)的發(fā)展和應(yīng)用,為數(shù)字人走進(jìn)人們的生活提供更多可能性。
除了阿里巴巴,其他企業(yè)也在數(shù)字人領(lǐng)域積極探索。美圖推出的DreamAvatar AI數(shù)字人生成工具,能幫助用戶實(shí)時(shí)生成文章、繪畫等內(nèi)容,為用戶提供更加豐富的創(chuàng)作體驗(yàn)。FlipSketch則旨在將草圖轉(zhuǎn)換為草圖風(fēng)格動(dòng)畫,雖然效果還有提升空間,但其開源的特性為開發(fā)者提供了更多學(xué)習(xí)和探索的機(jī)會(huì)。
此外,MangaEditor作為多功能漫畫創(chuàng)作工具,連接了多個(gè)平臺(tái),功能齊全且開源,為漫畫創(chuàng)作者提供了更加便捷的創(chuàng)作環(huán)境。InstantX推出的RAG-Diffusion能夠精確布局與圖像重繪,效果出色,還支持與LoRA一起使用,為圖像生成和編輯提供了更多可能性。
在視頻處理方面,Runway推出了全新擴(kuò)展視頻功能,支持縱橫比轉(zhuǎn)換,類似于PS的內(nèi)容填充視頻版,為視頻編輯者提供了更多創(chuàng)意空間。LTX-Video則是最新開源的視頻生成模型,生成速度快但質(zhì)量遜于商業(yè)模型,不過其開源的特性仍然吸引了眾多開發(fā)者的關(guān)注。Image2Body則能將繪畫圖片轉(zhuǎn)為線稿草圖,適合學(xué)習(xí)繪畫的用戶使用。
綜上所述,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,數(shù)字人技術(shù)正在逐漸走進(jìn)人們的生活。阿里巴巴等企業(yè)的積極探索和創(chuàng)新,將進(jìn)一步推動(dòng)數(shù)字人技術(shù)的發(fā)展和應(yīng)用,為數(shù)字人產(chǎn)業(yè)的蓬勃發(fā)展注入新的活力。