AI公司Midjourney發(fā)布首個視頻模型,用戶可將圖像制作成動畫,支持平臺內(nèi)生成或外部上傳的圖片。初始視頻為5秒片段,可延長至最多20秒。該功能僅限網(wǎng)頁端使用,需月付10美元訂閱。盡管在視頻AI領(lǐng)域起步較晚,但面臨創(chuàng)作者指控其模型訓(xùn)練涉嫌侵權(quán)。迪士尼和NBC環(huán)球上周起訴該公司版權(quán)侵權(quán)。
知名AI圖像生成公司Midjourney發(fā)布備受期待的AI視頻生成模型V1。該模型可將用戶上傳的圖像轉(zhuǎn)換為四段5秒視頻,僅通過Discord提供服務(wù)。V1與OpenAI的Sora、Runway的Gen 4等產(chǎn)品競爭,但更專注創(chuàng)意應(yīng)用而非商業(yè)用途。公司計劃未來開發(fā)3D渲染和實時AI模型,最終目標(biāo)是創(chuàng)建實時開放世界模擬系統(tǒng)。視頻生成費用為圖像生成的8倍,最低訂閱計劃為每月10美元。
Google 將 Veo 2 AI 視頻生成模型引入其 Gemini Advanced 訂閱服務(wù),用戶可生成 8 秒、720p 分辨率的視頻并方便分享;未來還計劃結(jié)合 DeepMind 的 AI 模型優(yōu)化對真實世界的理解。
AI視頻生成公司Runway宣布完成3.08億美元融資,由General Atlantic領(lǐng)投,估值超30億美元。公司剛發(fā)布新一代視頻生成模型Gen-4,可生成長達(dá)10秒的視頻片段。Runway計劃利用新資金加強(qiáng)AI開發(fā),重點提升訓(xùn)練數(shù)據(jù)集質(zhì)量和擴(kuò)展擴(kuò)散模型與大語言模型能力。
Runway AI公司推出了迄今為止最先進(jìn)的AI視頻生成模型Gen-4,實現(xiàn)了多鏡頭間角色和場景的一致性,這是之前大多數(shù)AI視頻生成器無法做到的。該模型可生成720p分辨率的5-10秒視頻片段,并計劃本周推出更多功能。這一突破可能徹底改變電影制作流程,引發(fā)了對版權(quán)和就業(yè)的討論,也為創(chuàng)作者帶來了新的機(jī)遇和挑戰(zhàn)。
AI 視頻創(chuàng)業(yè)公司 Runway 發(fā)布了最新的 Gen-4 視頻合成模型,聲稱解決了 AI 視頻生成的幾個關(guān)鍵問題。該模型能夠在不同場景中保持人物和物體的一致性,并允許從多個角度拍攝同一環(huán)境或主題。這一突破性進(jìn)展有望為創(chuàng)意專業(yè)人士提供更實用的 AI 視頻制作工具。
Moonvalley 公司推出 Marey,這是一款專為好萊塢影視制作和品牌營銷設(shè)計的 AI 視頻生成模型。與其他使用網(wǎng)絡(luò)抓取數(shù)據(jù)的模型不同,Marey 僅使用完全授權(quán)的數(shù)據(jù)進(jìn)行訓(xùn)練,為影視行業(yè)提供了一個無版權(quán)爭議的 AI 視頻創(chuàng)作選擇。該模型具備高清視頻生成、長視頻制作、分層編輯等多項先進(jìn)功能,旨在輔助而非取代專業(yè)創(chuàng)作者。
Google 即將為 Gemini 聊天機(jī)器人推出 AI 視頻創(chuàng)作功能,用戶可通過文字描述生成短視頻。最新泄露信息顯示,該功能代號為"Toucan",生成每個視頻需 1-2 分鐘,可能會限制每日生成數(shù)量。這表明 Google 可能會為付費用戶提供更多權(quán)限,或采用信用購買制。雖然 Google 尚未正式宣布,但開發(fā)持續(xù)進(jìn)行,有望近期推出。
Tavus Inc.是一家人工智能研究初創(chuàng)公司,專注于開發(fā)能夠模擬與他人對話體驗的實時AI技術(shù)。今天,該公司宣布推出一系列突破性的AI模型,旨在構(gòu)建人機(jī)互動的操作系統(tǒng),通過“對話視頻界面”使AI能夠自然地感知、理解和回應(yīng)。Tavus的使命是讓AI理解面部表情、語調(diào)和肢體語言,并能夠用自己的表情和語調(diào)做出反應(yīng)。
阿里云開源了其視頻基礎(chǔ)模型系列,為企業(yè)和研究人員提供視頻創(chuàng)作能力。這包括兩個版本的四個模型,分別擁有140億和13億參數(shù)。這些模型可以從文本和圖像輸入生成高質(zhì)量視頻,支持中英文文本效果,并在視頻生成模型基準(zhǔn)測試中表現(xiàn)出色。此舉旨在降低AI應(yīng)用門檻,讓更多企業(yè)能夠創(chuàng)建高質(zhì)量視覺內(nèi)容。
Guidde 是一家創(chuàng)新型初創(chuàng)公司,利用人工智能技術(shù)自動生成軟件應(yīng)用培訓(xùn)視頻。該平臺通過捕捉用戶操作,將其轉(zhuǎn)化為帶有"故事線"的視頻,并提供 AI 配音、背景音樂等功能。Guidde 還推出了個性化內(nèi)容推薦功能,旨在提高企業(yè)軟件培訓(xùn)的參與度和效果。目前該公司已獲得 3000 萬美元融資,服務(wù)超過 10 萬用戶。
Adobe 推出新的 AI 視頻生成模型 Firefly,進(jìn)軍生成式 AI 領(lǐng)域。該模型僅使用授權(quán)內(nèi)容訓(xùn)練,可安全用于商業(yè)項目,是 Adobe 為專業(yè)創(chuàng)作者提供可靠 AI 工具的重要一步。新功能將通過 Firefly 網(wǎng)頁應(yīng)用和 Premiere Pro 軟件提供,可根據(jù)文本或圖像生成 1080P 視頻片段。
YouTube 推出新的生成式 AI 視頻功能,創(chuàng)作者可在制作 Shorts 時使用。該功能集成了 Google 的 Veo 2 視頻模型,允許用戶生成獨立視頻片段并添加到 Shorts 中。這項功能將為創(chuàng)作者提供更多創(chuàng)意選擇,但同時也引發(fā)了對 AI 生成內(nèi)容真實性的討論。
Adobe 發(fā)布 Firefly 視頻模型公測版,推出業(yè)界首個商業(yè)安全的 AI 視頻生成模型。新模型可在 Firefly 應(yīng)用和 Premiere Pro 中使用,能生成可直接用于生產(chǎn)的無版權(quán)視頻內(nèi)容。Adobe 還推出了 Firefly 標(biāo)準(zhǔn)版和專業(yè)版計劃,提供靈活的使用額度和新的音頻、視頻功能。
數(shù)字人和虛擬人等概念和產(chǎn)品屢見不鮮,司馬華鵬向大模型之家透露,硅基智能自成立之初就將視頻生成作為公司的重要目標(biāo),尤其是將生成人物形象作為戰(zhàn)略規(guī)劃的核心。得益于人工智能技術(shù)的不斷進(jìn)步,硅基智能在數(shù)字人直播、數(shù)字人短視頻和數(shù)字人克隆等領(lǐng)域取得了顯著的市場份額,成為這些領(lǐng)域的領(lǐng)先企業(yè)之一。