或許是最有商業價值的AI，谷歌發布VideoPoet，可從0直接生成視頻

今年無疑是生成式 AI 最火爆的一年，文字對話有 ChatGPT 、 Gemini 等，圖片生成有 midjourney 、 DALL-E 等，在這之後不少廠商將目光投入到了生成式 AI 的最後一個關卡——視頻生成。如今看來，這一領域也出現了突破，那就是這款名為 VideoPoet 的大語言模型。

據了解，這款名為VideoPoet的大語言模型之所以被認為是從0生成視頻的革命性視頻生成工具，主要就在於它不僅可以以文生視頻、以圖像生成視頻，還能根據需要進行風格遷移也就是將一種風格的視頻轉換到另外一種風格，根據文本指令的提示進行交互式視頻編輯，可能會給視頻剪輯工作帶來非常大的變革。

不僅如此，VideoPoet還能生成音頻，並能通過調節視頻的最後一秒預測並生成之後的一秒，並且能夠通過重複這一過程來生成任意時長的視頻，至於擴展視頻就更不在話下，而這在視頻修復、視頻視頻擴展方面有著非常重要的意義。

更令人眼前一亮的是，為了展示 VideoPoet 的功能，谷歌還製作了一部由 VideoPoet 生成的多個短片組成的小短片。劇本由接入了Gemini的Bard編寫，整體式一個關於關於一隻旅行浣熊的短篇故事，並附有逐個場景的分解和附帶的提示列表。然後，谷歌為每個提示生成視頻剪輯，並將所有生成的剪輯拼接在一起以生成下面的最終視頻。

VideoPoet生成視頻的部分截圖

相關研究團隊將VideoPoet與其他視頻生成模型進行了對比，用各種參數來評估VideoPoet在文本生成視頻方面的表現，受訪者認為VideoPoet中約24-35%的示例比競爭模型更好，而競爭模型的這一比例為8-11%。由於VideoPoet生成視頻的動作更有趣，評分者對VideoPoet提供示例41-54%表示了喜歡，而其他模型的這一比例則只有11-21%。

不難看出，VideoPoet不僅性能不錯，還在視頻製作、剪輯、修復等多個方面具有非常實際的作用，或許會成為補全生成式AI的最後一環。

不過如果以後在視頻平台上看到的都是AI生成的視頻，恐怕還是有點驚悚。

或許是最有商業價值的AI，谷歌發布VideoPoet，可從0直接生成視頻

文章來源: https://twgreatdaily.com/zh-tw/6155284593bbd20bf96da8a76263f7a5.html

這個跨界有點「野」！大疆攜手Amflow帶來電動山地車與助力系統

貝爾金二合一無線磁吸充電器 AirPower難產後的可選平替方案

曝純血鴻蒙版支付寶正在開發測試：預計Mate 70首發

英偉達GPU在這一領域稱霸！但非常擔憂華為來挑戰

馬斯克：蘋果與OpenAI合作無法保護用戶隱私，將禁止公司使用蘋果設備

蘋果加持佳能 RF-S7.8mm F4鏡頭獲Vision Pro認證

英特爾CEO：晶片禁令限制太強會促使中國打造自研晶片，要小心平衡

榮耀小摺疊手機下月發布，以Magic命名，電池與外屏均是驚喜

iPhone SE 4配置大爆料，國行版本3999元起售？

國產AI殺瘋了！以小博大對戰GPT，或為對抗AI iPhone的最強後援

商業互吹！雷軍為樂道打廣告，李斌稱小米SU7已經把Model 3比下去

微博已接入通義大模型，應用於明星陪聊等場景，網友：又整新活了？

魅族 21 Note上手快評：驍龍8 Gen2+144Hz高刷屏，均衡之選

全液晶儀表+靜謐性提升！新款漢蘭達升級細節曝光

華為全屋智能這次發布會又有大動作，關注老人居家安全問題

比華為更牛？三星Galaxy S25 Ultra影像大升級，潛望長焦加入可變焦距

小米15系列要漲價！10月首發驍龍8 Gen4，終於採用潛望長焦鏡頭

OpenAI上演同門相殘比ChatGPT更強還免費的GPT-4o來了

五菱越來越上道了！寶駿雲海亮相，支持600km長續航

閃迪攜海量存儲亮相P&E：強大性能為高清拍攝保駕護航

哪吒汽車改名鬧分歧！周鴻禕稱不同意CEO張勇的意見

接替庫克、成為下一任蘋果CEO 可能是此人！

榮耀200 Lite海外發布主力機型月底國內亮相

自動駕駛再進一步！馬斯克宣稱Cybertruck的FSD即將推出