【看中國2024年2月23日訊】2月16日,OpenAI發布視頻生成模型Sora,極大拓展AI在視頻內容生成方面能力。Sora在關鍵指標上大幅領先之前的一些視頻生成類模型,用它生成視頻,會發現其對物理世界的空間模擬能力甚至達到了逼近真實的水平。
Sora之所以是AI里程碑,是因為它再一次突破了AIGC用AI驅動內容創作的上限。此前大家已經開始使用ChatGPT等文本類輔助內容創作,輔助插圖和畫面生成,用虛擬人做短視頻。而Sora是視頻生成類大模型,通過輸入文本或圖片可生成、連接、擴展等多種方式編輯視頻,屬於多模態大模型範疇,該類模型是在GPT這類語言類大模型上進一步延伸、拓展。Sora通過一種類似於GPT-4對文本令牌進行操作的方式來處理視頻「補丁」。該模型的關鍵創新在於將視頻幀視為補丁序列,類似於語言模型中的單詞令牌,使其能夠有效地管理各種視頻。這種方法與文本條件生成相結合,使Sora能夠根據文本提示生成上下文相關且視覺上連貫的視頻。
從年初蘋果發布Vision Pro頭戴式顯示設備、到各家PC大廠接連發布AIPC,再到這次的OpenAI發布Sora,全世界對於人工智慧的創新在加速,迭代的越來越快。
今後,用AI自動創作生成的內容會影響很多的行業領域,對於熱點話題的「時效性覆蓋」將主要是AI的任務,比拚的主要是AIGC的效率,比拚的是大家能夠駕馭AI的能力,比拚的是誰能夠駕馭類似於Sora這種強勢能的AI生產工具。以後「扔一部小說、出一部大片」不是不可能了,Sora可以生成長達1分鐘的視頻,視頻可以一鏡到底,多角度鏡頭切換,並且對象始終不變。Sora視頻,更可以運用景物、表情和色彩等鏡頭語言,表達出如孤獨、繁華、呆萌等情感色彩。總之,如果未來出現更多的Sora、或者這些生成視頻大模型從以上所述的幾個角度進行更多的改良滯後,未來的AI視頻效果,或許幾乎和人工拍攝不相上下。
多模態模型的應用在2024將迎來黎明,影響影視、直播、媒體、廣告、動漫、藝術設計等數個行業。在當下的短視頻時代,Sora「一個人」就全包了短視頻的攝影、導演、剪輯等任務。未來,Sora生成的各種不同用途的視頻,對於現在的短視頻、直播、影視、動漫、廣告等行業都會產生深遠影響。
比如,在短視頻創作領域,Sora 有望極大降低短劇製作的綜合成本,解決「重製作而輕創作」的共性問題,短劇製作的重心未來有望回歸高質量的劇本內容創作,考驗的是優秀創作者的構思能力。Sora有望真正為相關行業的企業降本增效,廣告製作公司通過Sora模型生成符合品牌的廣告視頻,顯著減少拍攝和後期製作成本;遊戲與動畫公司使用Sora直接生成遊戲場景和角色動畫,減少了3D模型和動畫製作成本。企業節省下來的成本可以用於提高產品、服務質量或者技術創新,推動生產力進一步提升。
如果說2023年是全球AI大模型大爆發,是圖文生成元年的話,那2024年行業會進入AI視頻生成和多模態大模型元年。從ChatGPT到Sora,AI對每個個人、每個行業的現實影響與改變正在逐步發生。