由中央廣播電視總臺制作的中國首部文生視頻AI動畫片《千秋詩頌》,將于2月26日起在總臺央視綜合頻道(CCTV-1)18:40檔開播。首批推出的《春夜喜雨》《詠鵝》等6集動畫片通過AI人工智能技術呈現獨具中國審美特色的美術視覺,展現中華經典詩詞中的家國情懷和人間真情。
人工智能使得視頻技術超越了高級成像,進入了另一個層次。視頻成像技術與人工智能相結合,獲得了大量新數據,而且不僅可用于傳統的物理安全應用,還能用于對整個企業的過去、現在甚至未來事件更深入地分析。
2月16日凌晨,OpenAI發布了首個文生視頻模型Sora。Sora可以直接輸出長達60秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。
Sora是一個擴散Transformer模型,通過采用Diffusion Transformer等技術處理不同持續時間、分辨率和比例的視頻/圖像,實現“世界模擬器”,達到理解真實世界的運動和物理能力。
目前官網上已經更新了48個視頻demo,在這些demo中,Sora不僅能準確呈現細節,還能理解物體在物理世界中的存在,并生成具有豐富情感的角色。該模型還可以根據提示、靜止圖像甚至填補現有視頻中的缺失幀來生成視頻。
美國有線電視新聞網(CNN)稱,盡管“多模態大模型”屢見不鮮,但Sora的制作長度和準確性使其與眾不同,它可能會對數字娛樂產業產生重大影響。
根據中研普華產業研究院發布的《2023-2028年中國智能視頻行業競爭分析及發展前景預測報告》顯示:
在技術和工作原理方面,OpenAI介紹稱,因使用Transformer架構,Sora具有極強的擴展性,同時在基于過去對DALL·E和GPT的研究基礎構建上還利用了DALL·E 3的重述提示詞技術,為視覺模型訓練數據生成高描述性的標注。
在OpenAI的Sora之前,谷歌在去年12月21日發布一個全新的視頻生成模型VideoPoet,能夠執行包括文本到視頻、圖像到視頻、視頻風格化等操作。
此前一夜爆紅的文生視頻軟件Pika更掀起了AI視頻應用熱潮。對于此次Sora的出現,360集團創始人、董事長周鴻祎2月16日在微博發文表示,這意味著AGI實現將從10年縮短到1年。
AI視頻指的是利用人工智能技術生成或編輯的視頻內容。這通常涉及到深度學習和計算機視覺技術,允許機器理解和生成視頻內容,或者自動編輯現有視頻。
在AI視頻生成方面,一些軟件工具允許用戶通過文字描述來生成視頻。這些工具通常使用自然語言處理和圖像生成技術,將文字描述轉化為視覺內容。同時,也有一些工具能夠從圖片或現有視頻生成新的視頻內容,這通常涉及到深度學習和計算機視覺技術。
在AI視頻編輯方面,人工智能可以幫助自動化視頻剪輯和后期處理過程。例如,AI可以分析視頻內容,自動選擇最佳鏡頭,或者自動調整顏色、亮度和對比度等參數,以提高視頻質量。
AI視頻在多個領域都有廣泛的應用,包括電影制作、廣告、新聞報道、社交媒體等。數據顯示,截至2023年末,僅國內短視頻用戶規模已突破10億人,不談增量市場可能帶來的紅利,僅僅為這10多億用戶提供AI視頻創意服務,就有大量文章可做。
面對AI視頻生成領域的廣闊前景,國內各廠商正加大投入,推動AI視頻生成進入全新時代。字節跳動于去年11月發布PixelDance模型,不僅在視頻時長上實現了突破,還可通過描述(純文本)+首幀指導(圖片)+尾幀指導(圖片),生成包含復雜場景和動作的視頻,用上一個視頻片段尾幀為下一個視頻頭幀提供指導思路。
萬興科技于今年年初推出國內首個以音視頻為核心的多媒體大模型萬興“天幕”。定位上,萬興“天幕”是音視頻多媒體創作垂類大模型,由視頻、音頻、圖片、語言大模型組成;能力上,萬興“天幕”涵蓋當前市面上語言、音頻、圖像的大模型能力,文生視頻能力是萬興“天幕”的子能力之一;用戶方面,萬興“天幕”面向更細分垂直的市場,包括泛知識、泛營銷、泛娛樂等領域,相關能力已在海外規模化商用。
隨海外OpenAI、谷歌等紛紛推出各自的文生視頻模型,國內領先廠商已入局,其中,海康威視、大華股份、螢石網絡等視頻分析行業領先廠商紛紛投入到多模態大模型研究和行業應用落地進程。
據量子位發布的《AIGC/AI生成內容產業展望報告》,視頻生成將成為近期跨模態生成領域的中高潛力場景,其背后邏輯是不同技術帶來的主流內容形式的變化。英偉達高級科學家Jim Fan評論認為,2022年是影像之年,2023是聲波之年,而2024是視頻之年。
算力的限制可能是目前Sora暫未開放使用的重要因素。隨著AIGC技術在影視劇集、宣傳視頻、自媒體、游戲等領域逐步滲透,視頻創作效率或迎來顯著提升,同時視頻相對于文字、圖像的交互數據量級將有巨大提升,或對應算力需求的高速擴張。
在業內人士看來,Sora是AGI(通用人工智能)實現的重要里程碑,一方面,Sora的出現將全球目光聚焦于視頻生成領域,驗證了視頻為王的趨勢,也進一步驗證了無視頻不傳播的時代,“視頻+大模型”的應用市場空間擴展。
在激烈的市場競爭中,企業及投資者能否做出適時有效的市場決策是制勝的關鍵。報告準確把握行業未被滿足的市場需求和趨勢,有效規避行業投資風險,更有效率地鞏固或者拓展相應的戰略性目標市場,牢牢把握行業競爭的主動權。
更多行業詳情請點擊中研普華產業研究院發布的《2023-2028年中國智能視頻行業競爭分析及發展前景預測報告》。