ChatGPT開發公司OpenAI日前推出新生成式人工智能(AI)模型「Sora」,可根據文字提示及要求生成短影片,雖然目前只提供最長60秒AI生成影片,畫面細節亦尚有少許瑕疵,但影片質素及多元化依然令各界印象深刻,加上Sora為當今唯一進入「影片生成」市場的產品,因而引發熱烈討論。分析認為Sora的面世不但令AI風潮持續加溫,亦造成三大行業即將變天。
一句文字即生成視頻 OpenAI:Sora模型尚未完美
OpenAI在社交平台X帳號示範多段由Sora生成影片,包括將38字prompt(提示)轉變而成的影片,以航拍角度拍攝行人在「東京」雪中漫步的景象。此外,OpenAI在帖文留言和公司網站同時展示,Sora將文字轉變而成的城市夜景、越野車行走山路、漫遊藝術館以至立體動畫等影片。
OpenAI表示,Sora能夠根據使用者給予的提示生成影片,內容可包含多個角色以及特定類型的動態畫面,也將根據提示的主題與背景精準生成影片內容,並可呈現複雜的攝影機運鏡,並且除根據文字產生影片外,Sora也可以依據靜態圖像製作動畫。
不過OpenAI指出,Sora目前仍為未完成的產品,可能難以消化複雜的物理或空間細節,不僅影片長度最多只能達到60秒,生成出的影片或不合邏輯,例如人類在跑步機上跑錯方向等,同時未必能完全遵循特定的運鏡軌跡
公司續指,正為Sora安排紅隊演練(Red Teaming),即探測安全漏洞、其他系統缺陷,也會向藝術家、設計師和電影製作人提供試用。至於對於AI生成影片會否被用於偽造真相用途,OpenAI稱,正同步開發工具來檢測影片是否由Sora生成,一旦未來向大眾提供Sora服務時,也會將詮釋資料(Metadata)嵌入至影片中。
多模態大模型將為生成式AI重點發展方向
Sora發布後,OpenAI的估值進一步水漲船高。《紐約時報》報道,市場預計在最新一輪由創投公司Thrive Capital牽頭融資中,OpenAI的估值預計將超過800億美元;而去年年初ChatGPT剛發布不久後,OpenAI的估值約為290億美元。
此前,OpenAI推出的ChatGPT在數千個英偉達GPU上進行訓練和運行,讓晶片龍頭英偉達Nvidia(NVDA)今年股價累計升幅已接近50%,市值在過去一周接連超越亞馬遜和谷歌,成為美股第三大公司。
隨著文生圖及圖片對話技術的成熟,文生影片已成為多模態大模型下一步發展的重點。市場認為,今年大模型領域的競爭將進一步白熱化,多模態大模型將成為生成式AI的重點發展方向,並推動AI基礎設施的需求。
國泰君安指出,Sora模型推動AI多模態領域飛躍式發展,AI創作等相關領域將迎來深度變革,AI賦能範圍進一步擴大,多模態相關的訓練及推理應用也將進一步提升對算力基礎設施的相關需求。
中信證券表示,多模態大模型演算法的突破將帶來自動駕駛、機器人等技術的革命性進步,持續看好本輪生成式AI浪潮對科技產業的長週期影響與改變,持續關注算力、演算法、數據、應用等環節的領導廠商。
另外,近日投行高盛和摩根士丹利都以人工智慧需求激增為由,上調了英偉達的目標股價,帶動了台積電等廠商股價大漲。全球對算力需求的激增,也推動更多科技公司開始研發自己的人工智慧晶片。目前Google、微軟(MSFT)、亞馬遜(AMZN) 等巨頭企業相繼推出客製化的AI晶片。《彭博》引述知情人士透露,OpenAI在尋求AI晶片製造的能力,正爭取美國政府批准一項與中東投資者相關的大規模晶片合資計劃。
《彭博》報道又指,軟銀行政總裁孫正義正尋求集資1,000億美元(約7,800億港元),以創立一家AI晶片企業,希望在業務上與旗下Arm(ARM)互補之餘,並與Nvidia展開競爭。
三大產業或重塑 拉響失業警報
Sora面世除大幅推動人工智慧基礎設施的需求,同時市場認為將對傳統影視產業、短影片行業及廣告業三個行業造成強大衝擊。
Sora不但可根據文字產生影片外,也可依據靜態圖像製作動畫,AI音樂創作者Beff Jezos社交平台X發文,表示迪士尼旗下電腦動畫製片廠Pixar將會完蛋了「GG Pixar(彼思工作室完蛋了)」Tesla創辦人馬斯克也對這條推文發表了回應「gg humans(人類完蛋了)」。
360創辦人周鴻禕對Sora給予了極高的評價,其誕生意味著AGI(通用人工智慧)實現可能從10年縮短至一兩年。他又指,Sora或帶來產業就業問題,直言對廣告業、電影預告片、短片產業帶來巨大的顛覆。
周鴻禕表示,很多人擔心Sora對影視產業的打擊,但影片的主題、腳本和分鏡頭策劃、台詞的配合,都需要人的創意,至少需要人給提示詞,因此AI不一定那麼快顛覆所有產業,反而能激發更多人的創作力。
工信部資訊通信經濟專家委員會委員、數位經濟專家劉興亮稱,AI生成的影片可能減少了對人類演員、導演和其他創意角色的需求,從而影響到就業。此外,隨著AI技術的進步,傳統的影視製作流程和商業模式也可能面臨重塑。
劉興亮指,Sora能夠生成持續一分鐘左右的1080P高清影片,涵蓋多個角色、不同類型的動作和背景細節等,幾乎達到了電影級別的逼真場景。這種能力不僅為內容創作者提供了前所未有的工具,使他們能夠以更低的成本和更快的速度將創意變為現實,而且為觀眾帶來了更豐富和多樣化的視覺體驗。技術創新的這一巨大飛躍,預示著AI在未來人類生活的各方面都將發揮更加重要的作用。
他補充,這種轉型並不意味著傳統影視產業的消亡,而是需要與AI技術融合,探索新的藝術形式和表達方式。
至於中國企業資本聯盟副理事長柏文喜表示,例如在影視產業,人人都是導演的時代即將來臨,Sora可以快速產生逼真的場景和特效,幫助製作人員更好地實現創意,提高製作效率。在廣告業,Sora可以根據品牌需求和行銷目標,快速產生高品質的廣告。
國盛證券表示,AI文生影片是多模態應用的下一站。文生影片即根據給定的文字提示直接產生影片。隨著文生視訊技術的日趨成熟和廣泛應用,或將為當下熱門的短劇市場帶來變數。該技術可望大幅降低短劇製作的綜合成本,為解決「重製作而輕創作」的共通性問題提供解決方案,短劇製作的重點有望回歸高品質劇本創作。
資料來源:星島日報