Sora採用類似於OpenAI圖像生成AI工具DALL-E的工作方式,使用者只需輸入所需場景,Sora即可迅速生成相應的影片片段。這項技術不僅可以產生受靜態影像啟發的影片,還能擴展現有影片或填充缺失影格,為影片創作提供了更多可能性。
作為一個擴散式人工智慧模型,Sora基於Google在2017年提出的Transformer架構,具備深度理解和模擬現實世界的能力。目前,Sora能夠生成一分鐘或更短的影片,但隨著技術的不斷優化,未來將有望擴展至更長的影片片段。
目前,Sora僅開放給少數安全測試人員使用,以測試其在錯誤訊息和偏見等方面的表現。該公司表示,將在未來公開相關技術論文,進一步揭示Sora的技術原理和應用場景。
除了影片生成功能外,OpenAI還計劃建立一個「檢測分類器」,用於識別由Sora生成的影片,並提供相應的元數據,以幫助識別人工智慧生成的內容。這一舉措與Meta在大選期間用於識別人工智慧生成影像的元資料類型相似,凸顯了OpenAI對於內容生成的負責任態度。
隨著Sora的推出,OpenAI正積極進入與Meta和Google等公司的視訊生成AI工具競爭的行列。除了Lumiere等產品外,還有其他新創公司提供類似的人工智慧工具,這些工具將影片生成推向了新的高峰。亞馬遜也加入了這一領域,推出了專門產生基於提示的短格式動畫兒童內容的Create with Alexa模型。
綜上所述,OpenAI的Sora模型的推出,不僅代表著影片生成技術的新突破,也展現了OpenAI在人工智慧領域的技術領先地位。未來,隨著這一技術的不斷發展和普及,影片生成將會迎來更多創新和應用。