OpenAI 的新 Sora 模型可讓您從簡單文字建立一分鐘視頻

在向公眾開放之前,必須對其濫用的可能性進行適當評估。

太;博士

  • OpenAI 週四宣布創建 Sora,這是一種能夠從文字生成高清影片的新模型。
  • Sora 尚未對外開放,但可供一小群研究人員進行評估。
  • 文字轉影片轉換工具的興起引發了人們對其濫用可能性的擔憂。
  • OpenAI 正在與專家合作測試該工具,並正在開發檢測 Sora 生成的影片的方法。

開放人工智慧, 享有盛譽的公司人工智慧,上週四揭曉新的影片生成模型根據文字說明。這個名字叫“Sora”,在日文中是“天空”的意思創新但是,它不會很快向公眾開放。

隆重介紹 Sora,我們的文字轉視訊模型。

Sora 可以創建長達 60 秒的視頻,其中包含高度詳細的場景、複雜的攝影機運動以及充滿活力的情感的多個角色。https://t.co/7j2JN27M3W

提示:「美麗的,白雪皚皚的...pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI)2024 年 2 月 15 日

索拉的工作原理

根據OpenAI的溝通,“Sora 能夠產生具有多個角色的複雜場景,具有特定的動作以及主題和背景的精確細節”。該程式不僅解釋文字指令,還理解這些元素如何在物理世界中相互作用。然而,它並非沒有缺陷。例如,一篇展示達爾馬提亞狗望向窗外的文章未能描繪說明中提到的人和街道。

提示:「幾隻巨大的毛茸茸的猛獁象正踏著白雪皚皚的草地走來,它們長長的毛茸茸的皮毛在風中輕輕飄動,遠處覆蓋著白雪的樹木和雄偉的雪山,午後的陽光下有縷雲彩,太陽高掛在天空。pic.twitter.com/Um5CWI18nS

— OpenAI (@OpenAI)2024 年 2 月 15 日

一個不那麼新的創新

索拉並不是他所在類別的第一人。其他公司,例如,Google和 Runway 已經向公眾展示或提供了此類工具。索拉的優勢在於它能夠一次性製作 60 秒的視頻,而不是一幀一幀地拼接在一起。

這項技術引發的擔憂

雖然文字轉視訊工具的擴展是向前邁出的重要一步,但也引起了擔憂。人工智慧教授奧倫·埃齊奧尼(Oren Etzioni)等一些人擔心這項技術被濫用來影響選舉。

在此背景下,OpenAI 正在與專家合作,在可能的公眾使用之前對 Sora 進行測試。該公司還在開發工具來檢測 Sora 生成的影片並確保增強可追溯性。