微軟AI將你的照片變成逼真的說唱視頻

創造者認識到他們的發明可能會偏離其最初的用途。

太;博士

  • 微軟亞洲研究中心推出 VASA-1 實驗工具。
  • 它從靜態圖像和音訊檔案創建逼真的說話面孔。
  • 公共訪問受到限制,可能被濫用來製造深度偽造品。
  • VASA-1 可以改善教育公平和溝通無障礙。

VASA-1:令人驚嘆的創新

亞洲分部微軟研究揭開了一項既令人著迷又令人擔憂的發明的面紗:VASA-1。這個工具人工智慧實驗性的,能夠拍攝一個人或其藝術表現形式的靜態圖像,並透過錄音來即時創造令人驚嘆的真實說話面孔。

VASA-1 可以為現有的靜態圖像產生面部表情和頭部動作,以及與演講或歌曲相匹配的適當的嘴唇動作。如果嘴唇和頭部的運動有時看起來有點機械化,那麼很明顯,這項技術可能會被濫用來快速、輕鬆地創造深贗品非常現實。

圍繞著「deepfake」的爭議

面對這些前景,負責VASA-1的團隊仍保持謹慎態度。他們選擇不公開“線上演示、API、產品、其他實施細節或任何相關產品”,直到他們得到保證他們的技術“將被負責任地使用並遵守適當的法規”。然而,他們沒有具體說明是否計劃實施保障措施,以防止惡意行為者將其用於有害目的。

無論如何,前景光明

然而,研究人員對他們的發明仍然持樂觀態度。據他們說,該工具可以促進教育公平,提高那些有溝通困難的人的可及性,甚至為有需要的人提供陪伴和治療支持。這是一個真正的突破,它將提供對可以為其所有者進行通信的化身的特權存取。

最終,雖然濫用的可能性是不可否認的,但我們很難不欽佩 VASA-1 的創新和潛力。