微軟AI將你的照片變成逼真的說唱視頻

創造者認識到他們的發明可能會偏離其最初的用途。

太;博士

亞洲分部微軟研究揭開了一項既令人著迷又令人擔憂的發明的面紗：VASA-1。這個工具人工智慧實驗性的，能夠拍攝一個人或其藝術表現形式的靜態圖像，並透過錄音來即時創造令人驚嘆的真實說話面孔。

VASA-1 可以為現有的靜態圖像產生面部表情和頭部動作，以及與演講或歌曲相匹配的適當的嘴唇動作。如果嘴唇和頭部的運動有時看起來有點機械化，那麼很明顯，這項技術可能會被濫用來快速、輕鬆地創造深贗品非常現實。

面對這些前景，負責VASA-1的團隊仍保持謹慎態度。他們選擇不公開“線上演示、API、產品、其他實施細節或任何相關產品”，直到他們得到保證他們的技術“將被負責任地使用並遵守適當的法規”。然而，他們沒有具體說明是否計劃實施保障措施，以防止惡意行為者將其用於有害目的。

然而，研究人員對他們的發明仍然持樂觀態度。據他們說，該工具可以促進教育公平，提高那些有溝通困難的人的可及性，甚至為有需要的人提供陪伴和治療支持。這是一個真正的突破，它將提供對可以為其所有者進行通信的化身的特權存取。

最終，雖然濫用的可能性是不可否認的，但我們很難不欽佩 VASA-1 的創新和潛力。

回顧

了解更多