NVIDIA 的新 AI 模型 Fugatto 可根據文字提示產生音頻

NVIDIA 剛剛推出了 Fugatto，這是一種革命性的新型人工智慧模型，能夠根據簡單的文字指令生成音訊檔案。

太;博士

英偉達世界技術領導者之一最近推出了其新的創新項目：一個模型人工智慧（AI）他將其描述為“聲音的瑞士軍刀”。此範本稱為 Fugatto，旨在根據文字指令產生或修改音訊檔案。

Fugatto 模式是由來自世界各地的 AI 研究人員團隊設計的，NVIDIA 表示該模式增強了其功能多種口音和多種語言。該計畫背後的研究人員之一、NVIDIA 應用音訊研究負責人 Rafael Valle 表示：“我們想要創建一個像人類一樣理解和產生聲音的模型”。

NVIDIA 列出了 Fugatto 的幾個實際使用場景。他們之中：

研究團隊也發現，Fugatto 只需進行一些微調，就能夠執行未經預先訓練的任務。例如，它可以結合單獨訓練的指令，例如產生具有特定口音的憤怒語音或雷暴期間鳥兒的鳴叫聲。 Fugatto 還可以產生隨時間變化的聲音，例如暴雨穿過景觀的聲音。

NVIDIA 尚未宣佈公眾是否可以使用 Fugatto。值得注意的是，這並不是第一個能夠根據文字描述創建聲音的生成人工智慧技術。事實上，Meta 已經發布了具有類似功能的開源 AI 套件，並且谷歌開發了 MusicLM，一個文本到音樂的人工智慧，可透過該公司的人工智慧測試廚房網站存取。

回顧

了解更多