NVIDIA 剛剛推出了 Fugatto,這是一種革命性的新型人工智慧模型,能夠根據簡單的文字指令生成音訊檔案。
太;博士
- NVIDIA 推出 Fugatto,新的聲音產生 AI 模式。
- Fugatto 可以透過文字指令建立或編輯音訊檔案。
- 此模型可用於音樂製作、語言教育和遊戲開發。
英偉達世界技術領導者之一最近推出了其新的創新項目:一個模型人工智慧(AI)他將其描述為“聲音的瑞士軍刀”。此範本稱為 Fugatto,旨在根據文字指令產生或修改音訊檔案。
AI領域重大突破
Fugatto 模式是由來自世界各地的 AI 研究人員團隊設計的,NVIDIA 表示該模式增強了其功能多種口音和多種語言。該計畫背後的研究人員之一、NVIDIA 應用音訊研究負責人 Rafael Valle 表示:“我們想要創建一個像人類一樣理解和產生聲音的模型”。
Fugatto 的各種應用
NVIDIA 列出了 Fugatto 的幾個實際使用場景。他們之中:
- 音樂製作人可以使用這項技術快速產生原型歌曲創意,然後他們可以輕鬆修改該創意以嘗試不同的風格、聲音和樂器。
- 個人可以使用它以自己選擇的聲音來產生語言學習工具的材料。
- 的開發商電玩遊戲可以使用它根據玩家的選擇和操作創建預先錄製的資產的變體。
Fugatto:具有廣泛功能的人工智慧
研究團隊也發現,Fugatto 只需進行一些微調,就能夠執行未經預先訓練的任務。例如,它可以結合單獨訓練的指令,例如產生具有特定口音的憤怒語音或雷暴期間鳥兒的鳴叫聲。 Fugatto 還可以產生隨時間變化的聲音,例如暴雨穿過景觀的聲音。
NVIDIA 尚未宣佈公眾是否可以使用 Fugatto。值得注意的是,這並不是第一個能夠根據文字描述創建聲音的生成人工智慧技術。事實上,Meta 已經發布了具有類似功能的開源 AI 套件,並且谷歌開發了 MusicLM,一個文本到音樂的人工智慧,可透過該公司的人工智慧測試廚房網站存取。