OpenAI 聲稱其免費的 GPT-4o 模型可以像人類一樣說話、笑、唱歌和看東西!

該公司還提供 ChatGPT 桌面應用程式。

太;博士

  • OpenAI 推出了新的人工智慧模型 GPT-4o。
  • 此模板接受文字、音訊和圖像作為輸入。
  • 他在談話中幾乎可以立即識別情緒並做出反應。
  • GPT-4o 將向所有人開放,包括免費用戶聊天GPT

公司開放人工智慧週一宣布開發新模型 GPT-4o人工智慧。根據米拉·穆拉蒂OpenAI 的技術長表示,這個複雜的模型代表著向「更自然」的人機互動邁出了一大步。

令人印象深刻的多式聯運能力

GPT-4o 比其前身使用起來更加直觀,能夠處理文字、音訊和圖像輸入的組合,並產生所有三種格式的輸出。與舊的 GPT-3.5 和 GPT-4 模型相比,這是一個重大改進,舊的 GPT-3.5 和 GPT-4 模型將語音轉錄為文本,從而忽略了語氣和情感並減慢了交互速度。

GPT-4o 驚人的情緒辨識能力在現場演示中得到了證明。該模型在各種情況下進行了測試:從英語到義大利語的即時翻譯、求解線性方程,甚至指導深呼吸。

向 GPT-4o 打個招呼,這是我們的新旗艦模型,它可以即時跨音訊、視覺和文字進行推理:https://t.co/MYHZB79UqN

今天在 API 和 ChatGPT 中推出文字和圖像輸入,並在未來幾週內推出語音和視訊。pic.twitter.com/uuthKZyzYx

— OpenAI (@OpenAI)2024 年 5 月 13 日

開放給所有人並進行重大發布

OpenAI 表示,GPT-4o 將在未來幾週內向所有人開放,包括免費的 ChatGPT 用戶。 ChatGPT 的桌面版本最初適用於 Mac,從今天開始也將向付費用戶提供。

OpenAI 的聲明是在公司年度開發者大會前夕發布的Google,谷歌輸入/輸出。這強調了對抗激烈在這兩個人工智慧巨頭之間,Google推出了自己的人工智慧聊天機器人 Gemini 版本,其功能與 GPT-4o 類似。