OpenAI 聲稱其免費的 GPT-4o 模型可以像人類一樣說話、笑、唱歌和看東西！

該公司還提供 ChatGPT 桌面應用程式。

太;博士

OpenAI 推出了新的人工智慧模型 GPT-4o。
此模板接受文字、音訊和圖像作為輸入。
他在談話中幾乎可以立即識別情緒並做出反應。
GPT-4o 將向所有人開放，包括免費用戶聊天GPT。

公司開放人工智慧週一宣布開發新模型 GPT-4o人工智慧。根據米拉·穆拉蒂OpenAI 的技術長表示，這個複雜的模型代表著向「更自然」的人機互動邁出了一大步。

令人印象深刻的多式聯運能力

GPT-4o 比其前身使用起來更加直觀，能夠處理文字、音訊和圖像輸入的組合，並產生所有三種格式的輸出。與舊的 GPT-3.5 和 GPT-4 模型相比，這是一個重大改進，舊的 GPT-3.5 和 GPT-4 模型將語音轉錄為文本，從而忽略了語氣和情感並減慢了交互速度。

GPT-4o 驚人的情緒辨識能力在現場演示中得到了證明。該模型在各種情況下進行了測試：從英語到義大利語的即時翻譯、求解線性方程，甚至指導深呼吸。

向 GPT-4o 打個招呼，這是我們的新旗艦模型，它可以即時跨音訊、視覺和文字進行推理：https://t.co/MYHZB79UqN
今天在 API 和 ChatGPT 中推出文字和圖像輸入，並在未來幾週內推出語音和視訊。pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI)2024 年 5 月 13 日