xAI 的最新版本 Grok 能夠處理影像

Grok-1.5V代表了該公司第一代多模態人工智慧模型。

太;博士

  • OpenAI 的競爭對手 xAI 推出了 Grok-1.5V,能夠處理視覺訊息。
  • 它可以將圖表翻譯成 Python 程式碼、用繪圖講述故事、解釋迷因。
  • 它是在 Grok-1.5 發布後不久推出的,在數學和程式設計方面進行了改進。
  • xAI 也發布了一個基準資料集 RealWorldQA。

xAI推出全新人工智慧模式Grok-1.5V

xAI 公司由 Elon Musk 創建,與開放人工智慧,剛剛推出了其首款多模式第一代人工智慧模型 Grok-1.5V。與傳統模型不同的是,後者可以處理文字和複雜的文檔,例如圖表、圖表或照片

多功能人工智慧

根據該公司發布的信息,Grok-1.5V 擁有多種應用可能的。例如,他可以“將組織結構圖翻譯成 Python 程式碼”,根據圖畫寫一個故事,甚至解釋“一個讓你逃脫的模因”。 Grok-1.5V 旨在證明即使是複雜的技術也可以輕鬆使用,它可以幫助您理解任何視覺內容,幸運的是,隨著互聯網的興起,這些內容變得越來越普遍。

這個新模型是在 xAI 推出 Grok-1.5 幾週後推出的。後者專門設計用於在數學和程式設計方面表現出色,同時能夠處理更長的上下文,這使得它能夠查閱更多資源以更好地理解某些查詢。 xAI 宣布其早期測試人員和現有用戶很快就能受益於 Grok-1.5V 的功能,儘管尚未公佈其部署的具體時間表。

重新定義人工智慧標準

除了展示 Grok-1.5V 之外,xAI 還提供了一個新的參考資料集,稱為真實世界品質保證。由700張影像組成,後者“帶有易於驗證的問題和答案”並使評估人工智慧模型的性能成為可能。在對比測試中,xAI 的技術將獲得相對於競爭對手的最高分,例如 OpenAI 的 GPT-4V 或雙子座Google專業版 1.5。如此出色的表現,證實了xAI在人工智慧領域的主導地位。