美國人工智能公司OpenAI周一在三藩市舉行線上發布會,宣布推出更快捷及更準確的全新AI模型GPT-4o,這款全新模型新增語音助理能力,利用視覺及語音功能與人類進行逼真的對話,可以毫無延遲地即時回答問題,並可以協助解算寫在紙上的數學問題。這項全新功能AI將開放給所有使用者免費使用。
GPT-4o還能進行文字影像的跨文本互動。OpenAI指新模型具備的國際語言能力將得到改善,並提升速度,而且可以上載影像、音檔及文本進行分析。
OpenAI研究人員在發布會中展示,新功能讓使用者在與ChatGPT進行對話時,可以毫無延遲地獲得即時回答,甚至能在ChatGPT講話時打斷它,這2項逼真對話的特點,在聊天機械人上可謂前所未見。
OpenAI技術總監穆拉蒂指出,這個新模式將於未來數周整合進OpenAI產品中,同時將免費提供給所有用戶使用,而付費用戶則能獲得更大的容量。
穆拉蒂和OpenAI工程師在線上發表會中展示GPT-4o的新功能、問問題挑戰增強版ChatGPT。她進行展示前說:「我們知道這些模式越來越複雜,但我們希望互動體驗更自然、更輕鬆。」
OpenAI在現場展示GPT-4o的新語音功能時,2名OpenAI研究負責人與AI語音模型進行交談。語音助理產生了一個關於愛情和機㭓人的睡前故事,研究人員告訴它要以各種不同的情感和聲音變化說話;另一個示範使用手機的相機功能向AI模型展示數學方程式,然後讓ChatGPT的語音模式引導他們解決該方程式。
在演示過程中,一名研究人員要求人工智能模型讀取他們的面部表情並判斷他們的情緒。ChatGPT 的語音助理評論說,他看起來「快樂、開朗,臉上掛著燦爛的笑容,甚至帶著一絲興奮」。
ChatGPT用充滿活力的女聲說道:「無論發生什麼,看起來你心情都很好,願意分享這些美好氛圍的來源嗎?」
今次OpenAI推出的新款AI模型GPT-4o,是在Google預計周二在開發者大會上宣布與ChatGPT匹敵的AI工具Gemini前,搶先發布,旨在利用GPT-4o鞏固OpenAI在AI科技的領先地位。
資料來源:星島日報