曝OpenAI大模型新進(jìn)展！將推出多模態(tài)大模型，新項(xiàng)目Gobi籌備中

發(fā)布時(shí)間：2023-09-20 文章來源：本站瀏覽次數(shù)：1718

9月19日音訊，據(jù)The Information報(bào)導(dǎo)，OpenAI意圖趕在谷歌推出多模態(tài)大言語模型Gemini前，發(fā)布其多模態(tài)大言語模型GPT-Vision。然后，OpenAI或許會(huì)推出一個(gè)更強(qiáng)大的多模態(tài)大模型，代號(hào)為Gobi。

本年3月OpenAI發(fā)布的GPT-4現(xiàn)已融入了部分多模態(tài)功用，相較于GPT-3.5只能接受文本輸入，GPT-4還能夠接受圖畫輸入，但該視覺輸入功用并不敞開運(yùn)用。而Gobi與GPT-4不同，Gobi從一開端就是按多模態(tài)模型構(gòu)建的，能夠接受更多類型的信息輸入并做出相應(yīng)的處理。

OpenAI與谷歌將多模態(tài)功用納入大言語模型，能夠?qū)D畫、文字、音頻等不同形式的數(shù)據(jù)整合起來，讓大言語模型更準(zhǔn)確、更全面地處理用戶所給信息，為用戶供給便利。據(jù)The Information報(bào)導(dǎo)，OpenAI與谷歌的多模態(tài)大言語模型之爭(zhēng)，就像AI范疇的蘋果與安卓之爭(zhēng)。這或許預(yù)示著AI大模型范疇未來的開展趨勢(shì)，一起也是OpenAI與谷歌搶占這項(xiàng)新技能的首發(fā)先機(jī)，提高用戶影響力和技能引領(lǐng)地位的重要比賽。

一、Gobi VS Gemini，OpenAI與谷歌多模態(tài)大言語模型賽跑

此前有報(bào)導(dǎo)稱，谷歌即將推出Gemini，而且現(xiàn)已向一小批外部公司共享了這個(gè)項(xiàng)目。但據(jù)知情人士泄漏，OpenAI正在爭(zhēng)分奪秒地把公司先進(jìn)的GPT-4與多模態(tài)功用相結(jié)合，想要搶在谷歌之前發(fā)布Gobi。而且，OpenAI在本年3月發(fā)布GPT-4時(shí)，就對(duì)GPT-4中融入的多模態(tài)功用進(jìn)行了預(yù)展現(xiàn)。不過，依據(jù)The Information報(bào)導(dǎo)，OpenAI還沒有開端訓(xùn)練Gobi，因此現(xiàn)在還不知道Gobi終究能否成為GPT-5。

關(guān)于OpenAI能否在多模態(tài)大言語模型方面超越谷歌，據(jù)The Information報(bào)導(dǎo)，目前，谷歌具有來自谷歌搜索引擎和YouTube等平臺(tái)的文本、圖畫、音頻、視頻等專有數(shù)據(jù)，這是谷歌相較于OpenAI開展多模態(tài)大言語模型的一項(xiàng)特別優(yōu)勢(shì)。而且一位運(yùn)用過Gemini前期版本的人士說，與現(xiàn)有的各種大言語模型相比，Gemini產(chǎn)生的過錯(cuò)答案似乎更少。

二、多模態(tài)功用肩負(fù)重任，被亂用的信息安全問題值得注重

在3月發(fā)布GPT-4預(yù)覽多模態(tài)功用時(shí)，除了為盲人或低視力者開發(fā)技能的Be My Eyes公司，OpenAI沒有給其它公司供給多模態(tài)功用。到現(xiàn)在，OpenAI才預(yù)備在更大范圍內(nèi)推出被稱為GPT-Vision的功用。據(jù)The Information報(bào)導(dǎo)，OpenAI或許會(huì)在GPT-Vision之后再推出Gobi。

依據(jù)The Information報(bào)導(dǎo)，OpenAI之所以消耗很多時(shí)刻來推出Gobi，主要是憂慮新的視覺功用會(huì)被壞人利用，例如經(jīng)過自動(dòng)解決驗(yàn)證碼來冒充人類，或許經(jīng)過人臉辨認(rèn)追尋人們。但現(xiàn)在，OpenAI的工程師們似乎想到辦法來緩解這個(gè)安全問題了。

谷歌的Gemini也面臨相同的問題，當(dāng)谷歌被問到采取了哪些辦法防止Gemini被亂用時(shí)，谷歌的一位講話人稱，谷歌在7月份做出過一系列承諾，以確保對(duì)其所有產(chǎn)品進(jìn)行負(fù)責(zé)任的AI開發(fā)。

結(jié)語：多模態(tài)大模型之爭(zhēng)或成下個(gè)AIGC焦點(diǎn)

多模態(tài)功用正被不斷融入大言語模型，以提巨大言語模型剖析的精準(zhǔn)度。如今，因ChatGPT名聲大噪的OpenAI與AI老牌公司谷歌都致力于開發(fā)多模態(tài)大言語模型，可見其或許將成為AI大模型開展的未來趨勢(shì)。

據(jù)The Information報(bào)導(dǎo)，這場(chǎng)OpenAI與谷歌的比賽類似于AI版的蘋果與安卓之爭(zhēng)，而未來Gobi與Gemini的到來，將提醒OpenAI和谷歌的比賽成果。

多模態(tài)大模型作為當(dāng)時(shí)AI大模型范疇的新進(jìn)展，OpenAI與谷歌之間的多模態(tài)大模型之爭(zhēng)不僅是科技競(jìng)爭(zhēng)的焦點(diǎn)，也或許引發(fā)全球范圍內(nèi)關(guān)于技能應(yīng)用、協(xié)作、監(jiān)管和道德等方面的重要評(píng)論。

上一條：波蘭一公司延聘人工智能機(jī)...

下一條：Trickle：使用GP...

曝OpenAI大模型新進(jìn)展！將推出多模態(tài)大模型，新項(xiàng)目Gobi籌備中

曝OpenAI大模型新進(jìn)展！將推出多模態(tài)大模型，新項(xiàng)目Gobi籌備中