谷歌發(fā)布最新人工智能模型Gemini 聲稱性能超越GPT-4和人類專家

張夢然發(fā)布時(shí)間：2023-12-11 09:41:00來源：科技日報(bào)

　　科技日報(bào)北京12月7日電 (記者張夢然)谷歌公司6日宣布推出一種名為Gemini的新人工智能模型，聲稱該模型在一系列智力測試中的表現(xiàn)優(yōu)于OpenAI的GPT-4模型和“專家級(jí)”人類。

　　Gemini已針對不同的應(yīng)用創(chuàng)建了3個(gè)版本，分別是Nano、Pro和Ultra。谷歌拒絕回答有關(guān)Pro和Ultra的規(guī)模、它們包含的參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)的規(guī)?；騺碓吹葐栴}。

　　其最小版本Nano旨在在智能手機(jī)上運(yùn)行，實(shí)際上有兩種模型：一種用于速度較慢的手機(jī)，擁有18億個(gè)參數(shù)；另一種用于功能更強(qiáng)大的手機(jī)，擁有32.5億個(gè)參數(shù)。

　　谷歌聲稱，Gemini的中檔Pro版本擊敗了其他一些模型，但更強(qiáng)大的Ultra超過了所有現(xiàn)有AI模型的能力。它在行業(yè)標(biāo)準(zhǔn)MMLU基準(zhǔn)上的得分為90%，而“專家級(jí)”的人類預(yù)計(jì)能達(dá)到89.8%。

　　這是人工智能首次在測試中擊敗人類，也是現(xiàn)有模型中得分最高的。該測試涉及一系列棘手的問題，包括邏輯謬誤、日常道德問題、醫(yī)療問題、經(jīng)濟(jì)和地理。

　　在同一測試中，GPT-4的得分為87%，LLAMA-2的得分為68%，Anthropic Claude 2的得分為78.5%。Gemini在其他9項(xiàng)常見基準(zhǔn)測試中的8項(xiàng)中擊敗了所有這些模型。

　　去年，谷歌“深度思維”發(fā)布的AlphaCode可擊敗50%的人類開發(fā)人員，而新發(fā)布的Gemini聲稱可擊敗85%的人類編程師。

　　谷歌“深度思維”的艾力·柯林斯表示，Gemini“幾乎在每個(gè)領(lǐng)域都是最先進(jìn)的”。

　　【總編輯圈點(diǎn)】

　　Gemini目前沒有可供測試的版本，但谷歌卻演示了它兩種很“實(shí)際”的功能——解決家庭作業(yè)問題、處理實(shí)時(shí)視頻能力。這不禁讓“特定人群”驚呼：我現(xiàn)在就需要它！而對業(yè)內(nèi)人士來說，這個(gè)AI更值得注意之處，是它不僅能力最強(qiáng)，還最通用，這意味著其可以適應(yīng)各種任務(wù)。與當(dāng)前許多專注于文本的模型不同，Gemini接受過文本、圖像和聲音方面的綜合訓(xùn)練，能接受所有這些格式的輸入然后再輸出，甚至，它還比所有“前輩”模型們更擅長搞開發(fā)。

（責(zé)編：王東）

版權(quán)聲明：凡注明“來源：中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品，版權(quán)歸高原（北京）文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用，須注明來源中國西藏網(wǎng)和署著作者名，否則將追究相關(guān)法律責(zé)任。

第四色五月天乱伦,国产2021中文天码字幕,久久国产美女免费观看精品,免费一级a一片高清免费,国产精品线在线精品,亚洲黄色网站www.,国产精品熟女视频二区2021

谷歌發(fā)布最新人工智能模型Gemini 聲稱性能超越GPT-4和人類專家

相關(guān)閱讀

專題推薦

微觀

賞閱

資料云

即時(shí)新聞