谷歌發(fā)布最新人工智能模型Gemini 聲稱性能超越GPT-4和人類(lèi)專(zhuān)家
科技日?qǐng)?bào)北京12月7日電 (記者張夢(mèng)然)谷歌公司6日宣布推出一種名為Gemini的新人工智能模型,聲稱該模型在一系列智力測(cè)試中的表現(xiàn)優(yōu)于OpenAI的GPT-4模型和“專(zhuān)家級(jí)”人類(lèi)。
Gemini已針對(duì)不同的應(yīng)用創(chuàng)建了3個(gè)版本,分別是Nano、Pro和Ultra。谷歌拒絕回答有關(guān)Pro和Ultra的規(guī)模、它們包含的參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)的規(guī)模或來(lái)源等問(wèn)題。
其最小版本Nano旨在在智能手機(jī)上運(yùn)行,實(shí)際上有兩種模型:一種用于速度較慢的手機(jī),擁有18億個(gè)參數(shù);另一種用于功能更強(qiáng)大的手機(jī),擁有32.5億個(gè)參數(shù)。
谷歌聲稱,Gemini的中檔Pro版本擊敗了其他一些模型,但更強(qiáng)大的Ultra超過(guò)了所有現(xiàn)有AI模型的能力。它在行業(yè)標(biāo)準(zhǔn)MMLU基準(zhǔn)上的得分為90%,而“專(zhuān)家級(jí)”的人類(lèi)預(yù)計(jì)能達(dá)到89.8%。
這是人工智能首次在測(cè)試中擊敗人類(lèi),也是現(xiàn)有模型中得分最高的。該測(cè)試涉及一系列棘手的問(wèn)題,包括邏輯謬誤、日常道德問(wèn)題、醫(yī)療問(wèn)題、經(jīng)濟(jì)和地理。
在同一測(cè)試中,GPT-4的得分為87%,LLAMA-2的得分為68%,Anthropic Claude 2的得分為78.5%。Gemini在其他9項(xiàng)常見(jiàn)基準(zhǔn)測(cè)試中的8項(xiàng)中擊敗了所有這些模型。
去年,谷歌“深度思維”發(fā)布的AlphaCode可擊敗50%的人類(lèi)開(kāi)發(fā)人員,而新發(fā)布的Gemini聲稱可擊敗85%的人類(lèi)編程師。
谷歌“深度思維”的艾力·柯林斯表示,Gemini“幾乎在每個(gè)領(lǐng)域都是最先進(jìn)的”。
【總編輯圈點(diǎn)】
Gemini目前沒(méi)有可供測(cè)試的版本,但谷歌卻演示了它兩種很“實(shí)際”的功能——解決家庭作業(yè)問(wèn)題、處理實(shí)時(shí)視頻能力。這不禁讓“特定人群”驚呼:我現(xiàn)在就需要它!而對(duì)業(yè)內(nèi)人士來(lái)說(shuō),這個(gè)AI更值得注意之處,是它不僅能力最強(qiáng),還最通用,這意味著其可以適應(yīng)各種任務(wù)。與當(dāng)前許多專(zhuān)注于文本的模型不同,Gemini接受過(guò)文本、圖像和聲音方面的綜合訓(xùn)練,能接受所有這些格式的輸入然后再輸出,甚至,它還比所有“前輩”模型們更擅長(zhǎng)搞開(kāi)發(fā)。
版權(quán)聲明:凡注明“來(lái)源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來(lái)源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 相控陣?yán)走_(dá):“蜻蜓之眼”觀八方
- “暴風(fēng)”戰(zhàn)機(jī)項(xiàng)目能否迎來(lái)“新伙伴”
- 翻炒“中國(guó)威脅論”對(duì)美國(guó)沒(méi)好處
- 俄羅斯總統(tǒng)普京與伊朗總統(tǒng)萊希舉行會(huì)談
- 德國(guó)各界:歐中合作為世界注入更多穩(wěn)定力量
- 特朗普就民事欺詐案在紐約出庭 稱“絕對(duì)沒(méi)做錯(cuò)任何事”
- 港媒:為“遏制中國(guó)”,美西方顛覆國(guó)際法和國(guó)際準(zhǔn)則
- 烏拉圭共和國(guó)大學(xué)校長(zhǎng):現(xiàn)在是烏中兩國(guó)校際間合作加強(qiáng)、加深的時(shí)代
- 首爾中國(guó)文化中心舉辦“品味中國(guó)”中餐體驗(yàn)教學(xué)活動(dòng)
- “深化合作符合各方共同利益”