人工智能研究者Francois Chollet聯(lián)合創(chuàng)立的非營利組織Arc Prize Foundation推出了一項新的挑戰(zhàn)性測試,旨在評估頂尖AI模型的通用智能水平。這項名為ARC-AGI-2的測試目前難倒了大多數(shù)模型,人類表現(xiàn)遠(yuǎn)超AI。測試要求AI識別視覺模式并生成正確答案,同時引入效率指標(biāo),評估AI獲取和應(yīng)用新技能的能力。
本文深入探討了一個普遍的誤解:人工通用智能(AGI)最終會演變成一個龐大的統(tǒng)一系統(tǒng)。作者認(rèn)為,基于當(dāng)前AI發(fā)展態(tài)勢,更可能出現(xiàn)多個獨立但相互關(guān)聯(lián)的AGI系統(tǒng)。文章分析了AGI之間可能的競爭與合作關(guān)系,以及這種分布式發(fā)展模式對人類社會的潛在影響。
OpenAI 的 AI 推理研究主管 Noam Brown 表示,如果研究人員早知道正確方法和算法,類似 OpenAI 的 o1 這樣的"推理"AI 模型本可以在 20 年前就出現(xiàn)。Brown 強調(diào)了測試時推理技術(shù)的重要性,同時指出預(yù)訓(xùn)練仍然重要。他還討論了學(xué)術(shù)界與前沿實驗室合作的機會,以及 AI 基準(zhǔn)測試的改進空間。
SEARCH-R1 是一項創(chuàng)新技術(shù),通過強化學(xué)習(xí)方法訓(xùn)練大語言模型生成搜索查詢,并將搜索引擎檢索無縫集成到推理過程中。這項技術(shù)突破了傳統(tǒng) RAG 和工具使用方法的局限性,使模型能夠在推理過程中動態(tài)獲取和利用最新的外部信息,為企業(yè)應(yīng)用提供了更智能、更可靠的 AI 解決方案。
Nvidia CEO黃仁勛在GTC 2025大會上發(fā)表重要演講,展示了公司在AI計算、推理能力和機器人技術(shù)等領(lǐng)域的最新進展。重點包括Blackwell平臺性能提升40倍、開源AI工廠操作系統(tǒng)Dynamo、Rubin架構(gòu)路線圖、開源人形機器人模型Groot N1,以及與通用汽車在自動駕駛領(lǐng)域的合作。這些舉措顯示了Nvidia從GPU制造商向全方位AI基礎(chǔ)設(shè)施公司的戰(zhàn)略轉(zhuǎn)型。
全球支付巨頭 Visa 正在利用人工智能技術(shù)提升其業(yè)務(wù)運營。通過部署檢索增強生成 (RAG) 系統(tǒng),Visa 大幅提高了信息檢索速度和準(zhǔn)確性。同時,Visa 還開發(fā)了安全的內(nèi)部 AI 模型,并利用深度學(xué)習(xí)來加強欺詐防范。這些 AI 應(yīng)用都建立在 Visa 精心構(gòu)建的多層技術(shù)架構(gòu)之上,旨在平衡創(chuàng)新與風(fēng)險管理。
AI 語音克隆技術(shù)的濫用正日益成為企業(yè)面臨的重大安全威脅。近期多起高調(diào)事件顯示,不法分子利用 AI 生成的虛假音頻視頻進行詐騙。目前許多語音克隆應(yīng)用缺乏有效防護措施,企業(yè)領(lǐng)導(dǎo)人的公開音頻很容易被用于克隆。專家呼吁采取多因素認(rèn)證等措施加強防范,并預(yù)計未來將出臺更多監(jiān)管措施和檢測技術(shù)來應(yīng)對這一威脅。
Google 推出了 Gemini 2.0 模型的一系列改進,包括為免費用戶開放高級功能。用戶可以使用改進的深度研究功能獲取詳細(xì)信息,新的推理模型還能分析搜索歷史以更好地了解用戶。Google 強調(diào)這些功能需要用戶選擇加入,并可隨時禁用。此外,Google 還為免費賬戶推出了 Gems 功能,允許用戶創(chuàng)建自定義聊天機器人。
Google 宣布其 Gemini AI 的深度研究功能現(xiàn)已向所有用戶免費開放,支持 45 種以上語言。該功能可生成復(fù)雜主題的綜合報告。Google 還推出了基于個人化的實驗性功能,可根據(jù)用戶的 Google 應(yīng)用和服務(wù)使用情況來定制回應(yīng)。這些升級旨在提升 Gemini 的研究能力和個性化體驗。
研究人員提出了一種名為長度控制策略優(yōu)化(LCPO)的訓(xùn)練技術(shù),可以讓開發(fā)者更好地控制大語言模型的思維鏈長度。這種方法通過在訓(xùn)練過程中引入長度約束,使模型能夠在保持準(zhǔn)確性的同時生成更簡潔的推理過程。實驗表明,采用LCPO訓(xùn)練的模型在準(zhǔn)確性和成本之間提供了平滑的權(quán)衡,并且在相同推理長度下可以超越更大的模型。這項技術(shù)有望大幅降低企業(yè)應(yīng)用中推理的成本。
人工通用智能(AGI)是AI發(fā)展的終極目標(biāo),但實現(xiàn)這一目標(biāo)面臨諸多挑戰(zhàn)。本文探討了實現(xiàn)AGI的五大關(guān)鍵障礙:常識與直覺的缺乏、學(xué)習(xí)遷移能力不足、物理與數(shù)字世界的鴻溝、可擴展性難題,以及社會信任問題?朔@些挑戰(zhàn)需要突破性技術(shù)進展、大規(guī)模投資和廣泛的社會變革。
人工智能領(lǐng)域投資熱潮與互聯(lián)網(wǎng)泡沫有相似之處,但也存在不同?萍季揞^大舉投資AI,投資者面臨重大抉擇。有人認(rèn)為這是新時代的開端,也有人警告可能是泡沫。專家意見不一,有人看好AI前景,也有人對高估值和風(fēng)險表示擔(dān)憂。關(guān)鍵在于AI能否帶來實質(zhì)性變革,以及哪些公司能在這場變革中生存下來。
OpenAI 正在推出一套新的 API 和工具,旨在幫助開發(fā)者和企業(yè)更高效地構(gòu)建基于 AI 的代理,這些代理基于 OpenAI 自家首個 AI 代理 Deep Research 和 Operator 的技術(shù)。Deep Research 獨立搜索互聯(lián)網(wǎng),生成豐富、組織良好且有引用的報告,而 Operator 則根據(jù)用戶的文本指令自主控制網(wǎng)頁瀏覽器光標(biāo)并執(zhí)行諸如查找體育票或進行預(yù)訂等操作。
SambaNova Systems 推出新的 AI 深度研究框架,可生成深度報告的速度提高 3 倍,成本大幅降低。該框架與 CrewAI 合作開發(fā),支持企業(yè)分析私密數(shù)據(jù),使用開源大語言模型和 SambaNova 的 AI 加速器,無需依賴 Nvidia GPU。新框架包含智能路由系統(tǒng),可根據(jù)需求選擇最合適的智能體,提供從基礎(chǔ)搜索到深度財務(wù)分析的全方位研究能力。
人工智能正在重塑商業(yè)、工作和日常生活。新突破如生成式語言模型和推理能力加速了AI的應(yīng)用。本文列舉了15個重要統(tǒng)計數(shù)據(jù),揭示了當(dāng)前AI革命的真實影響,涵蓋了AI圖像生成、社交媒體、深度偽造、投資規(guī)模、市場前景、企業(yè)應(yīng)用、醫(yī)療保健、信任度差異等多個方面,展現(xiàn)了AI技術(shù)的巨大潛力和面臨的挑戰(zhàn)。
本周在巴塞羅那的移動世界大會上,一款聲稱預(yù)示著智能手機未來 AI 的新奇移動操作系統(tǒng)亮相。
Hugging Face 的聯(lián)合創(chuàng)始人兼首席科學(xué)官 Thomas Wolf 表示,當(dāng)前 AI 發(fā)展范式無法產(chǎn)生具有創(chuàng)造性問題解決能力的 AI。他認(rèn)為,AI 目前主要是填補人類已知之間的空白,而非通過連接不相關(guān)事實來產(chǎn)生新知識。Wolf 呼吁 AI 行業(yè)轉(zhuǎn)向能夠衡量 AI 提出非常規(guī)問題和開辟新研究路徑能力的評估方法。
領(lǐng)先的 AI 公司正在采用"蒸餾"技術(shù),以創(chuàng)造更便宜、更易采用的 AI 模型。這種技術(shù)在 DeepSeek 成功應(yīng)用后引起廣泛關(guān)注,引發(fā)了硅谷 AI 領(lǐng)導(dǎo)地位的動搖。蒸餾技術(shù)通過將大型語言模型的知識轉(zhuǎn)移到小型模型中,實現(xiàn)了高效且經(jīng)濟的 AI 應(yīng)用。這一突破為初創(chuàng)公司和開發(fā)者提供了更多機會,同時也對現(xiàn)有 AI 公司的商業(yè)模式構(gòu)成了挑戰(zhàn)。
物理人工智能代表了人工智能從純數(shù)字系統(tǒng)向能夠與現(xiàn)實世界互動的智能機器的演變。與僅依賴軟件的人工智能不同,物理人工智能將算法與傳感器和執(zhí)行器結(jié)合在機器人、車輛和設(shè)備中,使它們能夠感知周圍環(huán)境并實時做出決策。這些系統(tǒng)能夠自主運行,適應(yīng)不斷變化的環(huán)境,而不是遵循固定的編程。
Google聯(lián)合創(chuàng)始人謝爾蓋·布林重返公司,呼吁員工每周工作60小時,以贏得人工智能競賽。他認(rèn)為Google有望實現(xiàn)通用人工智能(AGI)突破,但需要員工全身心投入。這一呼吁引發(fā)了對工作效率和AI發(fā)展前景的討論,同時也反映了科技巨頭在AI競爭中的緊迫感。