xAI 公司發(fā)布了新一代大語言模型 Grok-3,具備模擬人類思維的推理能力。該模型比前代產(chǎn)品計算能力提升 10-15 倍,可在數(shù)學、科學和編程領域超越競爭對手。Grok-3 包含大型復雜模型和小型快速模型,能進行逐步推理并提供深度搜索功能。未來還將推出語音交互模式。
2023年和2024年,不少初創(chuàng)公司都推出了令人印象深刻的AI服務,但很快就被微軟和谷歌等能夠直接觸達客戶的巨頭所覆蓋。以Jasper.ai為例,這是一款曾經(jīng)備受推崇、用于編寫文本的AI工具。
上海AI實驗室的研究團隊創(chuàng)新性地設計了元動作思考范式來引導模型的搜索空間,使模型更高效地習得和產(chǎn)生多樣化的推理策略組合;基于通專融合的方式進行數(shù)據(jù)合成,并通過構(gòu)建大規(guī)模沙盒環(huán)境獲取反饋,在不依賴o1這類已有強推理模型的情況下,實現(xiàn)高質(zhì)量思維鏈的獨立構(gòu)建,并大幅提升模型的復雜任務處理性能。
Llama3.1 版本模型提供了更好的推理能力、更大的 128K token 上下文窗口,并改進了對8種語言的支持。