傳統(tǒng)數(shù)據(jù)中心基礎(chǔ)設(shè)施雖然對企業(yè)至關(guān)重要,但也是預(yù)算和房地產(chǎn)的重大負(fù)擔(dān)。模塊化數(shù)據(jù)中心正成為強有力的替代方案,解決企業(yè)面臨的運營、財務(wù)和環(huán)境復(fù)雜性問題。這種模塊化方法在印度日益流行,有助于解決環(huán)境問題、滿足人工智能的電力需求、降低成本并支持新一代分布式應(yīng)用。相比傳統(tǒng)建設(shè)需要數(shù)年時間,工廠預(yù)制的模塊化數(shù)據(jù)中心基礎(chǔ)設(shè)施可在數(shù)周內(nèi)部署完成。
AI項目從試點轉(zhuǎn)向生產(chǎn)階段時,企業(yè)面臨意外的云成本激增問題。推理工作負(fù)載需要全天候運行以確保服務(wù)正常,成本可能一夜間飆升1000%以上。許多公司每月費用從5000美元激增至50000美元。為控制成本,企業(yè)開始采用混合架構(gòu):將推理工作負(fù)載遷移至本地或托管設(shè)施,訓(xùn)練任務(wù)保留在云端。這種模式可削減60-80%的基礎(chǔ)設(shè)施支出,在保持性能的同時實現(xiàn)成本可預(yù)測性。
企業(yè)在AI模型選擇上面臨開放源碼與封閉專有技術(shù)的抉擇,這一選擇對財務(wù)和定制化都有重要影響。開放模型如Meta Llama提供更大控制權(quán)和定制選項,而封閉模型如OpenAI GPT-4o提供簡化使用和企業(yè)級支持。專家建議采用投資組合策略,根據(jù)準(zhǔn)確性、延遲、成本、安全性等因素選擇合適模型,而非單一選擇。
凱捷研究院調(diào)研顯示,盡管AI在自動化重復(fù)性業(yè)務(wù)任務(wù)方面帶來顯著成本節(jié)約,但應(yīng)用場景相對簡單。調(diào)研涵蓋1607名來自年收入超10億美元企業(yè)的高管,發(fā)現(xiàn)AI可降低客戶運營成本40%、人員運營成本26%。然而,四分之三的高管仍偏好專有AI模型,其中43%選擇超大規(guī)模云服務(wù)商產(chǎn)品。盡管開源模型如DeepSeek能實現(xiàn)11倍計算成本降低,企業(yè)領(lǐng)導(dǎo)者仍因技術(shù)專業(yè)性要求、安全風(fēng)險和社區(qū)支持等因素,對開源AI方案保持謹(jǐn)慎態(tài)度。
通用汽車推出的鋰錳富含電池(LMR)在降低成本的同時保證續(xù)航,預(yù)計2028年量產(chǎn),將顯著減少對鎳和鈷的依賴。
本文對比分析了 OpenAI 的 GPT-4o 與 Anthropic 的 Claude 3.5 Sonnet 分詞方式的差異,揭示其在企業(yè)應(yīng)用中隱藏的額外費用問題。
NASA人員分析團(tuán)隊因成本考慮,從使用十年之Neo4j轉(zhuǎn)向Memgraph,提升了實時數(shù)據(jù)分析和Python集成效率,并支持智能查詢系統(tǒng)應(yīng)對預(yù)算緊縮。
波士頓咨詢集團(tuán)調(diào)研顯示,近60%CIO認(rèn)為經(jīng)濟衰退可能已來臨或正在發(fā)生。在關(guān)稅沖擊與經(jīng)濟放緩壓力下,他們正在縮減IT預(yù)算、延緩非必要項目,并加大對AI和自動化的投入,同時調(diào)整全球采購策略以應(yīng)對風(fēng)險。
SAP公布財報顯示,盡管營收略低于預(yù)期,其營業(yè)利潤大幅超預(yù)期,同時云收入顯著提升,并維持全年指引,成本管控與新客戶拓展為增長奠定堅實基礎(chǔ)。
OpenAI 推出了 GPT-4.1 系列,專注提升編程效率、擴展長文本處理能力與指令執(zhí)行準(zhǔn)確性,同時大幅降低成本,為企業(yè)和開發(fā)者提供更靈活的 AI 工具。
微軟公司reportedly縮減了多個數(shù)據(jù)中心項目,這一決定發(fā)生在其宣布投資800億美元建設(shè)AI數(shù)據(jù)中心三個月后。報道稱,微軟暫;蛲七t了在澳大利亞、印度尼西亞、英國和美國多個州的項目。微軟表示這反映了其戰(zhàn)略的靈活性,但也可能與AI開發(fā)成本下降和新興低成本模型趨勢有關(guān)。這一舉動引發(fā)了對AI行業(yè)發(fā)展方向的思考。
N2WS 發(fā)布最新備份軟件,支持 AWS、Azure 和 Wasabi 的跨云備份功能。通過云原生、平臺無關(guān)的塊級快照技術(shù),提供高速讀寫訪問能力,并采用按虛擬機收費的定價模式。新版本可降低長期存儲成本,支持 Azure Blob 和 Wasabi S3 直接冷存儲備份。
皇家芭蕾舞團(tuán)和歌劇院技術(shù)交付主管 Keith Nolan 分享了 IT 創(chuàng)新如何支持藝術(shù)表演。從降低成本到改善觀眾體驗,IT 在幕后發(fā)揮著關(guān)鍵作用。疫情期間的數(shù)字化轉(zhuǎn)型、云計算的應(yīng)用以及流媒體技術(shù)的發(fā)展,都為藝術(shù)表演帶來新的可能性。Nolan 強調(diào),通過創(chuàng)新技術(shù)節(jié)省開支,可以將更多資金投入到世界級的演出中。
百度推出兩款新型人工智能模型 ERNIE 4.5 和 ERNIE X1,分別為多模態(tài)語言模型和推理模型。這些模型在多項第三方基準(zhǔn)測試中表現(xiàn)優(yōu)異,超越了 DeepSeek 和 OpenAI 的同類產(chǎn)品,同時大幅降低了使用成本。盡管存在一些限制,如未開源和上下文窗口較小,但百度計劃在未來開源 ERNIE 4.5,并通過 API 和文心一言為用戶提供訪問。
SambaNova Systems 推出新的 AI 深度研究框架,可生成深度報告的速度提高 3 倍,成本大幅降低。該框架與 CrewAI 合作開發(fā),支持企業(yè)分析私密數(shù)據(jù),使用開源大語言模型和 SambaNova 的 AI 加速器,無需依賴 Nvidia GPU。新框架包含智能路由系統(tǒng),可根據(jù)需求選擇最合適的智能體,提供從基礎(chǔ)搜索到深度財務(wù)分析的全方位研究能力。
人工智能應(yīng)用,尤其是生成式AI,正推動企業(yè)云計算成本上升。一項報告顯示,這些成本平均增長了30%。大多數(shù)IT和財務(wù)領(lǐng)導(dǎo)認(rèn)為GenAI導(dǎo)致的云支出已難以控制。專家指出,不加管理的GenAI可能使創(chuàng)新在財務(wù)上不可持續(xù)。然而,AI工具也可以幫助預(yù)測和管理云支出。專家建議采用混合云模式和邊緣計算來控制成本,并根據(jù)組織的云計算發(fā)展階段做出架構(gòu)決策。
Google DeepMind 首席執(zhí)行官 Demis Hassabis 在內(nèi)部會議上回應(yīng)了員工對中國 AI 初創(chuàng)公司 DeepSeek 的擔(dān)憂。他強調(diào) Google 擁有更高效、性能更強的 AI 模型,對公司戰(zhàn)略充滿信心。Hassabis 認(rèn)為 DeepSeek 的成本可能被低估,并可能依賴西方公司的先進(jìn)模型。
DeepSeek于1月推出的R-1 AI模型顯著改變了企業(yè)AI的格局,導(dǎo)致美國科技股市損失超過1萬億美元。該公司聲稱其推理模型在性能上可與OpenAI的o1相媲美,速度是其兩倍,成本僅為10%。盡管模型開發(fā)存在爭議,DeepSeek加速了AI模型的商品化,為CIO提供了更多選擇和更低的內(nèi)部構(gòu)建AI能力的門檻。隨著模型成本下降,企業(yè)在商業(yè)解決方案上將有更大選擇,內(nèi)部開發(fā)應(yīng)用變得更為現(xiàn)實。
Perplexity 通過推出 Deep Research 工具,顛覆了 AI 市場的現(xiàn)狀。該工具能夠在幾分鐘內(nèi)生成全面的研究報告,并以極低的企業(yè)成本向用戶開放先進(jìn)的 AI 能力。Perplexity 的 CEO Aravind Srinivas 強調(diào),知識應(yīng)該是普遍可獲取和有用的,而不是被高昂的訂閱計劃所限制。Deep Research 的推出揭示了 AI 定價的痛苦真相:昂貴的企業(yè)訂閱可能是多余的。Perplexity 提供的服務(wù)在價格上具有競爭力,可能迫使大型 AI 公司重新審視其定價結(jié)構(gòu)。
南澳大學(xué)研究員 Nicolas Riesen 博士正在研發(fā)一種革命性的數(shù)據(jù)存儲技術(shù)。該技術(shù)通過在光學(xué)介質(zhì)上選擇性地改變熒光波段來編碼數(shù)據(jù),有望在 2030 年前將光學(xué)存儲成本降低至現(xiàn)有技術(shù)的十分之一。這種創(chuàng)新方法利用光譜空洞實現(xiàn)多位存儲,類似于多層單元 NAND 閃存,為未來大容量、低成本的歸檔存儲開辟了新的可能性。