開放式 AI 緊急融資

隨著 DeepSeek 發揮影響力,矽谷實在太令人興奮了。

昨天,OpenAI 和 Anthropic 還在領跑,千方百計想絆倒競爭對手。一夜之間,基礎建設廠商突然變得「真的很有興趣」。

繼 Microsoft 之後,NVIDIA 與 AWS 也加快推出 DeepSeek 模型託管服務。

正如一位使用者在 NVIDIA 官方 Twitter 帳號上所評論的:「如果你無法打敗他們,那就加入他們吧」。

讓我們逐一看看這些動作。

首先是一些新消息:OpenAI 的最新回應於今日公佈:募款、募款、募款。

華爾街日報》爆料稱 OpenAI 以 3,000 億美元的估值尋求新一輪 $400 億美元(約 2,875 億人民幣)的融資。 -

這將打破 OpenAI 所保持的矽谷最高單輪融資記錄。

本輪融資由軟銀 (SoftBank) 領投。之前的消息顯示,軟銀計劃投資高達 $25 億元 (約 1797 億元)入股 OpenAI。

而這距離 OpenAI 以 $1,570 億美元的估值募資 $6 億美元僅僅四個月。

短短幾個月,估值又翻了一倍,也印證了市場的傳言:OpenAI 對上一輪的融資並不滿意。

而現在,OpenAI 可能真的有點走投無路了:

另一個消息是 o3 將於當地時間週五發佈。

但 AI 應用方面的情況則有點不同。

例如,深受程式設計師喜愛的 Cursor 已經公開採用新模式,號召大家一起測試,看看真正的成果。

只有處於中間的模型廠商,才會在風中感到慌亂。對於雲端服務和應用程式,先支援它們全部才是正道 (doge)。

如需詳細資訊,請繼續閒聊。

週五與 Open AI 見面 o3

根據洩露的消息,OpenAI 籌款的目的之一是履行對星門計畫的承諾。

該專案由 OpenAI 和軟銀(SoftBank)領導,Arm、微軟、英偉達(NVIDIA)和甲骨文(Oracle)為主要技術合作夥伴。目標是在未來四年內投資 $5000 億美元(約 3.64 兆元人民幣),在美國建立多個 AI 數據中心。

OpenAI 的承諾是$1000 億。

官方公告透露了一些細節:

Stargate Project 是一家新公司,計劃在未來四年內投資 $5000 億美元,為美國 OpenAI 建立新的 AI 基礎設施。我們將馬上投資 $1000 億。

該專案的初始股本資金提供者包括 SoftBank、OpenAI、Oracle 以及中東 AI 基金 MGX。SoftBank 和 OpenAI 是該專案的主要合作夥伴,SoftBank 負責財務,OpenAI 負責營運。Masayoshi Son 將擔任主席。

Arm、Microsoft、NVIDIA、Oracle 和 OpenAI 是初期的主要技術合作夥伴。目前施工正在進行中,從德州開始,我們正在評估全國各地的潛在地點,以興建更多校園,同時敲定協議。

作為 Stargate 計畫的一部分,Oracle、NVIDIA 與 OpenAI 將密切合作,共同建置並運作該運算系統。這建立在 OpenAI 與 NVIDIA 自 2016 年以來的深度合作,以及 OpenAI 與 Oracle 的新合作之上。

這也是建基於 OpenAI 與微軟的現有關係。OpenAI 將繼續增加 Azure 的使用量,因為 OpenAI 將繼續與 Microsoft 合作,利用額外的運算能力來訓練領先的模型,並提供卓越的產品和服務。

此外,這筆錢也將被 OpenAI 用來彌補虧損。儘管在 2024 年 8 月,OpenAI 的單月營收已達 3 億美元,較 2023 年初增加 1700%,但到了 10 月,OpenAI 預計全年將虧損 50 億美元。

隨著融資的消息,o3 的最新排程也一併公布。

OpenAI 全球首席事務官 Chris Lehane 在接受 NPR 訪問時透露:

o3 將於本週五發佈。

消息一出,網友小馬就做好了準備。

不過,有些網友指出,他所指的「o3」仍是 o3-mini,而 Altman 本人也早已宣布推出此機型。

畢竟,儘管爭議重重,DeepSeek 在大洋彼岸還是引發了更多的討論和讚譽

DeepSeek 真的很棒

在微軟指點江山之後,立即將自己的人工智能平台與 DeepSeek 模型連接起來。今天,深受程式設計師喜愛的 Cursor 也宣佈了最新消息:

DeepSeek 模型現在可在 Cursor 上使用。

值得注意的是,Cursor 提到在實際的編程任務中,Sonnet 3.5 仍然優於 DeepSeek 的新機型。

但是,光標官方並沒有舉出具體的例子,這引起了旁觀者的好奇:

看來是時候用實際測量來說話了。如果您已經有機會試用,不妨在評論區與我們分享您的經驗。

同樣地,大嘴巴的 Anthropic,其後盾 AWS 也率先採用 DeepSeek 模型,完全沒有因為爭議而猶豫不決(doge)。

另一家引起更多關注的公司是 NVIDIA,其股價確實受到 DeepSeek- 的提振。

DeepSeek-R1 已在 NVIDIA NIM 平台上推出。NVIDIA 也對此大肆宣傳:

DeepSeek-R1 是一個具有最先進推理能力的開放源碼模型。DeepSeek-R1 之類的推理模型不會直接給出答案,而是透過思考鏈、共識和搜尋方法,對查詢進行推理,以產生最佳答案。

DeepSeek-R1 是 Scaling Law 在測試中的完美範例,證明了為什麼加速運算對於代理 AI 的推理需求是不可或缺的。

NVIDIA 表示,DeepSeek-R1 NIM 微服務每秒可在單一 NVIDIA HGX H200 系統上提供 3,872 個代用幣。

而針對 Anthropic 及其他公司面對 DeepSeek 競爭時的反應冷淡,也有越來越多不同的聲音出現。

例如,HuggingFace 的共同創辦人 Thomas Wolf 直接提出批評:

老實說,Dario 的文章讀起來非常痛苦。

他在短文中寫道:

比較開放原始碼研究與含糊不清的封閉式研究和未公開的評估,讓我對 Anthropic 的領先地位沒有以前那麼有信心了。

更重要的是,隨著 Open-R1 和 DeepSeek 論文的發展,來自世界各地的團隊將在未來幾個月發布開源推理模型。例如,今天,Allen Institute 和 Mistral 分別發布了 Tülu 和 Small3,趕上 DeepSeek-V3 的腳步。

開放原始碼對我們的安全將變得越來越重要。

您覺得如何?

類似職位

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *