开放式人工智能 紧急融资
有了 DeepSeek 的影响,硅谷实在是太令人兴奋了。
昨天,OpenAI 和 Anthropic 还在领跑,想尽一切办法绊倒竞争对手。一夜之间,基础设施供应商突然变得 "非常感兴趣"。
继微软之后,英伟达和 AWS 也加快了 DeepSeek 模型托管服务的推出。

正如一位用户在英伟达官方推特账户上评论的那样:"如果你不能打败他们,那就加入他们吧"。
让我们逐一看看这些动作。
首先是一些新消息:OpenAI 今天宣布了最新的回应:筹款、筹款、筹款。
华尔街日报》爆料称 OpenAI 正在寻求新一轮融资,金额为 100 亿美元(约合 2875 亿元人民币),估值为 3000 亿美元 -
这将打破由 OpenAI 保持的硅谷最高单轮融资纪录。
本轮融资由软银领投。此前有消息称,软银计划投资高达 $25 十亿 (约合人民币 1,797 亿元)投资 OpenAI。
而这距离 OpenAI 以 $1,570 亿美元的估值融资 16 亿美元仅过去了四个月。
短短几个月,估值又翻了一番,这也印证了市场传言:OpenAI 对上一轮融资并不满意。
现在,OpenAI 可能真的有点绝望了:
另一个消息是,o3 将于当地时间周五发布。

但人工智能应用方面的情况则有些不同。
例如,深受程序员喜爱的 Cursor 公司已经公开采用了新模式,并呼吁大家一起测试,以了解实际效果。

只有中间的模式供应商才会在风中飘摇不定。对于云服务和应用来说,首先支持它们才是正确的(doge)。
更多详情,让我们继续聊。
周五与开放式人工智能再见o3
根据泄露的信息,OpenAI 筹资的目的之一是履行对星际之门项目的承诺。
该项目由 OpenAI 和软银牵头,Arm、微软、英伟达和甲骨文为主要技术合作伙伴。目标是在未来四年内投资 $5000 亿美元(约 3.64 万亿元人民币),在美国建设多个人工智能数据中心。
OpenAI 的承诺是$1000亿。

官方公告透露了一些细节:
星际之门项目是一家新公司,计划在未来四年内投资 $5000 亿美元,在美国为 OpenAI 建设新的人工智能基础设施。我们将立即投资 $1000 亿美元。
该项目的初始股权出资方包括软银、OpenAI、甲骨文和中东人工智能基金 MGX。软银和 OpenAI 是该项目的主要合作伙伴,软银负责财务,OpenAI 负责运营。孙正义将担任董事长。
Arm、微软(Microsoft)、英伟达(NVIDIA)、甲骨文(Oracle)和 OpenAI 是初期的主要技术合作伙伴。目前,从德克萨斯州开始的建设正在进行中,我们正在评估全国各地的潜在地点,以便在敲定协议的同时建设更多的园区。
作为 "星际之门 "项目的一部分,甲骨文、英伟达和OpenAI将密切合作,共同构建和运营该计算系统。这建立在OpenAI与英伟达自2016年以来的深度合作,以及OpenAI与甲骨文之间的新合作基础之上。
它还建立在 OpenAI 与微软现有关系的基础上。OpenAI 将继续增加对 Azure 的使用,同时继续与微软合作,利用额外的计算能力来训练领先的模型,并提供卓越的产品和服务。
此外,这笔钱还将被 OpenAI 用来弥补亏损。虽然在 2024 年 8 月,OpenAI 的月营收达到了 3 亿美元,比 2023 年初增长了 1700%,但到了 10 月,OpenAI 预计全年亏损 50 亿美元。
伴随融资消息而来的是 o3 的最新时间表。
OpenAI 全球首席事务官 Chris Lehane 在接受 NPR 采访时透露:
o3 将于周五发布。
消息一出,网民小马扎就做好了准备。
不过,一些网民指出,他所说的 "o3 "仍然是 o3-mini,而 Altman 本人早已宣布推出这一机型。
毕竟,尽管存在争议,DeepSeek 还是在池塘边引发了更多讨论和赞誉
DeepSeek 真不错
微软指点江山之后,立即将其人工智能平台与 DeepSeek 模型联系起来。今天,深受程序员喜爱的光标公司也宣布了最新消息:
DeepSeek 模型现已在 Cursor 上推出。

值得注意的是,Cursor 提到,在实际编程任务中,Sonnet 3.5 仍优于 DeepSeek 的新型号。
不过,光标公司的官员并没有举出具体的例子,这引起了围观者的好奇:
看来是时候用实际测量结果说话了。如果您已经有机会尝试,不妨在评论区与我们分享您的体验。
同样,大嘴巴 Anthropic(其支持者 AWS 也是第一个采用 DeepSeek 模型的公司)也丝毫没有因为争议而犹豫不决(doge)。
英伟达(NVIDIA)是另一家受到更多关注的公司。
DeepSeek-R1 已经可以在英伟达™(NVIDIA®)NIM 平台上使用。英伟达公司也为此大做文章:
DeepSeek-R1 是一个开源模型,具有最先进的推理能力。DeepSeek-R1 等推理模型不会直接给出答案,而是对查询进行推理,通过思维链、共识和搜索方法生成最佳答案。
DeepSeek-R1 是测试中 "扩展法则 "的完美范例,证明了为什么加速计算对代理人工智能的推理需求至关重要。
英伟达™(NVIDIA®)表示,DeepSeek-R1 NIM微服务在单个英伟达™(NVIDIA®)HGX H200系统上每秒可交付3872个代币。
针对 Anthropic 和其他公司面对 DeepSeek 竞争时的无动于衷,也出现了越来越多的不同声音。
例如,HuggingFace 联合创始人托马斯-沃尔夫(Thomas Wolf)就直接提出了批评:
说实话,达里奥的文章读起来非常痛苦。
他在短文中写道
将开源研究与含糊不清的封闭研究和未公开的评估进行比较,让我对人类学的领先地位没有以前那么有信心了。

更重要的是,随着 Open-R1 和 DeepSeek 论文的开发,来自世界各地的团队将在未来几个月内发布开源推理模型。例如,今天艾伦研究所(Allen Institute)和Mistral分别发布了Tülu和Small3,以追赶DeepSeek-V3的脚步。
开放源代码对我们的安全将越来越重要。
你怎么看?