开放式人工智能 紧急融资

有了 DeepSeek 的影响,硅谷实在是太令人兴奋了。

昨天,OpenAI 和 Anthropic 还在领跑,想尽一切办法绊倒竞争对手。一夜之间,基础设施供应商突然变得 "非常感兴趣"。

继微软之后,英伟达和 AWS 也加快了 DeepSeek 模型托管服务的推出。

正如一位用户在英伟达官方推特账户上评论的那样:"如果你不能打败他们,那就加入他们吧"。

让我们逐一看看这些动作。

首先是一些新消息:OpenAI 今天宣布了最新的回应:筹款、筹款、筹款。

华尔街日报》爆料称 OpenAI 正在寻求新一轮融资,金额为 100 亿美元(约合 2875 亿元人民币),估值为 3000 亿美元 -

这将打破由 OpenAI 保持的硅谷最高单轮融资纪录。

本轮融资由软银领投。此前有消息称,软银计划投资高达 $25 十亿 (约合人民币 1,797 亿元)投资 OpenAI。

而这距离 OpenAI 以 $1,570 亿美元的估值融资 16 亿美元仅过去了四个月。

短短几个月,估值又翻了一番,这也印证了市场传言:OpenAI 对上一轮融资并不满意。

现在,OpenAI 可能真的有点绝望了:

另一个消息是,o3 将于当地时间周五发布。

但人工智能应用方面的情况则有些不同。

例如,深受程序员喜爱的 Cursor 公司已经公开采用了新模式,并呼吁大家一起测试,以了解实际效果。

只有中间的模式供应商才会在风中飘摇不定。对于云服务和应用来说,首先支持它们才是正确的(doge)。

更多详情,让我们继续聊。

周五与开放式人工智能再见o3

根据泄露的信息,OpenAI 筹资的目的之一是履行对星际之门项目的承诺。

该项目由 OpenAI 和软银牵头,Arm、微软、英伟达和甲骨文为主要技术合作伙伴。目标是在未来四年内投资 $5000 亿美元(约 3.64 万亿元人民币),在美国建设多个人工智能数据中心。

OpenAI 的承诺是$1000亿。

官方公告透露了一些细节:

星际之门项目是一家新公司,计划在未来四年内投资 $5000 亿美元,在美国为 OpenAI 建设新的人工智能基础设施。我们将立即投资 $1000 亿美元。

该项目的初始股权出资方包括软银、OpenAI、甲骨文和中东人工智能基金 MGX。软银和 OpenAI 是该项目的主要合作伙伴,软银负责财务,OpenAI 负责运营。孙正义将担任董事长。

Arm、微软(Microsoft)、英伟达(NVIDIA)、甲骨文(Oracle)和 OpenAI 是初期的主要技术合作伙伴。目前,从德克萨斯州开始的建设正在进行中,我们正在评估全国各地的潜在地点,以便在敲定协议的同时建设更多的园区。

作为 "星际之门 "项目的一部分,甲骨文、英伟达和OpenAI将密切合作,共同构建和运营该计算系统。这建立在OpenAI与英伟达自2016年以来的深度合作,以及OpenAI与甲骨文之间的新合作基础之上。

它还建立在 OpenAI 与微软现有关系的基础上。OpenAI 将继续增加对 Azure 的使用,同时继续与微软合作,利用额外的计算能力来训练领先的模型,并提供卓越的产品和服务。

此外,这笔钱还将被 OpenAI 用来弥补亏损。虽然在 2024 年 8 月,OpenAI 的月营收达到了 3 亿美元,比 2023 年初增长了 1700%,但到了 10 月,OpenAI 预计全年亏损 50 亿美元。

伴随融资消息而来的是 o3 的最新时间表。

OpenAI 全球首席事务官 Chris Lehane 在接受 NPR 采访时透露:

o3 将于周五发布。

消息一出,网民小马扎就做好了准备。

不过,一些网民指出,他所说的 "o3 "仍然是 o3-mini,而 Altman 本人早已宣布推出这一机型。

毕竟,尽管存在争议,DeepSeek 还是在池塘边引发了更多讨论和赞誉

DeepSeek 真不错

微软指点江山之后,立即将其人工智能平台与 DeepSeek 模型联系起来。今天,深受程序员喜爱的光标公司也宣布了最新消息:

DeepSeek 模型现已在 Cursor 上推出。

值得注意的是,Cursor 提到,在实际编程任务中,Sonnet 3.5 仍优于 DeepSeek 的新型号。

不过,光标公司的官员并没有举出具体的例子,这引起了围观者的好奇:

看来是时候用实际测量结果说话了。如果您已经有机会尝试,不妨在评论区与我们分享您的体验。

同样,大嘴巴 Anthropic(其支持者 AWS 也是第一个采用 DeepSeek 模型的公司)也丝毫没有因为争议而犹豫不决(doge)。

英伟达(NVIDIA)是另一家受到更多关注的公司。

DeepSeek-R1 已经可以在英伟达™(NVIDIA®)NIM 平台上使用。英伟达公司也为此大做文章:

DeepSeek-R1 是一个开源模型,具有最先进的推理能力。DeepSeek-R1 等推理模型不会直接给出答案,而是对查询进行推理,通过思维链、共识和搜索方法生成最佳答案。

DeepSeek-R1 是测试中 "扩展法则 "的完美范例,证明了为什么加速计算对代理人工智能的推理需求至关重要。

英伟达™(NVIDIA®)表示,DeepSeek-R1 NIM微服务在单个英伟达™(NVIDIA®)HGX H200系统上每秒可交付3872个代币。

针对 Anthropic 和其他公司面对 DeepSeek 竞争时的无动于衷,也出现了越来越多的不同声音。

例如,HuggingFace 联合创始人托马斯-沃尔夫(Thomas Wolf)就直接提出了批评:

说实话,达里奥的文章读起来非常痛苦。

他在短文中写道

将开源研究与含糊不清的封闭研究和未公开的评估进行比较,让我对人类学的领先地位没有以前那么有信心了。

更重要的是,随着 Open-R1 和 DeepSeek 论文的开发,来自世界各地的团队将在未来几个月内发布开源推理模型。例如,今天艾伦研究所(Allen Institute)和Mistral分别发布了Tülu和Small3,以追赶DeepSeek-V3的脚步。

开放源代码对我们的安全将越来越重要。

你怎么看?

类似职位

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注