今日概览
- OpenAI发布GPT-5.4 nano,每百万token输入仅0.2美元,挑起AI价格战
- 英伟达GTC 2026发布Vera Rubin全栈AI平台,7种芯片亮相,积压订单约1万亿美元
- Figure AI人形机器人视频曝光家务能力,宝马宣布扩大生产线部署规模
01 OpenAI:GPT-5.4 nano发布,每百万token仅0.2美元挑起价格战
OpenAI于3月17日深夜突然发布GPT-5.4 mini和GPT-5.4 nano两款模型,其中nano版本以每百万token输入仅0.2美元的价格震撼市场,比Google的Gemini 3.1 Flash-Lite还要便宜,引发AI行业新一轮价格战。这两款模型在编码、科学推理和计算机视觉等关键指标上全面超越前代,同时速度提升2倍,再次印证了AI性能与成本之间的"黄氏定律"正在加速运转。
GPT-5.4 nano虽然体积最小,但能力毫不逊色。根据OpenAI官方披露的测试数据,GPT-5.4 nano在SWE-bench Pro编程测试中拿下53.40%,在OSWorld计算机操作测试中达到72.1%,与满血版GPT-5.4的75%已相当接近。更令人印象深刻的是,其在GPQA Diamond科学推理测试中的准确率达到85.48%,展现出小模型在专业任务上的突破。
在图像理解能力上,GPT-5.4 nano同样表现出色。开发者Simon Willison实测,用GPT-5.4 nano以每张图片0.0007美元的成本,成功描述了76000张图片——总花费仅52美元。这意味着企业可以以极低的成本大规模部署多模态AI能力,用于图像审核、内容理解、视觉搜索等场景。
价格方面,GPT-5.4 nano比Google Gemini 3.1 Flash-Lite低了25%。目前,GPT-5.4 nano已面向所有ChatGPT用户开放,并可通过API调用。相比之下,GPT-5.4 mini(输入每百万token 0.75美元)和满血版GPT-5.4(输入每百万token 2.5美元)覆盖了从入门到旗舰的不同需求层级。这一完整的价位布局,使OpenAI在各个价格段都保持了竞争力。
至此,GPT-5.4系列已经形成完整矩阵:定位日常助手的GPT-5.4 nano、主打性价比的GPT-5.4 mini,以及面向复杂专业任务的GPT-5.4和GPT-5.4 Pro。值得关注的是,GPT-5.4全系已具备原生计算机操作能力,AI可以像人一样操控鼠标、键盘和屏幕,直接在真实软件界面中执行任务,真正将"AI数字员工"从概念推向了实用。
关键标签
- 价格战(nano定价0.2美元/百万token,低于Google)
- 小模型能力突破(72% OSWorld,媲美满血版)
- 76000张图片描述仅需52美元
来源
- GPT-5.4 nano实测:76000张照片描述52美元 - Simon Willison Blog
- GPT-5.4 mini与nano正式发布 - OpenAI官方
- GPT-5.4重磅发布:原生电脑操作登场 - CSDN
02 英伟达:GTC 2026发布Vera Rubin全栈平台,AI算力进入工业化阶段
英伟达GTC 2026大会于3月16日至19日在美国加州圣何塞举行,CEO黄仁勋发布了堪称史上最大规模的AI平台更新——Vera Rubin全栈计算平台。该平台包含7种全新芯片、5种机架级系统以及1台超级计算机,专为代理式AI(Agentic AI)时代设计,标志着AI算力竞争正式进入"工业化阶段"。
黄仁勋在主题演讲中透露,英伟达目前手持约1万亿美元的AI芯片积压订单,这一数字震惊全场。这意味着在全球AI基础设施建设狂潮中,算力供给依然严重不足,各科技巨头争相锁定英伟达未来数年的GPU产能。他将这一时刻定义为"第四次工业革命"的起点,并将AI工厂(AI Factory)定位为这场革命的核心基础设施。
Vera Rubin平台的核心是Rubin GPU配合Vera CPU,通过NVLink 6 Switch实现高带宽互联。整体系统专为万亿参数模型的推理工作负载优化,支持从训练到部署的全流程加速。在推理效率上,Rubin平台较Blackwell实现了显著提升,同时功耗控制更为出色。
本届GTC的另一重磅宣布是Space-1 Vera Rubin项目——英伟达正式将AI计算能力延伸至太空。该项目计划在轨道上部署AI数据中心,为轨道数据处理、地理空间信息采集和太空自主运行提供算力支撑。根据披露,相较于Hopper GPU,Space-1 Rubin在太空推理场景中实现了性能数量级的提升。
软件生态方面,英伟达发布了NeMoClaw以协同OpenClaw加速Agentic AI落地,并完善了Nemotron开源模型体系。同时,Groq LPU正式整合进入英伟达产品序列,专注于低延迟解码推理,与Rubin GPU形成互补——LPU负责对延迟敏感的推理环节,Rubin则承担Prefill和Decode attention计算。黄仁勋同时宣布了未来路线图:2027年下半年推出Vera Rubin Ultra,2028年推出Feynman架构,持续推进年度平台迭代节奏。
关键标签
- 积压订单1万亿美元(算力供给持续严重不足)
- 7芯片全栈平台(Rubin GPU + Vera CPU + 5款配套芯片)
- 太空计算(Space-1项目,AI进入轨道数据中心)
来源
- NVIDIA GTC 2026:Vera Rubin全栈计算平台发布 - 搜狐科技
- NVIDIA GTC 2026:7种芯片5种机架系统1万亿美元积压订单 - 今日头条
- NVIDIA GTC 2026:R Rubin GPU、LLPU整合、推理机柜 - StorageReview
03 Figure AI:人形机器人视频曝光家务能力,具身智能商业化进程加速
人形机器人公司Figure AI于3月10日发布了一段引发广泛关注的视频,展示了旗下人形机器人在真实家庭环境中执行家务的能力。视频中,机器人在客厅和茶几之间穿梭移动,完成了擦桌子、收拾积木、整理抱枕等常见家务任务,最后还顺手将毛巾甩到肩上腾出双手去取物品,动作流畅自然,被网友评价为"像科幻电影一样"。
同一天,宝马集团宣布将继续扩大Figure机器人在汽车生产线上的部署规模。目前,Figure机器人已在宝马工厂累计运行超过1250小时,涵盖多个工位。宝马表示,随着机器人稳定性的持续验证,部署范围将从试点的数个工位扩展至更广泛的生产线环节,标志着人形机器人在工业场景中的应用已进入规模化验证阶段。
Figure AI于今年2月发布了通用人形机器人视觉-语言-动作模型Helix。根据技术报告,Helix是首个能够在家庭场景中执行多模态协同任务的具身智能系统。在官方发布的演示视频中,两台搭载Helix模型的机器人协作完成了拾取任意物品并分类、冰箱收纳、桌面整理等复杂任务,展现了人形机器人在开放环境下理解和执行自然语言指令的能力。
Figure AI成立于2022年,背后站着OpenAI、微软、英伟达和亚马逊等科技巨头,是全球融资最多的人形机器人初创公司之一。与特斯拉Optimus、波士顿动力等竞争产品相比,Figure AI选择了一条"AI优先"的技术路线——不追求极致硬件性能,而是依托大模型能力让机器人在非结构化的真实环境中实现泛化操作。
值得关注的是,本周北京同期举行了AI Show 2026国际人工智能应用与机器人创新博览会,200多个品牌参展,人形机器人成为最受关注的板块。宇树科技、北京人形机器人、月泉仿生等多家中国企业展示了最新产品。从CES到GTC再到AI Show,人形机器人正在从"展品"快速走向"商品",2026年被多方认为是具身智能商业化的元年。
关键标签
- 家庭场景落地(做家务、开放环境泛化能力)
- 工业规模化(宝马1250小时运行数据,扩大部署)
- 2026具身智能元年(AI Show 2026,200+品牌参展)
来源
- Figure AI发布机器人做家务视频,马斯克发质疑 - 今日头条
- Figure AI发布Helix模型:人形机器人进入家庭 - 网易科技
- AI Show 2026北京人工智能与机器人展开幕 - 新浪
快速新闻
-
04 Google DeepMind于3月18日对Gemini API进行重磅升级,推出多工具链(Multi-tool Chaining)和"上下文循环"机制,支持在单一请求中深度整合Google搜索、Google地图与自定义函数,大幅提升开发者调用效率。 搜狐
-
05 OpenAI CEO Altman在Cisco AI峰会上预言,大部分新创业公司将主要是"AI Agents"而非人类团队,且OpenAI旗下"AI Defense"产品将很快实现100%由AI编写代码。 新浪
-
06 小米最新大模型MiMo-V2-Pro以420亿激活参数的MoE架构强势登顶OpenRounter周榜,AI领域投资超160亿美元,在编程和推理测试中刷新纪录。 新浪AI热点
-
07 苹果公司宣布macOS 27将于6月WWDC发布首个测试版,AI功能将深度嵌入系统底层,Siri迎来全面升级,触控界面与AI协同交互成为亮点。 新浪硬件热点
-
08 DeepSeek于3月12日发布DeepSeek-V3.2正式版,强化Agent能力,融入思考推理,已在网页端、APP和API全面上线。 DeepSeek官网
-
09 三星在GTC 2026上首次展示HBM4E内存,每引脚传输速度达16Gbps、带宽4TB/s,专为NVIDIA Vera Rubin平台优化,已进入量产阶段。 腾讯新闻
-
10 Anthropic Claude Code于3月17日发布针对Claude Opus 4.6的重大更新,默认输出token扩展至64k,上限提升至128k,新增allowRead沙盒权限等能力。 Releasebot
-
11 华硕在GTC 2026发布基于NVIDIA Vera Rubin的全液冷AI基础设施架构,PUE控制在1.18,锁定大规模AI训练与推理需求,是台湾首座采用该架构的AI超级计算机。 新浪