AI 工具最新资讯：Claude 4.5、Gemini 3 与 MIT AI 研究进展

2026年1月至2月，人工智能领域迎来多项重要更新。Anthropic发布了新一代Claude模型，Google DeepMind推出Gemini 3系列，MIT则开设了探索AI理性哲学的新课程。

Anthropic：Claude Opus 4.5 与 Sonnet 4.5

Anthropic在2025年11月发布了Claude Opus 4.5，官方称其为"世界上最好的编码、代理和计算机使用模型"。该模型在日常任务（如幻灯片和电子表格处理）方面有显著改进，提供了前沿性能和大幅提升的令牌效率。

随后在2025年9月，Anthropic发布了Claude Sonnet 4.5，在编码、推理和计算机使用方面创下新的基准记录，同时成为Anthropic最对齐的模型。伴随此次发布，Anthropic还推出了Claude Agent SDK，用于构建能力强大的代理系统。

Anthropic在2025年9月还完成了130亿美元的F轮融资，估值达到1830亿美元。值得注意的是，该公司在短短8个月内收入从10亿美元增长至超过50亿美元，显示出AI市场的强劲需求。

Google DeepMind在2025年11月推出了Gemini 3，标志着"智能新纪元"的到来。2026年1月，公司发布了多项重要更新：

此外，Google还在科学领域取得突破，包括与DOE合作的Genesis项目以加速科学发现，以及WeatherNext 2——最先进的天气预报模型。

MIT在2026年1月开设了一门名为"AI与理性"的新课程（6.S044/24.S00），探索人工智能系统的理性程度问题。该课程由计算机科学与工程学院的Leslie Kaelbling教授和语言学与哲学系的Brian Hedden教授联合讲授。

课程不寻求给出确定答案，而是挑战学生通过AI研究的视角探索这一哲学问题。对于下一代学者来说，理性与代理的概念可能在AI决策中变得尤为重要，尤其是在受到人类理解自身认知局限和受限、主观的理性观念影响的情况下。

这门课程是MIT Schwarzman计算教育公共基础计划的一部分，该计划旨在促进多个部门的合作，开发融合计算与其他学科的新课程和新项目。

在AI安全领域，Google DeepMind于2025年12月发布了Gemma Scope 2，帮助AI安全社区深化对复杂语言模型行为的理解。FACTS基准套件的发布则系统性地评估了大型语言模型的事实性。

MIT的研究人员还在临床AI的隐私风险方面取得进展，展示了如何测试AI模型以确保它们不会通过泄露匿名患者健康数据造成伤害。

来源：MIT News, Anthropic, Google DeepMind