2026年1月至2月,人工智能领域迎来多项重要更新。Anthropic发布了新一代Claude模型,Google DeepMind推出Gemini 3系列,MIT则开设了探索AI理性哲学的新课程。
Anthropic:Claude Opus 4.5 与 Sonnet 4.5
Anthropic在2025年11月发布了Claude Opus 4.5,官方称其为"世界上最好的编码、代理和计算机使用模型"。该模型在日常任务(如幻灯片和电子表格处理)方面有显著改进,提供了前沿性能和大幅提升的令牌效率。
随后在2025年9月,Anthropic发布了Claude Sonnet 4.5,在编码、推理和计算机使用方面创下新的基准记录,同时成为Anthropic最对齐的模型。伴随此次发布,Anthropic还推出了Claude Agent SDK,用于构建能力强大的代理系统。
Anthropic在2025年9月还完成了130亿美元的F轮融资,估值达到1830亿美元。值得注意的是,该公司在短短8个月内收入从10亿美元增长至超过50亿美元,显示出AI市场的强劲需求。
Google DeepMind:Gemini 3 与创新项目
Google DeepMind在2025年11月推出了Gemini 3,标志着"智能新纪元"的到来。2026年1月,公司发布了多项重要更新:
- Project Genie:一个能够生成无限、交互式世界的实验性项目
- D4RT:教AI以四维视角看世界的创新研究
- Veo 3.1:视频生成模型的重大改进,提供更高的一致性、创造力和控制力
此外,Google还在科学领域取得突破,包括与DOE合作的Genesis项目以加速科学发现,以及WeatherNext 2——最先进的天气预报模型。
MIT:AI 理性哲学课程
MIT在2026年1月开设了一门名为"AI与理性"的新课程(6.S044/24.S00),探索人工智能系统的理性程度问题。该课程由计算机科学与工程学院的Leslie Kaelbling教授和语言学与哲学系的Brian Hedden教授联合讲授。
课程不寻求给出确定答案,而是挑战学生通过AI研究的视角探索这一哲学问题。对于下一代学者来说,理性与代理的概念可能在AI决策中变得尤为重要,尤其是在受到人类理解自身认知局限和受限、主观的理性观念影响的情况下。
这门课程是MIT Schwarzman计算教育公共基础计划的一部分,该计划旨在促进多个部门的合作,开发融合计算与其他学科的新课程和新项目。
研究进展与安全
在AI安全领域,Google DeepMind于2025年12月发布了Gemma Scope 2,帮助AI安全社区深化对复杂语言模型行为的理解。FACTS基准套件的发布则系统性地评估了大型语言模型的事实性。
MIT的研究人员还在临床AI的隐私风险方面取得进展,展示了如何测试AI模型以确保它们不会通过泄露匿名患者健康数据造成伤害。
来源:MIT News, Anthropic, Google DeepMind