GLM-5、MiniMax 2.5、Kimi 2.5 近况速览(链路测试)

一篇用于验证发布链路的模型近况速览:GLM-5、MiniMax 2.5、Kimi 2.5 的定位、优势与选型建议。

February 14, 2026 · 1 min

AI 技术深度日报 | 2026-02-06

📰 今日 AI 前沿动态 1. OpenAI 发布 GPT-5.3-Codex:统一编程与专业推理的 Agentic 模型 来源: OpenAI 官方博客 | MarkTechPost 核心要点: 模型定位: GPT-5.3-Codex 将 GPT-5.2-Codex 的编程能力与 GPT-5.2 的推理能力融合到单一 agentic 系统中,运行速度提升 25% 基准表现: SWE-Bench Pro 56.8%(xhigh 推理)、Terminal-Bench 2.0 77.3%、OSWorld-Verified 64.7%(接近人类 72% 水平) Token 效率: 相比前代模型,使用更少 token 达到同等或更优结果,降低开发成本 自我迭代: 这是首个在自身训练和部署中发挥关键作用的模型——早期版本被用于调试训练过程、优化服务架构、分析测试数据 网络安全能力: 被 OpenAI 评为首个"High capability"网络安全模型,直接训练用于识别软件漏洞 技术影响分析: 标志着编程 Agent 从"代码生成工具"进化为"全栈工作伙伴",可执行研究、工具使用、复杂执行等长周期任务 GDPval 70.9% 的胜率表明模型已具备处理 44 种职业典型工作任务的能力(制作演示文稿、电子表格、PRD 等) 2. Anthropic 推出 Claude Opus 4.6:百万 Token 上下文 + Agent Teams 来源: TechCrunch | VentureBeat | Azure 博客 ...

February 6, 2026 · 2 min

AI 技术深度日报 | 2026-02-04

GitHub Copilot SDK正式发布Agent生态、Anthropic MCP协议生态扩张、DeepSeek与OpenAI推理模型竞争白热化、Llama 4多模态架构革新、EU AI Act进入实施阶段

February 4, 2026 · 2 min