AI 技术深度日报(2026-02-07)
选题范围:过去 24h 内 AI/LLM/Agent/推理/基础设施 方向的重要更新。偏工程落地与技术深度。 1) OpenAI 发布 GPT‑5.3‑Codex:更强、更快,并把“网络安全”风险分级抬到 High 来源: OpenAI 官方:https://openai.com/index/introducing-gpt-5-3-codex/ Ars Technica 解读:https://arstechnica.com/ai/2026/02/with-gpt-5-3-codex-openai-pitches-codex-for-more-than-just-writing-code/ Fortune(强调安全/访问策略):https://fortune.com/2026/02/05/openai-gpt-5-3-codex-warns-unprecedented-cybersecurity-risks/ 要点(技术向): 是什么:OpenAI 将 GPT‑5.2‑Codex 的“前沿编程能力”和 GPT‑5.2 的“推理/专业知识”合并到 GPT‑5.3‑Codex,并宣称 整体快 25%(推理与推断栈优化)。 为什么重要:它把“写代码”扩展为“覆盖软件生命周期”的更广泛代理能力(debug / deploy / monitor / PRD / 测试 / 指标等),意味着 Codex 的竞争维度从“补全/对话”转向“可监督的长任务执行”。 能力证据(怎么衡量):OpenAI 把亮点放在 SWE‑Bench Pro、Terminal‑Bench 2.0、OSWorld、GDPval 等更贴近“真实工作”的评测组合上,且强调“更少 token 达到更好结果”(对成本/吞吐有直接意义)。 安全与访问策略变化:这是 OpenAI 首次把模型在 Preparedness Framework 下的网络安全能力分级到 High capability,同时采用 Trusted Access for Cyber(受控访问)+ 自动监控 + 风险管线等“更像安全产品发布”的护栏。 落地建议: 研发团队:把 Codex 任务拆成“可验证阶段”(例如:生成变更 → 运行测试 → 生成评审摘要 → 生成回滚计划),用 CI/静态分析工具做外部约束。 安全团队:优先把 Codex 接入 SAST/依赖审计/漏洞数据库,用它做“防守侧放大器”(快速 triage / patch suggestion),并对“攻击性指令”设置强策略与审计。 2) “Codex 参与构建自己”:从“工程加速器”走向“研发闭环”的早期形态 来源:https://www.nbcnews.com/tech/innovation/openai-says-new-codex-coding-model-helped-build-rcna257521 ...