AI 技术深度日报|2026-03-25:供应链安全拉响警报,实时语音/推理栈更考验工程稳定性
今天的主线判断:“LLM 工程正在进入‘供应链安全 + 实时化(语音/流式)+ 多后端(CUDA/ROCm)’三重叠加期。” 供应链侧:一旦常用中间层(如统一网关/路由器)出事,影响面会比模型本身更大。 实时侧:语音/流式调用链更长(SIP/WebRTC/SDP/媒体网关),任何一环的兼容性抖动都会直接变成线上事故。 推理侧:在 CUDA 之外,ROCm/插件化容器的“组合爆炸”持续出现,逼着团队把可观测性与回滚策略做得更像 SRE。 下面是过去 24h 内最值得工程团队优先处理/关注的更新(偏 Infra & Agent 工程影响)。 1) LiteLLM 疑似供应链投毒:PyPI 版本被指含恶意代码(需立刻止血) 参考: NVIDIA Developer Forums 讨论:https://forums.developer.nvidia.com/t/critical-attack-litellm-compromised-pin1-82-6-now/364638 社区讨论(需自行甄别):https://www.reddit.com/r/cybersecurity/comments/1s2gf82/litellm_1828_on_pypi_was_compromised_steals_ssh/ 事实: 社区与开发者论坛出现高优先级告警:litellm 在 PyPI 的近期版本(讨论中提到 1.82.7/1.82.8)被怀疑被篡改,可能窃取 SSH Key、云凭证、K8s Secrets 并植入持久化后门;建议紧急 pin 回 1.82.6 并排查。 意义: LiteLLM 常被作为“统一模型网关/路由层/计费与限流层”放在核心链路;一旦被投毒,相当于拿到了所有上游模型凭证与下游业务数据的转发中枢。 影响: 生产集群可能存在“凭证被读取→横向移动→持续驻留”的链式风险; 若你把 OpenAI/Anthropic/Bedrock/Groq 等 key 都集中给网关,单点沦陷的损失会被放大。 建议: 立即在依赖层做版本冻结/回滚(pin 到被认为安全的版本),并锁定构建产物(SBOM/镜像 digest); 以“已泄露”假设处理:轮转所有可能接触过的密钥(API key、云 AK/SK、K8s serviceaccount token、CI/CD token); 拉取过去 24–72h 的出站流量/进程树/容器层变更记录,重点查异常域名、反向 shell、可疑 cron; 补齐防线:PyPI 依赖上生产前加“allowlist + hash pin + 私有镜像仓库”。 2) OpenAI gpt-realtime 的 SIP 呼叫被报 “Invalid SDP offer”:实时语音链路的兼容性风险再次暴露 参考:https://community.openai.com/t/invalid-sdp-error-on-new-call-to-sip-endpoint/1377602 ...