7.22胜算AI资讯日报:阿里云 Qwen3 挥出“FP8 大招”、Gemini夺IMO金、Stargate缩编、万智2.0、NTT安全LLM秀BH
阿里还首次公开“分离训练”策略:快思模型负责 Prompt 级响应,慢思模型主攻深推理,两者通过路由网格协同。当路由系统侦测到数学任务吞吐/召回率显著优于同价模型时,会动态提升 Gemini 配置权重,以质量优先模式自动派单,开发者无需改 SDK 即可用到“金牌数学家”。,具备深度任务规划、跨系统工具链调用等能力,定位“AI 超级员工”。,即使单一区域算力受限,也可在 30 秒内热迁移到其他节点,
胜算AI资讯日报 · 2025 年 7 月 22 日
① 阿里云 Qwen3-235B-A22B-Instruct-2507-FP8:256 K 长上下文 + FP8 低显存,引爆参数/成本双赢
凌晨 2 点,通义千问团队抛出重磅升级——Qwen3 在 FP8 混合精度 与 256 K tokens 长上下文 上实现双跃迁,显存占用再降 40%,推理吞吐增 32%。在 AIME25 数学测试中拿下 70.3 分,硬刚 DeepSeek-V3 的 46.6 分;LiveCodeBench v6 编程得分 51.8,超过 Kimi-K2。阿里还首次公开“分离训练”策略:快思模型负责 Prompt 级响应,慢思模型主攻深推理,两者通过路由网格协同。
胜算短评
“256 K × FP8” 让长文档 RAG 和 Agent 任务真正“能跑又跑得起”。
胜算解读
在胜算云的 秒级算群 Serverless 集群里(负载均衡 + 弹性调度),FP8 版 Qwen3 可以分钟级热切换,无需排期 GPU 升级。借助 Prompt 缓存与智能路由,相同上下文请求平均节省 37% Token 费,长文本应用成本腰斩。
② Google DeepMind Gemini Deep Think:纯自然语言 4.5 小时解 5 题,勇夺 IMO 金牌
DeepMind 官博披露:Gemini 的强化模式 Deep Think 在 IMO 2025 正赛中 直接用自然语言 写完 5 题证明,获得 35/42 分金牌,且答案经官方阅卷确认正确。相较 2024 年 AlphaGeometry 需要 Lean 形式语言 + 两天计算的做法,今年版本首次做到“端到端自然语言->严谨证明”,并引入 并行思考 与 RLHF+ 自回归检索训练。
胜算短评
数学被称作“大模型 Alcatraz”,Gemini 用金牌式成绩敲开了铁门。
胜算解读
对算法交易与科研自动化而言,高精度数学推理是 Agent“最后一公里”。胜算云 统一 API 已接入 Deep Think 试验端点;当路由系统侦测到数学任务吞吐/召回率显著优于同价模型时,会动态提升 Gemini 配置权重,以质量优先模式自动派单,开发者无需改 SDK 即可用到“金牌数学家”。
③ SoftBank × OpenAI Stargate 超级数据中心:10 GW 的梦暂“瘦身”成俄亥俄小型园区

《华尔街日报》援引多位知情者称,原计划投资 5000 亿美元、分布全美的 Stargate 项目因 选址与治理结构冲突 暂时搁浅,参与方将先在俄亥俄落地一座数百 MW 级机房,目标年底投产。SoftBank 与 OpenAI 仍声明“多州评估同步推进”,但幕后博弈聚焦“谁为电力与税收政策埋单”。Oracle 率先与 OpenAI 单签 2028 年前托管合同。
胜算短评
AI“造城式”基建光环熄火,提醒行业别把全部筹码压在某一座城。
胜算解读
大型一体化园区的不确定性,让“多云-多节点弹性”成为刚需。胜算云通过 跨云算力共享 + 自动故障转移,即使单一区域算力受限,也可在 30 秒内热迁移到其他节点,保障 API 连续性。此外,统一计量/结算体系避免了开发者被某地电价突涨“连坐”。
④ 零一万物 万智 2.0:企业级 Agent 平台正式商用,迈向“超级员工”生态

北京发布会上,李开复携团队发布 万智平台 2.0,主打 L2 推理 Agent,具备深度任务规划、跨系统工具链调用等能力,定位“AI 超级员工”。官方将 Agent 演进拆解为 L1 工作流、L2 推理、L3 多智能体三阶,并宣布与多家头部企业共建行业解决方案。
胜算短评
从“会聊天”到“能交付”,企业开始按 KPI 采购 Agent,而非按对话轮数。
胜算解读
企业级 Agent 对 模型多样性与实时成本控制 痛感最强。胜算云 一个 Key 调用所有模型 的接口(含权限、用量统一控制)可让企业轻松在任务图中切换 Qwen-FP8、Gemini-Deep Think 等 SOTA 模型;Prompt 缓存+动态调度让复杂工作流平均节约 30% inference 费。
⑤ NTT DATA 三款 LLM 安全工具入选 Black Hat USA 2025 Arsenal

NTT DATA 宣布,员工自研的开源工具 SigmaOptimizer、Hayabusa、Suzaku 获选今年 Black Hat Arsenal 展示,核心亮点是 利用 LLM 自动生成/优化 Sigma 检测规则,并可在 Windows 日志与云日志场景快速取证。官方称目标是让中小团队低门槛用上高级威胁检测能力。
胜算短评
“把 LLM 当安全同事”从 PPT 走向 GitHub,开源社群正在成为安全能力增幅器。
胜算解读
安全取证常伴随海量日志峰值。胜算云 共享调度算力 模式在低谷时释放 GPU、在高峰时弹性拉起,同价位下推理成本可降至自建集群的 20-30%;结合 智能路由,用户可在实时检测与成本上获得最优折中。
✨ 胜算云 · 用 更快、更稳、更省 的方式,连接全球大模型
- 一个 API,一把 Key:直连 OpenAI、Claude、Gemini、DeepSeek 等多模态模型,接口/计费统一,帐号管理零负担
- 秒级算群 Serverless 集群:跨云弹性调度,首字响应 <1.5 秒,千万并发不惧限流
- 共享调度 + 真实降本:推理成本较自建 GPU 最高再降 80%,Serverless 按请求付费,每月省下一辆 Model 3
- 智能路由 & Prompt 缓存:自动优选最快/最省/最高质模型,平均减少 37% Token 消耗
立即访问,把你的产品升级到“超音速”! 🚀
后记 · 观察三大趋势
- 工程突破重新定义“性能/成本曲线”:FP8、超长上下文等创新,让“小显存大能力”成为现实。
- 自证推理能力进入“官方排行榜”:IMO 金牌树立了学术级标尺,企业将更关注“能否经得起公开测”。
- 产业落地呼唤“弹性 + 多云 + 智能调度”:从 Stargate 缩水到 Agent 商用,算力与模型都在走向“随取随用”,而非一次性豪赌。
— End —
更多推荐



所有评论(0)