# (2026.03.02 - 03.08) [特殊字符] 好虫子周刊：万亿开源MoE、Agent协议标准化、国产算力独立 ## 开源

李梨同学丶

409人浏览 · 2026-03-09 09:20:17

李梨同学丶 · 2026-03-09 09:20:17 发布

本周关键词： DeepSeek V4、Qwen 3.5、MCP协议、OpenClaw

摘要： 本周是开源社区的“高光时刻”。以 Qwen 3.5 和 DeepSeek V4（灰度中）为首的开源势力通过万亿级 MoE 架构，正式在多模态与长文本领域正面硬刚 GPT-5 系列。与此同时，Anthropic 将 MCP 协议捐赠至 Linux 基金会，标志着 Agent 开发者告别了“一智能体一接口”的混乱时代。国内方面，DeepSeek 明确转向国产算力适配，预示着 AI 开发生态正加速从底层硬件实现自主化转移。

🚨 核心头条 (Top Stories)

1. Qwen 3.5 旗舰版发布：万亿参数开源 MoE 的“性价比之王”

发布时间： 03.02 (小型系列) / 02.16 (旗舰版持续热议)
核心亮点： 阿里云发布 Qwen3.5-397B-A17B。采用 MoE 架构，总参数 397B，单次前向传播仅激活 17B，支持原生多模态（文/图/视）及 1M token 超长上下文。
技术突破： 引入了自适应推理机制，在 MMLU-Pro 上取得 87.8 分。通过优化的 KV Cache 管理方案，显著降低了长文本状态下的 I/O 瓶颈，使 1M 上下文在消费级显卡集群部署成为可能。
开源/行业价值： 采用 Apache 2.0 协议。其 API 定价仅为竞品的 1/18，大幅降低了开发者构建长路径 Agent 的 Token 成本。

2. DeepSeek V4 灰度测试：国产算力适配的里程碑

发布时间： 03.03 (技术前瞻/灰度开始)
核心亮点： 深度求索（DeepSeek）披露下一代模型 V4。据社区监测，其规模达 1T 总参数，激活约 32B，针对华为昇腾、寒武纪等国产芯片进行了深度底层算子优化。
技术突破： 强调“原生多模态”与“逻辑推理增强”，宣称通过强化学习（RL）将算力成本进一步降低 90%，并在编程基准测试中超越了多个闭源 SOTA 模型。
开源/行业价值： 标志着中国大模型正式开启“去美化”进程。对于国内开发者而言，这意味着未来即便在算力受限的情况下，也能通过针对性优化的模型获得顶级推理能力。

🛠️ GitHub 热门开源项目 (Trending Tools)

本周 GitHub Star 增长最快、开发者关注度最高的项目精选

⚡ OpenClaw

一句话介绍： 席卷全球的开源多平台个人 AI 助手框架。
核心价值： 解决了 Agent 接入不同通讯软件的痛点。支持将本地模型一键桥接至 WhatsApp、Telegram、Teams 等渠道，并拥有 5700+ 社区技能扩展。本周因其极致的工程化能力，Star 数突破 18k。
项目地址： openclaw/openclaw

🤖 Claude Code (MCP Protocol)

一句话介绍： 终端级智能编码助手及 Model Context Protocol (MCP) 实现规范。
核心价值： 随着 Anthropic 捐赠 MCP 给 Linux 基金会，该项目成为 Agent 连接现实工具的事实标准。它允许 AI 直接操作本地文件、运行测试并修复 Bug，极大提升了开发者的“人机协作”效率。
项目地址： anthropics/claude-code

🎬 Helios

一句话介绍： 字节跳动与北大联合出品的实时长视频生成模型。
核心价值： 采用自回归扩散架构（14B），支持单 H100 GPU 实时生成分钟级视频。解决了传统视频生成模型推理慢、连贯性差的问题，对视频创作者是重大利好。
项目地址： PKU-YuanGroup/Helios

📑 前沿研究与行业风向 (Insights)

Agentic AI 范式转移： 本周多篇论文（如 Agentic Reasoning for LLMs）指出，2026 年的技术重心已从“提升参数量”转向“提升推理路径”。即通过多智能体协作和自我记忆机制（Self-Memory Policy Optimization），让模型在低激活参数下通过“思考”换取高性能。
学术界信任危机： ICLR 2026 审稿争议引发热议，数据显示 21% 的审稿意见由 AI 生成。这促使 Hugging Face 与 arXiv 等平台正紧急研发基于最高似然模型的“AI 生成内容大规模监测系统”。

✍️ 编辑结语：

本周我们看到了开源力量对闭源巨头的强力围剿：Qwen 压低了成本价格战，MCP 统一了 Agent 的连接标准。下周我们将重点关注 DeepSeek V4 权重的正式释放及国产算力栈的实际跑分表现。

整理：好虫子周刊编辑部 数据来源：GitHub, arXiv, Hugging Face, Google AI Blog 等

- END -

本文由 mdnice 多平台发布

九章云极普惠算力

更多推荐

阿里云 Coding Plan Lite 下架，各家算力吃紧，上哪买还能支持GLM-5和5.1的coding plan？_2026-04-15

九章云极普惠算力

看遍了市面上的coding plan，我发现还是这个好用

九章云极普惠算力

终极指南：如何用facenet-pytorch快速构建企业级人脸识别系统

在当今数字化时代，人脸识别技术已成为身份验证、安全监控和智能交互的核心驱动力。facenet-pytorch作为一款基于PyTorch的开源人脸识别工具包，凭借其高效的MTCNN人脸检测和InceptionResnetV1特征提取能力，为开发者提供了从零构建专业级人脸识别系统的完整解决方案。本文将带你一步步探索这个强大工具的使用方法，从环境搭建到实际应用，让你在短时间内掌握人脸识别的核心技术。