重磅发布：Intern-S1-FP8——开源科学多模态模型的算力革命

在人工智能领域持续突破的浪潮中，Intern-S1-FP8作为新一代开源科学多模态模型正式登场。该模型基于2350亿参数的MoE语言模型（Qwen3）与60亿参数的视觉编码器（InternViT）构建，通过5万亿 tokens 的多模态数据预训练（含2.5万亿科学领域专用数据），实现了通用任务能力与科学推理性能的双重突破。其创新的动态分词器设计，使模型能够原生理解分子结构、蛋白质序列等专业数据格式

黎连研Shana

306人浏览 · 2025-10-29 02:18:34

黎连研Shana · 2025-10-29 02:18:34 发布

重磅发布：Intern-S1-FP8——开源科学多模态模型的算力革命

【免费下载链接】Intern-S1-FP8 项目地址: https://ai.gitcode.com/hf_mirrors/internlm/Intern-S1-FP8

模型概述：重新定义开源AI的科学能力边界

如上图所示，Intern-S1的品牌视觉设计融合了科技蓝与活力橙的配色方案，卡通科研人员形象手持分子模型与代码片段，直观展现了模型在科学研究场景的应用定位。这一视觉标识不仅强化了品牌记忆点，更为科研人员提供了亲切友好的技术形象认知。

性能解析：横跨通用与专业领域的全面领先

Intern-S1-FP8在20余项权威 benchmark 中展现出卓越性能，尤其在科学推理领域实现了开源模型的历史性突破。在MMLU-Pro（83.5分）、MMMU（77.7分）等通用智能评测中稳居开源榜首，而在ChemBench（83.4分）、MatBench（75.0分）等专业科学评测中更是超越部分闭源商业模型。值得关注的是，其在MathVista（81.5分）和SFE（44.3分）评测中创下所有模型最佳成绩，验证了其在数学可视化问题与特殊信号分析等特殊场景的独特优势。

性能优势的背后是创新的混合精度训练技术，FP8量化版本使模型显存占用降低50%，在H200显卡上仅需2卡即可部署，而推理速度提升40%。通过OpenCompass与VLMEvalkit标准化评测框架，所有结果均经过严格复现验证，确保了性能数据的可靠性与可比性。

快速上手：多模态交互的极简实现

核心参数配置

为获得最佳生成效果，官方推荐采用以下采样参数组合：

top_p = 1.0（核采样概率阈值）
top_k = 50（候选词数量限制）
temperature = 0.7（随机性控制）
min_p = 0.0（最小概率过滤）

多模态输入示例

文本交互场景下，通过Transformers库可快速实现科学问答：

from transformers import AutoProcessor, AutoModelForCausalLM
import torch

model_name = "internlm/Intern-S1-FP8"
processor = AutoProcessor.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto", torch_dtype="auto", trust_remote_code=True)

messages = [{"role": "user", "content": [{"type": "text", "text": "解释量子隧穿效应的原理及其在扫描隧道显微镜中的应用"}]}]
inputs = processor.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt").to(model.device)
generate_ids = model.generate(**inputs, max_new_tokens=32768)
print(processor.decode(generate_ids[0], skip_special_tokens=True))

图像解析功能支持科研图表理解，代码示例如下：

messages = [{"role": "user", "content": [
    {"type": "image", "url": "https://example.com/protein_structure.png"},
    {"type": "text", "text": "分析该蛋白质的二级结构组成及活性位点分布"}
]}]
inputs = processor.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt").to(model.device)
generate_ids = model.generate(**inputs, max_new_tokens=32768)

视频分析需先安装decord解码库（pip install decord），可实现实验过程解析等复杂任务。

部署方案：企业级服务的弹性架构

硬件需求参考

模型版本	A100需求	H800需求	H200需求
标准版	8卡	8卡	4卡
FP8版	-	4卡	2卡

推理框架支持

LMDeploy（≥0.9.2） 部署命令：

lmdeploy serve api_server internlm/Intern-S1-FP8 --reasoning-parser intern-s1 --tool-call-parser intern-s1 --tp 4

vLLM（≥0.10.1） 部署命令：

vllm serve internlm/Intern-S1-FP8 --tensor-parallel-size 4 --trust-remote-code

SGLang框架支持正在开发中，用户可关注官方PR获取最新进展。

高级特性：科研场景的深度优化

工具调用能力

内置的工具调用机制支持与科学计算软件无缝集成，以下示例展示如何实现天气预报数据获取：

tools = [{
    "type": "function",
    "function": {
        "name": "get_temperature_date",
        "parameters": {
            "type": "object",
            "properties": {
                "location": {"type": "string"},
                "date": {"type": "string"}
            },
            "required": ["location", "date"]
        }
    }
}]

# 工具调用流程包含请求生成→函数执行→结果整合三个步骤
# 完整代码示例参见官方技术文档

思维模式切换

模型默认启用思维链推理模式（enable_thinking=True），适用于复杂问题求解；在需要快速响应的场景下，可通过API参数动态关闭：

# LMDeploy服务调用示例
response = client.chat.completions.create(
    model=model_name,
    messages=messages,
    extra_body={"enable_thinking": False}  # 关闭思维链生成
)

这种双模式设计使模型既能处理需要多步推理的科学问题，又能满足实时问答的效率需求，实现了智能与速度的灵活平衡。

未来展望：开源科学生态的建设者

Intern-S1-FP8的发布标志着开源AI在科学研究领域正式进入实用阶段。通过技术报告中详述的13项创新技术，模型不仅提供强大工具，更开放了完整的训练范式与优化策略。社区开发者可通过GitHub仓库参与模型迭代，Discord与微信交流群已汇聚全球5000+科研人员，形成活跃的技术讨论生态。

随着模型在材料发现、药物设计等领域的深入应用，Intern-S1-FP8正逐步成为连接人工智能与基础科学的关键桥梁。其开源特性打破了科研工具的访问壁垒，使小型实验室也能获得顶尖AI能力，这将加速跨学科创新，推动科学发现的普及化进程。未来团队计划拓展3D分子结构建模与实时实验数据处理能力，持续强化模型在科研全流程中的赋能作用。

【免费下载链接】Intern-S1-FP8 项目地址: https://ai.gitcode.com/hf_mirrors/internlm/Intern-S1-FP8