【九章智算云重磅上新】10 倍压缩率 + 97% 精度！DeepSeek-OCR 让文档处理进入「秒级时代」

li_guan_guan

29人浏览 · 2025-10-23 10:27:21

li_guan_guan · 2025-10-23 10:27:21 发布

继大模型开源浪潮后，DeepSeek 团队最新推出的DeepSeek-OCR 3B模型再次颠覆 OCR 行业！九章云极作为国内领先的智算云服务商，我们率先将DeepSeek-OCR集成至九章智算云平台，用户无需复杂部署，一键即可调用这一颠覆性工具，实现从图像到结构化文档的「闪电级」转换。

一、DeepSeek-OCR：重新定义文档处理范式

1. 技术突破：从「像素识别」到「智能理解」

DeepSeek-OCR 创新性地通过光学二维映射来压缩长上下文，实现高效「看图识文」，替代传统大模型“逐字阅读”的机制，在 OmniDocBench 权威评测中，仅用100 个视觉 Token即超越 GOT-OCR2.0（256 Token），并在 800 Token 内性能碾压 MinerU2.0（近 7000 Token）。这种「以图载文」的技术路径，使文档处理效率提升 10 倍，单张 A100-40G 显卡每日可处理超 20 万页文档，真正实现「算力不变，产能翻倍」。

图自GitHub - deepseek-ai/DeepSeek-OCR: Contexts Optical Compression

2. 全场景覆盖：从实验室到全球化办公

学术科研：精准解析数学公式、化学方程式，支持低分辨率实验报告还原；
跨国企业：100 种语言混合文档一键转换，阿拉伯语、日语等复杂文字识别准确率达 97%；
金融医疗：模糊票据、手写病历智能提取，结构化输出兼容电子档案系统；
教育出版：多版本教材排版还原，Markdown 格式直接对接数字出版流程。

3. 极致成本控制：用更少资源做更多事

硬件成本：单卡日处理量相当于传统 OCR 的 5 倍，H800A 显卡实测吞吐量提升 30%；
时间成本：从部署到产出仅需 5 分钟，彻底告别繁琐环境配置；
开发成本：开源协议支持商业用途，API 调用零费用，企业级定制开发周期缩短 60%。

立即体验DeepSeek OCR：三步开启「算力即服务」新时代

操作指南：

Step 1：注册九章智算云账号 → 选择「云容器实例」；

Step 2：创建「云容器实例」 → 配置「北京 5 区高性能集群」 +「GPU-H800A-1 卡」+「应用镜像 - deepseek-ocr 镜像」 + 环境变量；

Step 3：进入容器，执行两行代码启动推理，输入图像 / PDF 即可获得带格式的输出。再执行一行代码启动模型推理服务，通过restful api可从本地调用模型

# 进入代码目录
cd ~/DeepSeek-OCR/DeepSeek-OCR-master/DeepSeek-OCR-vllm

# 可修改config.py中的输入输出文件与位置，当前代码中为示例
# 输入文件: INPUT_PATH = 'input/DeepSeek_OCR_paper.pdf'
# 模型输出路径：OUTPUT_PATH = 'output'

# 运行脚本启动推理（以图像为例）
python3 run_dpsk_ocr_pdf.py

# 【可选】启动模型推理服务
python3 run_dpsk_ocr_service.py

更多手把手详细流程引导，详见：CLI - deepseek ocr使用手册

三、九章智算云：为什么选择我们作为 DeepSeek-OCR 的最佳搭档？

九章智算云凭借三大核心优势，为 DeepSeek-OCR 的落地提供了从算力到场景的全链路保障：

可计量可流通：面向弹性算力需求，打造可复制、可规模化的 AIDC 能力；定义 1 度算力，实现算力的异构标准化计量，从而在算力网络中可流通，可交易。
低成本：打造“按需取用、按度计量”的全新算力消费模式，强大的自动弹性伸缩与灵活适配能力，避免资源闲置，实现“零浪费“；同时用户无需投入建设与运维成本，轻量接入即可用，综合算力成本较传统模式直降 38%。
低门槛：提供低门槛 AI 工具，降低大模型开发与应用的技术壁垒。基于serverless架构打造，用户无需关注资源底层细节与运维细节，只需关注业务逻辑即可；同时平台提供模块化、标准化的工具接口，易于接入社区组件和第三方环境。