工行x上交大发布多智能体研究成果，通过群体智能刷新翻译新高度！

深耕金融科技前沿，聚焦金融场景需求，致力于大模型算法的研究、研发、设计、训练与评估，建设行业领先的语言与多模态金融大模型。我们坚持自主创新，围绕“全栈自主可控、全面技术领先、全域场景赋能、全链安全防护”目标，打造集基建、算力、算法、数据、工具、安全、应用与生态于一体的“工银智涌”AI大模型品牌。为了验证多轮翻译机制的有效性，论文在Qwen2.5-14B和32B两款模型上做了多语言对比实验，如图3所

zenRRan

339人浏览 · 2025-07-18 16:59:05

zenRRan · 2025-07-18 16:59:05 发布

2025年，多智能体（Multi-agent）系统正成为全球大模型研发的新高地。最新研究表明，人工智能的突破正从单一模型的“更大更强”转向智能体间的协作与集体智慧。Anthropic 在最新研究博客^[1]中首次披露其多智能体系统架构，强调分工与协作才是推动复杂任务质变的核心动力，正如人类社会的指数级发展离不开集体智慧的涌现。

顺应这一趋势，工商银行大数据和人工智能实验室联合上海交通大学人工智能学院，推出了多智能体翻译系统 TACTIC。

以认知翻译学（Cognitive Translation Studies）为理论指导，在相同模型配置下，TACTIC可显著提升翻译效果，尤其在小模型下提升更为明显。

以DeepSeek-V3作为后台模型时，TACTIC在所有测试任务中均超越了GPT-4.1和DeepSeek-R1，斩获SOTA成绩！

来自：ICBC, Big Data&AI Lab

6个智能体，让翻译更有“人味”

认知翻译学（Cognitive Translation Studies）认为：人类翻译靠的不只是语言能力，更是一整套认知系统的默契配合。

比如：

是该直译还是意译？（认知策略）
要不要查点资料，先了解一下背景再决定怎么翻？（语境认知）
翻译完毕后还要不要再检查润色？（认知加工）

那么，能不能把这些“译者心智活动”拆成模块，让智能体来模拟？

这正是TACTIC的核心思路。它是由6个智能体组成的专业翻译团队，每个智能体都基于特定的认知角色构建：

DraftAgent：负责多风格起草，直译、意译、自由翻译全都来一遍；
RefinementAgent：综合三种风格的草稿翻译，生成改进版译文，确保语义风格都在线；
EvaluationAgent：基于“信、达、雅”三维标准生成译文反馈；
ScoreAgent：结合上一步的反馈信息给当前译文打分，分数达到阈值则输出，否则进入下一轮优化；
ResearchAgent：从原始文本抽取关键词，构造术语词典，模拟译者检索行为；
ContextAgent：提取上下文线索，让翻译更贴合语境和表达预期。

认知翻译学（CTS）概念与 TACTIC 智能体的映射关系如下表所示。

它们之间协作的过程，可以简单理解为两套流程：快翻+慢磨, 翻译也讲“认知节奏”。

基础工作流是第一阶段：起草—润色—评估—打分，够好就收工，适合普通文本翻译。

复杂工作流则更像翻译高手的“二刷”流程：一旦得分不达标，系统自动调用ResearchAgent和ContextAgent，查资料、补语境，重起草、再润色、再评估——直到满意为止。

TACTIC让大模型不再“蒙着头翻译”，而是在认知科学的指引下反复打磨每一句话。

刷新多项翻译成绩

论文在多语种基准集FLORES-200 和 WMT24上，采用XCOMET（有参考）和COMETKIWI-23（无参考）两项主流翻译评估指标，对 TACTIC 进行了全面评测。实验结果表明，在相同模型配置下，TACTIC 能显著提升翻译效果，且提升幅度在小模型下更为明显。以 DeepSeek-V3 作为后台模型时，TACTIC 在所有任务中均超越了 GPT-4.1 和 DeepSeek-R1，达到了当前最优（SOTA）水平。

简而言之：只要模型不掉队，TACTIC 就能帮它再上一个台阶。

为了验证多轮翻译机制的有效性，论文在Qwen2.5-14B和32B两款模型上做了多语言对比实验，如图3所示，相比首轮翻译，最终翻译效果显著增加，这验证了智能体翻译在鲁棒性与稳定性方面的优势。

在央行货币政策执行报告的案例中，TACTIC 通过多智能体协作，逐步修正术语表达、语境与风格偏差。每次迭代都比前一轮“更精准、更通顺”，最终生成贴合专业领域表达的译文。这验证了 TACTIC 强大的领域适应能力。

下面是一个政府公告翻译案例，来源于国务院新闻办公室官网，后端模型为Qwen2.5-14B-Instruct。

对比TACTIC翻译和Zero-shot结果，可以发现TACTIC译文结构更清晰，表达更自然，也更符合行政公文风格。

下图4是TACTIC翻译流程的可视化分析。

以认知翻译理论为指导，TACTIC 让翻译过程更加人性化，不仅准确，还更优雅。从架构设计到实验验证，这一框架展现了多智能体系统在复杂语言任务中的巨大潜力，也为大模型时代的翻译技术打开了全新视角。

另外，本系统还配备了完整的在线服务框架，采用 Quart 异步后端和 Gradio 前端，支持工业级本地化部署，开箱即用。

作者介绍

论文第一作者李为亚，目前在工商银行大数据和人工智能实验室担任研究员，研究方向包括金融领域的大语言模型后训练、强化学习和AI Agent等。

62ad70b93446fe6939277b60429c3d17

通信作者为上海交通大学人工智能学院的助理教授张林峰。

论文标题：TACTIC: Translation Agents with Cognitive-Theoretic Interactive Collaboration
论文地址：https://arxiv.org/abs/2506.08403
项目代码：https://github.com/weiyali126/TACTIC

诚聘英才

工商银行大数据和人工智能实验室深耕金融科技前沿，聚焦金融场景需求，致力于大模型算法的研究、研发、设计、训练与评估，建设行业领先的语言与多模态金融大模型。我们坚持自主创新，围绕“全栈自主可控、全面技术领先、全域场景赋能、全链安全防护”目标，打造集基建、算力、算法、数据、工具、安全、应用与生态于一体的“工银智涌”AI大模型品牌。

欢迎有志于金融领域人工智能与大模型前沿技术的同学加入我们！请登录工商银行人才招聘官网（https://job.icbc.com.cn），搜索“软件开发中心”，选择“软件开发中心（上海）-科技菁英-人工智能技术研发岗”投递简历。如应聘算法工程师岗位，请在总行官网报名后，将个人简历及报名意向发送至 syzhp@sdc.icbc.com.cn 邮箱备案。期待与你共创金融AI未来！

参考资料

[1]

https://www.anthropic.com/engineering/built-multi-agent-research-system: "built-multi-agent-research-system"