工行x上交大发布多智能体研究成果,通过群体智能刷新翻译新高度!
深耕金融科技前沿,聚焦金融场景需求,致力于大模型算法的研究、研发、设计、训练与评估,建设行业领先的语言与多模态金融大模型。我们坚持自主创新,围绕“全栈自主可控、全面技术领先、全域场景赋能、全链安全防护”目标,打造集基建、算力、算法、数据、工具、安全、应用与生态于一体的“工银智涌”AI大模型品牌。为了验证多轮翻译机制的有效性,论文在Qwen2.5-14B和32B两款模型上做了多语言对比实验,如图3所
2025年,多智能体(Multi-agent)系统正成为全球大模型研发的新高地。最新研究表明,人工智能的突破正从单一模型的“更大更强”转向智能体间的协作与集体智慧。Anthropic 在最新研究博客[1]中首次披露其多智能体系统架构,强调分工与协作才是推动复杂任务质变的核心动力,正如人类社会的指数级发展离不开集体智慧的涌现。
顺应这一趋势,工商银行大数据和人工智能实验室联合上海交通大学人工智能学院,推出了多智能体翻译系统 TACTIC。
以认知翻译学(Cognitive Translation Studies)为理论指导,在相同模型配置下,TACTIC可显著提升翻译效果,尤其在小模型下提升更为明显。
以DeepSeek-V3作为后台模型时,TACTIC在所有测试任务中均超越了GPT-4.1和DeepSeek-R1,斩获SOTA成绩!
来自:ICBC, Big Data&AI Lab
6个智能体,让翻译更有“人味”
认知翻译学(Cognitive Translation Studies)认为:人类翻译靠的不只是语言能力,更是一整套认知系统的默契配合。
比如:
-
是该直译还是意译?(认知策略)
-
要不要查点资料,先了解一下背景再决定怎么翻?(语境认知)
-
翻译完毕后还要不要再检查润色?(认知加工)
那么,能不能把这些“译者心智活动”拆成模块,让智能体来模拟?
这正是TACTIC的核心思路。它是由6个智能体组成的专业翻译团队,每个智能体都基于特定的认知角色构建:
-
DraftAgent:负责多风格起草,直译、意译、自由翻译全都来一遍;
-
RefinementAgent:综合三种风格的草稿翻译,生成改进版译文,确保语义风格都在线;
-
EvaluationAgent:基于“信、达、雅”三维标准生成译文反馈;
-
ScoreAgent:结合上一步的反馈信息给当前译文打分,分数达到阈值则输出,否则进入下一轮优化;
-
ResearchAgent:从原始文本抽取关键词,构造术语词典,模拟译者检索行为;
-
ContextAgent:提取上下文线索,让翻译更贴合语境和表达预期。
认知翻译学(CTS)概念与 TACTIC 智能体的映射关系如下表所示。
它们之间协作的过程,可以简单理解为两套流程:快翻+慢磨, 翻译也讲“认知节奏”。
基础工作流是第一阶段:起草—润色—评估—打分,够好就收工,适合普通文本翻译。
复杂工作流则更像翻译高手的“二刷”流程:一旦得分不达标,系统自动调用ResearchAgent和ContextAgent,查资料、补语境,重起草、再润色、再评估——直到满意为止。
TACTIC让大模型不再“蒙着头翻译”,而是在认知科学的指引下反复打磨每一句话。
刷新多项翻译成绩
论文在多语种基准集FLORES-200 和 WMT24上,采用XCOMET(有参考)和COMETKIWI-23(无参考)两项主流翻译评估指标,对 TACTIC 进行了全面评测。实验结果表明,在相同模型配置下,TACTIC 能显著提升翻译效果,且提升幅度在小模型下更为明显。以 DeepSeek-V3 作为后台模型时,TACTIC 在所有任务中均超越了 GPT-4.1 和 DeepSeek-R1,达到了当前最优(SOTA)水平。
简而言之:只要模型不掉队,TACTIC 就能帮它再上一个台阶。
为了验证多轮翻译机制的有效性,论文在Qwen2.5-14B和32B两款模型上做了多语言对比实验,如图3所示,相比首轮翻译,最终翻译效果显著增加,这验证了智能体翻译在鲁棒性与稳定性方面的优势。
在央行货币政策执行报告的案例中,TACTIC 通过多智能体协作,逐步修正术语表达、语境与风格偏差。每次迭代都比前一轮“更精准、更通顺”,最终生成贴合专业领域表达的译文。这验证了 TACTIC 强大的领域适应能力。
下面是一个政府公告翻译案例,来源于国务院新闻办公室官网,后端模型为Qwen2.5-14B-Instruct。
对比TACTIC翻译和Zero-shot结果,可以发现TACTIC译文结构更清晰,表达更自然,也更符合行政公文风格。
下图4是TACTIC翻译流程的可视化分析。
以认知翻译理论为指导,TACTIC 让翻译过程更加人性化,不仅准确,还更优雅。从架构设计到实验验证,这一框架展现了多智能体系统在复杂语言任务中的巨大潜力,也为大模型时代的翻译技术打开了全新视角。
另外,本系统还配备了完整的在线服务框架,采用 Quart 异步后端和 Gradio 前端,支持工业级本地化部署,开箱即用。
作者介绍
论文第一作者李为亚,目前在工商银行大数据和人工智能实验室担任研究员,研究方向包括金融领域的大语言模型后训练、强化学习和AI Agent等。
通信作者为上海交通大学人工智能学院的助理教授张林峰。
-
论文标题:TACTIC: Translation Agents with Cognitive-Theoretic Interactive Collaboration
-
论文地址:https://arxiv.org/abs/2506.08403
-
项目代码:https://github.com/weiyali126/TACTIC
诚聘英才
工商银行大数据和人工智能实验室深耕金融科技前沿,聚焦金融场景需求,致力于大模型算法的研究、研发、设计、训练与评估,建设行业领先的语言与多模态金融大模型。我们坚持自主创新,围绕“全栈自主可控、全面技术领先、全域场景赋能、全链安全防护”目标,打造集基建、算力、算法、数据、工具、安全、应用与生态于一体的“工银智涌”AI大模型品牌。
欢迎有志于金融领域人工智能与大模型前沿技术的同学加入我们!请登录工商银行人才招聘官网(https://job.icbc.com.cn),搜索“软件开发中心”,选择“软件开发中心(上海)-科技菁英-人工智能技术研发岗”投递简历。如应聘算法工程师岗位,请在总行官网报名后,将个人简历及报名意向发送至 syzhp@sdc.icbc.com.cn 邮箱备案。期待与你共创金融AI未来!
参考资料
[1]
https://www.anthropic.com/engineering/built-multi-agent-research-system: "built-multi-agent-research-system"


更多推荐
所有评论(0)