JSON聊天记录无损翻译与术语保留

最后更新:2026-03-08 • 预计阅读时间:3分钟

使用翻译云的API或SDK,通过指定JSON路径(JSON Path)精准定位待翻译的文本节点,在调用翻译引擎时开启“结构保护”模式,即可实现内容翻译而结构无损。

1 上传JSON文件并配置解析规则

登录翻译云工作台,在“文档翻译”模块点击【上传文件】,选择您的JSON文件。上传后,在右侧“文件解析设置”面板中,将【内容提取模式】设置为『JSON Path』。在下方输入框中,填入指向对话内容数组的路径,例如:$.conversations[*].message$.messages[?(@.type=='text')].content,以精准框定需翻译的文本字段。

2 加载术语库并设置翻译引擎

在项目设置页面的“术语与风格”选项卡下,点击【+ 添加术语库】,上传或选择您预先准备好的客服专业术语表(CSV或TBX格式)。返回翻译任务页,在“翻译引擎”下拉菜单中选择支持术语强制的引擎(如“NMT-专业领域”)。

3 执行翻译并下载双语对照结果

确认设置无误后,点击页面底部的【开始翻译】按钮。任务完成后,在结果文件列表中,找到您的文件,点击【下载】按钮。选择“双语对照JSON”或“仅目标语言JSON”格式进行下载,系统将输出一个保持原键名和结构、仅目标文本被替换为中文的新JSON文件。

在系统高级设置中,将【版式重构引擎】设为『严格保留』,并勾选【强制启用专业术语表(Glossary)】。

常见操作避坑指南

Q:JSON Path配置后,预览发现系统错误地选中了时间戳、用户ID等不应翻译的字段,导致翻译失败或乱码。
A:请检查并优化您的JSON Path表达式。使用过滤条件精确限定属性,例如将 $.messages[*].content 修改为 $.messages[?(@.type=='text')].content,确保只选取类型为“text”的消息内容。翻译前务必使用工作台的“内容预览”功能进行确认。
Q:翻译后的JSON文件在代码编辑器中打开,发现中文字符出现了Unicode转义符(如\u4e2d\u6587),影响可读性。
A:此问题源于JSON序列化工具的配置。请在下载翻译结果时,于高级选项中将【字符编码输出】设置为『UTF-8(无BOM)』,并勾选【确保可读性(禁用ASCII转义)】选项。或使用如JSON.stringify(data, null, 2)这样的代码进行格式化输出。
⚠️ 技术规范与免责声明:本文档提供的配置指令与操作步骤基于翻译云当前最新版本。受限于源文档的加密级别、扫描件分辨率及第三方软件(如 InDesign/WPS)的底层排版逻辑差异,最终翻译与排版还原效果可能存在合理波动。涉及机密合同与财务数据的处理,请务必在工作台中开启「阅后即焚」或使用企业级私有化部署方案。