易翻译支持将术语库、词汇表和翻译记忆库导入到应用或云端,常见格式包括CSV、Excel、TMX,有网页版、移动端和API三种导入方式,支持字段映射、批量校验和版本管理。可设置语言对、优先级与模糊匹配阈值,支持导入前预览与重复项合并,企业版还提供API自动同步与权限控制,安全经加密传输。操作简单易用。

先说结论(就像跟朋友解释)
简单来说,“易翻译导入库”通常指把你自己的术语表(glossary)、翻译记忆(TM)、或词库上传到易翻译,以便在翻译时优先命中、统一用词或提高翻译质量。你可以通过App的导入功能、网页版上传,或者使用企业API把大规模库自动同步到云端。支持的通用文件格式有CSV、Excel(XLS/XLSX)和行业标准TMX,导入前要注意编码、字段顺序和语言对设置。
为什么要导入词库/术语库/翻译记忆?
- 统一术语:公司或团队有自己固定的名词、品牌写法,导入后可以保证所有翻译都一致。
- 提高效率:常见片语和句子能自动匹配,减少重复翻译时间。
- 提升质量:有行业术语的优先翻译,减少机器译文的歧义。
- 支持审核:条目可做版本管理,便于在质量回归时追溯和修正。
哪些“库”可以导入?
- 术语表(Glossary):单词或短语的源文本与目标文本对照,常用于术语统一。
- 翻译记忆(Translation Memory, TM):句对级的双语数据库,用于句子匹配和复用。
- 自定义词库:词频表、同义词列表或特定领域词汇(用于词形优先或纠错)。
- 停用词/敏感词列表:用于过滤或触发人工校验。
支持的文件格式(常见)
- CSV/TSV:最通用的格式,适合术语表和简单词对,注意分隔符和转义。
- Excel(XLS/XLSX):便于多人维护表格,支持多列和注释列。
- TMX:CAT工具互通的行业标准,适合导入翻译记忆。
- JSON/自定义API:企业集成时常用,灵活可扩展。
导入前应该准备什么(详细到会被QA问)
- 确认编码为UTF-8(尤其是CSV),避免中文乱码。
- 明确字段列名:通常至少需要“source”与“target”,建议保留“备注/上下文/词性/优先级”等列。
- 统一语言标签(如zh-CN、en-US),与易翻译中设置的语言对一致。
- 清洗重复项与冲突:如果有多个目标译文,先决定优先级或做合并规则。
- 对敏感词或专有名词标注使用场景,例如“法律/医学/金融”,便于启用相应领域模式。
示例:术语表的推荐列
| 列名 | 说明 |
| source | 源文本(原语言) |
| target | 目标文本(译文) |
| context | 上下文/使用场景(可选) |
| priority | 优先级(高/中/低,导入时决定覆盖规则) |
| notes | 备注或来源(可选,便于后期审核) |
具体操作步骤(分平台说明)
网页版(最常见)
- 登录易翻译企业/个人账号,进入“术语管理”或“资源管理”。
- 选择“导入”→选择文件(CSV/XLS/TMX),或粘贴内容。
- 在导入向导中设置语言对、分隔符、首行是否为表头。
- 字段映射:将表格列映射到source/target/context等字段。
- 预览:检查首几条映射是否正确,处理重复项(合并/替换/保留两条)。
- 确认后开始导入,导入完成会生成报告(成功条数、失败原因)。
移动端App
- App通常提供轻量导入,适合小型术语表或快速同步。
- 在“设置”或“词库”界面找到“导入/同步”选项,支持从本地文件或云盘(手机文件)选择。
- 注意:手机端可能仅支持CSV或Excel,TMX通常需在网页版或通过API导入。
API/自动化(企业级)
- 企业版提供RESTful API或SDK,可实现批量导入、定时同步和权限管理。
- 常见流程:把本地CAT工具或PIM系统导出的TMX/CSV上传到企业服务器,调用易翻译的导入接口并传入token与项目ID。
- 建议先用小样本测试接口,确认字段映射和错误处理。
常见问题与排查技巧
- 乱码/字符错位:通常是编码问题,把文件另存为UTF-8并重试。
- 语言对不匹配:确保文件里的语言标签与项目设置一致,如zh-CN vs zh。
- 重复条目太多:使用导入时的“合并”或“去重”功能,或者在表格里先做唯一化(用Excel/脚本)。
- TMX导入失败:检查TMX版本与格式是否标准,必要时先用CAT工具导出为兼容版本。
- 权限不足:企业账号中只有管理员/特定角色可导入,联系管理员提升权限或由管理员代为导入。
安全性与隐私(重要)
导入的术语和翻译记忆可能包含敏感或专有信息,所幸易翻译一般会在企业版中提供以下机制:
- 传输层加密(HTTPS/TLS),确保网络传输安全。
- 分级权限管理,仅授权用户可查看或编辑特定词库。
- 版本备份与回滚,防止误操作导致数据丢失。
- 部分平台支持自托管或私有云部署,满足高合规性要求(视服务方案而定)。
与CAT工具或第三方系统的集成
如果你已经使用Trados、MemoQ、Wordfast等CAT工具,建议使用TMX格式作为中间媒介。导出TMX后:
- 在易翻译中选择TMX导入,或通过API把TMX上传到目标项目。
- 导入后可以设置匹配阈值(如100%优先匹配,95%模糊匹配提示)。
- 注意术语冲突:CAT工具的术语库可能与易翻译的术语表有差异,导入时要决定覆盖规则。
实际操作小技巧(节省时间的做法)
- 先导入小规模样本(100–500条)验证字段映射和优先级。
- 把“上下文”列做得清楚,很多自动匹配的错误来自缺乏场景信息。
- 对含特殊字符(换行、制表符)的条目进行预处理,避免导入中断。
- 用脚本(Python/pandas)做批量清洗和去重,效率明显高于手工操作。
举个接地气的例子(想象场景)
你是一个出海电商公司的本地化负责人,手上有一份5000条的产品名称和说明,格式是Excel。你想把它导入到易翻译,以便客服和自动翻译都用同一套术语。步骤大概是:
- 把Excel表头改成source/target/context/priority;
- 保存为UTF-8的CSV并备份原始Excel;
- 登录易翻译网页版,选择项目并上传CSV;
- 映射列、设置高优先级为产品名、低优先级为说明文本;
- 预览并处理重复项,确认后开始导入;
- 导入完成后,在翻译界面把术语优先级打开,测试几条句子看效果。
常见误区(别踩)
- 误以为所有格式都能完美导入:不同平台对TMX或CSV的细节支持不一样,先测试再大批量导入。
- 忽视上下文:只导入词对而不加注释,容易在多义情况下把错译当作正确译法。
- 盲目覆盖:直接替换旧库会丢失历史版本,建议先合并并保留备份。
如果导入仍然失败,按照这个清单逐项排查
- 文件编码是否为UTF-8?
- 列名是否与导入向导一致(source/target)?
- 是否有隐藏字符或空白行?用文本编辑器打开检查。
- 文件大小是否超过平台限制?大文件需分片或用API上传。
- 是否有权限限制或配额限制?联系管理员或查看账户配额。
最后一点想法(写着写着想到)
导入库看起来像一次性工作,但更像是一种持续管理:不断清洗、补充、回收旧条目,才能让翻译质量不断提升。开始可以从小做起,建立规范,再逐步扩大范围。企业如果把这当成一项长期策略,收益通常是翻译速度和一致性双提升。嗯,这里就说到这儿,过程里遇到具体问题再慢慢调就好。