2026年4月6日 未分类

易翻译导入库?

易翻译支持将术语库、词汇表和翻译记忆库导入到应用或云端,常见格式包括CSV、Excel、TMX,有网页版、移动端和API三种导入方式,支持字段映射、批量校验和版本管理。可设置语言对、优先级与模糊匹配阈值,支持导入前预览与重复项合并,企业版还提供API自动同步与权限控制,安全经加密传输。操作简单易用。

易翻译导入库?

先说结论(就像跟朋友解释)

简单来说,“易翻译导入库”通常指把你自己的术语表(glossary)、翻译记忆(TM)、或词库上传到易翻译,以便在翻译时优先命中、统一用词或提高翻译质量。你可以通过App的导入功能、网页版上传,或者使用企业API把大规模库自动同步到云端。支持的通用文件格式有CSV、Excel(XLS/XLSX)和行业标准TMX,导入前要注意编码、字段顺序和语言对设置。

为什么要导入词库/术语库/翻译记忆?

  • 统一术语:公司或团队有自己固定的名词、品牌写法,导入后可以保证所有翻译都一致。
  • 提高效率:常见片语和句子能自动匹配,减少重复翻译时间。
  • 提升质量:有行业术语的优先翻译,减少机器译文的歧义。
  • 支持审核:条目可做版本管理,便于在质量回归时追溯和修正。

哪些“库”可以导入?

  • 术语表(Glossary):单词或短语的源文本与目标文本对照,常用于术语统一。
  • 翻译记忆(Translation Memory, TM):句对级的双语数据库,用于句子匹配和复用。
  • 自定义词库:词频表、同义词列表或特定领域词汇(用于词形优先或纠错)。
  • 停用词/敏感词列表:用于过滤或触发人工校验。

支持的文件格式(常见)

  • CSV/TSV:最通用的格式,适合术语表和简单词对,注意分隔符和转义。
  • Excel(XLS/XLSX):便于多人维护表格,支持多列和注释列。
  • TMX:CAT工具互通的行业标准,适合导入翻译记忆。
  • JSON/自定义API:企业集成时常用,灵活可扩展。

导入前应该准备什么(详细到会被QA问)

  • 确认编码为UTF-8(尤其是CSV),避免中文乱码。
  • 明确字段列名:通常至少需要“source”与“target”,建议保留“备注/上下文/词性/优先级”等列。
  • 统一语言标签(如zh-CN、en-US),与易翻译中设置的语言对一致。
  • 清洗重复项与冲突:如果有多个目标译文,先决定优先级或做合并规则。
  • 对敏感词或专有名词标注使用场景,例如“法律/医学/金融”,便于启用相应领域模式。

示例:术语表的推荐列

列名 说明
source 源文本(原语言)
target 目标文本(译文)
context 上下文/使用场景(可选)
priority 优先级(高/中/低,导入时决定覆盖规则)
notes 备注或来源(可选,便于后期审核)

具体操作步骤(分平台说明)

网页版(最常见)

  • 登录易翻译企业/个人账号,进入“术语管理”或“资源管理”。
  • 选择“导入”→选择文件(CSV/XLS/TMX),或粘贴内容。
  • 在导入向导中设置语言对、分隔符、首行是否为表头。
  • 字段映射:将表格列映射到source/target/context等字段。
  • 预览:检查首几条映射是否正确,处理重复项(合并/替换/保留两条)。
  • 确认后开始导入,导入完成会生成报告(成功条数、失败原因)。

移动端App

  • App通常提供轻量导入,适合小型术语表或快速同步。
  • 在“设置”或“词库”界面找到“导入/同步”选项,支持从本地文件或云盘(手机文件)选择。
  • 注意:手机端可能仅支持CSV或Excel,TMX通常需在网页版或通过API导入。

API/自动化(企业级)

  • 企业版提供RESTful API或SDK,可实现批量导入、定时同步和权限管理。
  • 常见流程:把本地CAT工具或PIM系统导出的TMX/CSV上传到企业服务器,调用易翻译的导入接口并传入token与项目ID。
  • 建议先用小样本测试接口,确认字段映射和错误处理。

常见问题与排查技巧

  • 乱码/字符错位:通常是编码问题,把文件另存为UTF-8并重试。
  • 语言对不匹配:确保文件里的语言标签与项目设置一致,如zh-CN vs zh。
  • 重复条目太多:使用导入时的“合并”或“去重”功能,或者在表格里先做唯一化(用Excel/脚本)。
  • TMX导入失败:检查TMX版本与格式是否标准,必要时先用CAT工具导出为兼容版本。
  • 权限不足:企业账号中只有管理员/特定角色可导入,联系管理员提升权限或由管理员代为导入。

安全性与隐私(重要)

导入的术语和翻译记忆可能包含敏感或专有信息,所幸易翻译一般会在企业版中提供以下机制:

  • 传输层加密(HTTPS/TLS),确保网络传输安全。
  • 分级权限管理,仅授权用户可查看或编辑特定词库。
  • 版本备份与回滚,防止误操作导致数据丢失。
  • 部分平台支持自托管或私有云部署,满足高合规性要求(视服务方案而定)。

与CAT工具或第三方系统的集成

如果你已经使用Trados、MemoQ、Wordfast等CAT工具,建议使用TMX格式作为中间媒介。导出TMX后:

  • 在易翻译中选择TMX导入,或通过API把TMX上传到目标项目。
  • 导入后可以设置匹配阈值(如100%优先匹配,95%模糊匹配提示)。
  • 注意术语冲突:CAT工具的术语库可能与易翻译的术语表有差异,导入时要决定覆盖规则。

实际操作小技巧(节省时间的做法)

  • 先导入小规模样本(100–500条)验证字段映射和优先级。
  • 把“上下文”列做得清楚,很多自动匹配的错误来自缺乏场景信息。
  • 对含特殊字符(换行、制表符)的条目进行预处理,避免导入中断。
  • 用脚本(Python/pandas)做批量清洗和去重,效率明显高于手工操作。

举个接地气的例子(想象场景)

你是一个出海电商公司的本地化负责人,手上有一份5000条的产品名称和说明,格式是Excel。你想把它导入到易翻译,以便客服和自动翻译都用同一套术语。步骤大概是:

  • 把Excel表头改成source/target/context/priority;
  • 保存为UTF-8的CSV并备份原始Excel;
  • 登录易翻译网页版,选择项目并上传CSV;
  • 映射列、设置高优先级为产品名、低优先级为说明文本;
  • 预览并处理重复项,确认后开始导入;
  • 导入完成后,在翻译界面把术语优先级打开,测试几条句子看效果。

常见误区(别踩)

  • 误以为所有格式都能完美导入:不同平台对TMX或CSV的细节支持不一样,先测试再大批量导入。
  • 忽视上下文:只导入词对而不加注释,容易在多义情况下把错译当作正确译法。
  • 盲目覆盖:直接替换旧库会丢失历史版本,建议先合并并保留备份。

如果导入仍然失败,按照这个清单逐项排查

  • 文件编码是否为UTF-8?
  • 列名是否与导入向导一致(source/target)?
  • 是否有隐藏字符或空白行?用文本编辑器打开检查。
  • 文件大小是否超过平台限制?大文件需分片或用API上传。
  • 是否有权限限制或配额限制?联系管理员或查看账户配额。

最后一点想法(写着写着想到)

导入库看起来像一次性工作,但更像是一种持续管理:不断清洗、补充、回收旧条目,才能让翻译质量不断提升。开始可以从小做起,建立规范,再逐步扩大范围。企业如果把这当成一项长期策略,收益通常是翻译速度和一致性双提升。嗯,这里就说到这儿,过程里遇到具体问题再慢慢调就好。

分享这篇文章:

相关文章推荐

了解更多易翻译相关资讯

专业翻译通讯技术沉淀,专注即时通讯翻译领域