为了便于非母语者的理解,在翻译实践中,需要设置命名实体的特别规则。

  • 命名实体:主要包括专有名词或名称,例如组织名称、名人、名言、著名地名、图书(圣经、经典)、电影名称、中文成语典故、歇後語和寓言短语等;

翻译规则

源语言是原文,目标语言是被翻译的译文。

普通命名实体:

  • 应该保留一份原文、罗马拼音,一份对应翻译的目标语言。
  • 译文结构:原文、罗马拼音和译文并列,“original_text (Chinese_pinyin/Romanization) translated_text”。

案例:

  • 中文地名、人名和图书:成都、李子柒、《道德经》
  • 英文译文:成都 (Chéngdū)Chengdu、李子柒 (Lǐ Zǐqī)Ziqi Li、《道德经》(Dào Dé Jīng)Tao Te Ching.“The Classic of the Way and Virtue”

我们大多数时候,只会做简单的普通命名实体翻译,不会解释太多。

特别命名实体

  • 对于中文成语典故、歇後語和寓言短语,则还需要增加额外的解释,因为太简单的成语,总是需要更多语言做解释,才可能让其他母语者看懂。

案例:

  • 中文成语:狐假虎威
  • 英文译文:狐假虎威 (hú jiǎ hǔ wēi)The fox exploits the tiger’s might。

Explanation: “Feigning authority through association with power.”, “Using borrowed prestige to one’s advantage.”, “borrowing power from another”, or “riding on the coattails of someone powerful”.

提示词prompt

请将以下内容从{source_lang}翻译成{target_lang}。这是{file_type}文件。

关键要求:

  1. 严格保留源文件格式:

    • 保持源文件的所有原始格式、语法标记和结构
    • 对于Markdown文件,保留所有标记(#、*、>等)
    • 对于YAML格式的头部信息,保持英文关键字(title, date, description, categories, tags等)不变,仅翻译其值
  2. 命名实体特殊处理:

    • 对于命名实体(专有名词或名称),使用以下格式:原文 (拼音/罗马化) 译文
    • 适用于:组织名称、名人、名言、人名、地名、图书名称、电影名称、成语典故、歇后语和寓言短语
    • 示例中文→英文:狐假虎威 (hú jiǎ hǔ wēi) The fox exploits the tiger's might
  3. 成语和典故的额外处理:

    • 对于中文成语、歇后语和寓言短语,在译文后可添加简短解释
    • 示例中文→英文:[狐假虎威 (hú jiǎ hǔ wēi)] The fox exploits the tiger's might - Borrowing power from another, riding on the coattails of someone powerful
  4. 翻译风格:

    • 保持原文的语气和风格
    • 确保翻译在目标语言中文化适当
    • 选择目标语言的国家和地理文化习俗中最适合、最接近的对应翻译。

基本概念

命名实体(Named Entities)

在翻译和语言处理领域,一些专有名词或名称通常定义为命名实体(Named Entities)。命名实体主要指那些在文本中表示特定事物的名称,包括但不限于以下类别:

人物:如名人、历史人物(例如,孔子 Confucius)。

地名:如著名的城市、国家(例如,北京 Beijing,黄山 Mount Huang)。

组织名称:如公司、机构、政府组织(例如,联合国 United Nations)。

书籍与经典:如《圣经》The Bible、《论语》The Analects。

电影与作品名称:如《卧虎藏龙》Crouching Tiger, Hidden Dragon。

成语与典故:如“狐假虎威”(The fox exploits the tiger’s might)。

歇后语与俗语:如“姜还是老的辣”(Old ginger is hotter than young ginger)。

在自然语言处理(NLP)领域,命名实体识别(NER, Named Entity Recognition)是一项核心任务,目标是从文本中准确地提取这些命名实体,并对其进行分类。例如,将“长城”识别为地名,将“莎士比亚”识别为人物。

罗马(拉丁)字母

罗马(拉丁)字母转写,或“罗马化”(Romanization)拼音。

是指将其他种类的语言,以罗马(拉丁)字母的形式进行转写或标注。让不熟悉原文字母系统的读者能够通过罗马字母来了解该语言的发音或意义。

特点与用途:

标准化发音:罗马化帮助学习者了解目标语言的正确发音,例如汉语的“拼音”。

跨语言交流:通过统一的罗马字母系统,语言可以在国际层面更便捷地传播。

技术支持:罗马化在输入法、语言学习软件、地名书写(如护照、地图)等中广泛使用。

例子:

汉语拼音(Pinyin):中文“北京”转写为“Běijīng”。

日语罗马字(Rōmaji):日语“東京”转写为“Tōkyō”。

俄语的拉丁转写(Transliteration):俄语“Москва”转写为“Moskva”。

需要注意的是,罗马化并非直接翻译,而是转写发音的过程,具体规则常因语言的复杂性和背景不同而有所变化。