Глоссарии passolo trados translation memory. «Память переводчика», или Что такое Translation Memory

Системы памяти переводов (Translation Memory): концепция и реализации 1. Идеология ТМ-инструментариев 2. Общий принцип ТМ 3. Состав системы ТМ 4. Функции ТМ 5. Обзор основных программ класса Translation Memory: ТРАДОС 3. 0 Deja. Vu SDLX 3. 0 Transit и Term. Star Word. Fisher 4 IBM Translation. Manager 2. 0 6. Преимущества и недостатки ТМ ТМ

Идеология ТМ-инструментариев Макото Нагао, Япония, университет г. Киото. В 1982 г. предложил новую концепцию машинного перевода, которая была основана на утверждении, что тексты должны переводиться по аналогии с текстами, ранее переведенными вручную. М. Нагао назвал свой подход к техническому переводу с английского на русский язык „Example based translation“ (перевод, основанный на примерах). Идея М. Нагао была использована некоторыми Makoto Nagao

Что такое Translation Memory? Translation Memory (ТM) - база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами. Если идентичный или подобный исходному сегмент найден, то этот сегмент отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается перевести только новые сегменты и отредактировать частично совпадающие. Каждое изменение или новый перевод сохраняются в ТМ.

Идеология ТМ-инструментов ТМ-инструменты предназначены для сохранения пар предложений в переводческой базе данных. Каждая такая пара состоит из предложения из оригинала и его технического перевода на другом языке. Возможно размещение фрагментов текста и других форматов превышающих длину предложения или являющихся лишь его частью. Но в автоматическом режиме сохраняются именно предложения, поэтому довольно часто такие программы называют «память предложений» (от англ. Sentence Memory).

Принцип действия ТМ-инструментов ТМ-программы интегрируются с такими офисными программами, как, например, Word. Некоторые средства текста. из них имеют собственные редактирования технического Их интерфейсы мало отличаются от привычных для современного переводчика интерфейсов текстовых редакторов.

Память переводов и вспомогательные программы для перевода Классы: MT (Machine Translation) – автоматический или машинный перевод; программы CAT (Computer-assisted/aided translation) автоматизируют и облегчают труд переводчика в различных его аспектах, реализуют концепцию памяти переводов (translation memory), такие, как Trados, Omega. T, Deja. Vu, Word. Fast и т. п.

Принцип работы современных CAT-программ Программа делит исходный текст на сегменты (как правило, это предложения или части предложений), и переводчик вписывает перевод каждого сегмента прямо под исходным текстом или если текст представлен в виде таблицы - справа от него. Перевод сегмента сохраняется вместе с исходным текстом. Записываются также имя переводчика и дата перевода (что важно для командной работы). К сегменту можно вернуться в любой момент, чтобы проверить или изменить перевод. Программа помещает сегмент в память переводов, так что если он снова встретится в исходном тексте, его перевод подставится из ТМ автоматически. Кроме того, CATпрограмма имеет функцию поиска нечетких соответствий: она обнаруживает сегменты, только частично схожие с уже переведенным (например, совпадающие на 75 %), и дает «подсказки» по их переводу.

Cистема автоматизированного перевода Trados (Традос) Trados - система автоматизированного перевода, разработанная немецкой компанией Trados Gmb. H в 1992 году. Один из мировых лидеров в классе систем Translation Memory (TM, накопитель переводов). Система Trados включает несколько модулей, предназначенных для перевода текстов различного формата: документов Microsoft Word, презентаций Power. Point, текстов в формате HTML и других метаданных, документов Frame. Maker, Inter. Leaf и др. , а также для ведения терминологических баз данных (модуль Multi. Term).

Принцип работы системы Trados Концепция Translation Memory предполагает выявление в переводимом тексте фрагментов, переводы которых уже имеются в базе данных переводов, и за счет этого сокращение объема работы переводчика. Это выявление получило название выравнивания или сопоставления (alignment). Фрагменты, оставшиеся непереведёнными после выравнивания (сопоставления), передаются дальше для ручной обработки переводчику или системе машинного перевода (Machine Translation, MT). Переводчик на этом этапе может выделить вновь переведённые фрагменты и занести новые пары параллельных текстов на двух языках в базу данных. Такая схема наилучшим образом работает на однотипных текстах, где повторяемость словосочетаний достаточно высока.

Основные модули системы Trados * Trados Workbench - основной модуль для перевода документов, интегрируется в оболочку Microsoft Word; * Tag. Editor - модуль для перевода документов в формате HTML, XML и т. п. ; * Win. Align - модуль для создания памяти переводов на основе ранее переведённых двуязычных текстов; * S-Tagger - модуль для перевода документов в формате Frame. Maker и Inter. Leaf; * T-Window - модуль для перевода документов в формате Power. Point; * Multi. Term - модуль для ведения глоссариев; * Extra. Term

Что общего у программ Translation Memory - Сведение – Alignment Обслуживание – Maintenance Терминологический словарь – Terminology Program Текстовый редактор – Document Editor Конкорданс (Связка словоупотребле-ния с контекстом) – Concordance

Преимущества и недостатки программ класса Translation Memory Преимущества - Сокращение времени и объема работы переводчика - Улучшение последовательности перевода, особенно при работе нескольких переводчиков над одним проектом. - Увеличение прибыли за счет увеличения продуктивности труда - Повышение качества услуг за счет увеличения точности перевода терминов, особенно в специализированных текстах. Недостатки - Может делать перевод более „сухим“, утрачивается сама суть текста - Часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом - Оригинал должен быть в электронном виде - Одна ошибка распространяется на весь проект - Необходимо обучение самой программе, а при смене работы возможно, и не один раз (если работодатели работают с разными программами ТМ) - Подходит не ко всем видам текстов - Высокая стоимость

Литература: 1. 2. 3. 4. Грабовский В. Н. : Технология Translation Memory. „Мосты“ 2/2004 Кутузов, А. Б. : Компьютерные технологии в формировании профессиональной компетенции переводчика // Языки профессиональной коммуникации: сборник статей Третьей международной научной конференции, т. 2. – Челябинск, 2007 г. URL: http: //tc. utmn. ru/files/kutuzov_it. pdf Шахова Н. Г. : Поезд снова уходит. Домашний компьютер № 5 1. 05. 2000 Силонов А. : Программы, помогающие переводчику. Компьютерная неделя № 16 (238) Москва 16 -22. 05. 2000

Описание

Одна запись в такой базе данных соответствует сегменту или «единице перевода » (англ. translation unit ), за которую обычно принимается одно предложение (реже - часть сложносочинённого предложения либо абзац). Если единица перевода исходного текста в точности совпадает с единицей перевода, хранящейся в базе (точное соответствие, англ. exact match ), она может быть автоматически подставлена в перевод. Новый сегмент может также слегка отличаться от хранящегося в базе (нечёткое соответствие, англ. fuzzy match ). Такой сегмент может быть также подставлен в перевод, но переводчик будет должен внести необходимые изменения.

Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведённые тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведённого текста может ухудшиться.

В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format ), который основан на XML и может генерироваться практически всеми системами ПП. Благодаря этому сделанные переводы можно использовать в разных приложениях, то есть переводчик, работающий с OmegaT , может использовать ПП, созданную в Trados , и наоборот.

Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment ), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

Популярные программные системы ПП

В соответствии с обзорами использования систем ПП к наиболее популярным системам относятся :

В английской Википедии есть список , сравнивающий возможности различных систем.

Стандарты и форматы памяти переводов

  • TMX (Translation Memory Exchange Format - Обмен памятью переводов). Этот стандарт обеспечивает взаимный обмен между разными поставщиками памяти переводов. TMX является общепринятым форматом в среде переводчиков и лучше всего подходит для импорта и экспорта памяти переводов. Последняя версия этого формата - 1.4b позволяет восстанавливать исходные документы и их перевод из файла TMX.
  • TBX (Termbase Exchange format - Обмен терминологическими базами). Это принятый LISA (Ассоциации индустрии локализации) формат сейчас пересматривается и переиздаётся согласно ISO 30042 . Этот стандарт позволяет проводить обмен терминологией, в том числе детальной лексической информацией. Основная база TBX определяется стандартами: ISO 12620 , ISO 12200 и ISO 16642 . ISO 12620 обеспечивает реестр четко определённых «категорий данных» со стандартизованными именами, которые функционируют как типы элементов данных или предопределённые значения. ISO 12200 (известен также как MARTIF) предоставляет основу для каркасной структуры TBX. ISO 16642 (известен также как Terminological Markup Framework - Структура терминологической разметки) включает структурную метамодель для терминологических языков разметки (Terminology Markup Languages) в целом.
  • SRX создан для улучшения формата TMX и большей эффективности обмена памятью переводов между программами. Возможность указывать правила сегментации, которые использовались в предыдущем переводе, повышает эффективность отождествления сегментов в текущем тексте с содержимым ПП.
  • GMX GILT означает Globalization, Internationalization, Localization, and Translation (Глобализация, интернационализация , локализация , перевод). Стандарт GILT Metrics состоит из трёх частей: GMX-V для показателей объёма, GMX-C для показателей сложности, GMX-Q для показателей качества. Предложенный стандарт GILT Metrics направлен на квантификацию объёма работ и требований качества при реализации задач GILT.
  • OLIF - открытый стандарт, совместимый с XML , который используется для обмена терминологическими и лексическими данными. Хотя изначально он применялся в качестве способа обмена лексическими данными между частными лексиконами машинного перевода, постепенно этот формат превратился в более общий стандарт терминологического обмена.
  • XLIFF (XML Localisation Interchange File Format - XML формат для взаимного обмена при локализации), создан как единый формат файлов для взаимного обмена, который распознаётся всеми программными средствами локализации. XLIFF - это наилучший в современной индустрии переводов способ обмена информацией в формате XML. Некоторые инструменты используют проприетарные форматы XLIFF, не позволяющие открывать созданные в них файлы в других программах.
  • TransWS (Translation Web Services - переводческие веб-сервисы), определяет требуемые параметры вызова веб-сервисов при отправлении и получении файлов и сообщений, имеющих отношение к проектам локализации. Задумывался как развёрнутая система автоматизации процесса локализации с использованием сервисов в сети Интернет .
  • xml:tm , этот подход к памяти переводов основан на концепции текстовой памяти, которая позволяет совмещать авторскую память и память переводов. Формат xml:tm был передан Lisa OSCAR компанией XML-INTL .

Преимущества и недостатки

Преимущества

  • Сокращение времени и объёма работы переводчика.
  • Улучшение последовательности перевода, особенно при работе группы переводчиков над одним проектом.
  • Увеличение прибыли за счёт увеличения производительности труда переводчика, группы переводчиков.
  • Повышение качества услуг за счёт увеличения точности и единообразия перевода терминов, особенно в специализированных текстах.

Недостатки

  • Может делать перевод более «сухим»; утрачивается сама суть текста, если перевод с использованием накопителя переводов выполняется переводчиком низкой квалификации.
  • Часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом.
  • Оригинал должен быть в электронном виде.
  • Одна незамеченная ошибка может распространиться на весь проект.
  • Необходимо обучение работе в самой программе, а при смене работы - возможно, и не один раз (если работодатели пользуются разными программами ТМ).
  • Подходит не ко всем видам текстов.
  • Высокая стоимость лицензионного ПО.

См. также

Литература

  • Грабовский В. Н. Технология Translation Memory // Мосты. Журнал переводчиков. 2004. № 2. - С. 57-62.

Ссылки

  • Использование профессиональных программ переводческими компаниями России // Константин Дранч, 8 апреля 2015.

ТМ – это база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами. Если идентичный или подобный исходному сегмент найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается перевести только новые сегменты и отредактировать частично совпадающие. Каждое изменение или новый перевод сохраняются в ТМ. А в результате нет необходимости дважды переводить одно и то же предложение.

С другой стороны, при работе с крупными проектами переводчик сталкивается с проблемой согласованного применения терминологического глоссария в ходе длительного проекта или быстрого повторного использования ранее переведенного текста. По своей природе подобные рутинные задачи сравнительно легко (в отличие от машинного перевода) формализуются и программируются.

Каждая запись базы данных ТМ представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках). Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому. Несмотря на то что программы, оснащенные памятью перевода, называются системами автоматизированного перевода (CAT, computer-aided/assisted translation), их не следует путать с программами машинного перевода (machine translation) – память перевода ничего не переводит сама по себе, в то время как машинный перевод основан на генерации переводов по результатам грамматического разбора исходного текста.

Как правило, запись памяти перевода состоит из двух сегментов: на исходном (source) и конечном (target) языках. Если идентичный (или похожий) сегмент на исходном языке встречается в тексте, сегмент на конечном языке будет найден в памяти перевода и предложен переводчику в качестве основы для нового перевода. Автоматически найденный текст может быть задействован как есть, отредактирован или полностью отвергнут. Большинство программ используют алгоритм нечеткого соответствия (fuzzy matching), существенно улучшающий их функциональные возможности, поскольку в этом случае можно находить предложения, лишь отдаленно напоминающие искомые фразы, но, тем не менее, пригодные для последующего редактирования.

Преимущества от использования такого программного обеспечения поначалу могут быть неочевидны – однако по мере наполнения базы данных результаты автоматической подстановки основ для перевода будут становиться все более точными и регулярными.

Архитектура автоматизированной системы и ее функциональные возможности могут различаться. Средства поиска могут работать как с целыми сегментами, так и с отдельными словами или фразами, позволяя переводчику выполнять терминологический поиск. В систему также включают отдельную программу для работы с глоссарием, содержащим утвержденные для применения в проекте термины. Некоторые системы работают с программами машинного перевода. Основной рабочий интерфейс либо встраивается непосредственно в имеющийся текстовый процессор, такой как Word, либо представляет собой отдельный редактор. В состав системы обязательно включают фильтры для импорта-экспорта файлов различных форматов. Кроме того, многие системы, если не все, имеют средство для добавления в память перевода сегментов из, как правило, имеющихся у переводчика старых переведенных файлов.

То, что применимо к понятию «обучение языку», применимо и к «Translation Memories».

«Пустая» система запоминает термины и предложения.

Строится «память переводов» – Translation Memory (TM).

TM становится «языковой памятью» по продукту или по деятельности компании в целом.

Системы ТМ: SDLX, TRADOS, Deja Vu, Star Transit, Trans Suite 2000, WordFast, WordFisher, ACROSS.

КОМБИНИРОВАННЫЕ СИСТЕМЫ

Технологии МП и ТМ друг друга дополняют, но никак не дублируют. Система МП готова к использованию сразу после установки (хотя это не исключает того, что в процессе работы пользователю захочется что-то изменить в словаре, алгоритмах перевода и т.п.). Систему ТМ необходимо специально настраивать на перевод текстов в какой-то конкретной области, и чем больше эти тексты друг на друга похожи (например, такая система используется для перевода стандартных договоров), тем меньше времени требуется для настройки.

В связи с этим совершенно логично появление гибридов – example-based machine translation – программ, объединяющих системы машинного перевода и ТМ (например, компания «ПРОМТ» создала интегрированную технологию PROMT Term и PROMT For TRADOS, которая объединяет систему TM TRADOS и систему машинного перевода – PROMT XT Professional). PROMT For TRADOS (P4T) предназначена для интеграции системы машинного перевода PROMT и системы ТM TRADOS:

Перевод в системе TRADOS;

Перевод в системе PROMT не найденных в ТМ сегментов;

Вставка переведенных PROMT сегментов в TM.

Схема автоматизированной цепочки перевода на основе интегрированной технологии PROMT-TRADOS

Применение интегрированной технологии делает процесс перевода больших массивов документации управляемым и повышает его экономическую эффективность.

Пример реализации проектов с применением интегрированной технологии PROMT-TRADOS.

Предположим, необходимо осуществить перевод инструкции к мини-АТС.

1. На первом этапе применяется программа PROMT TerM. Документы анализируются, и выявляется основная терминология, которая заносится в словари системы машинного перевода PROMT.

2. Выполняется машинный перевод (МП) с подключенным словарем, продолжается терминологическая работа по коррекции словаря.

3. Результаты МП корректируются и заносятся в ТМ переводимого документа.

4. Таким образом пользователь получает:

Терминологический словарь;

Переведенный документ;

Соответствующую переведенному документу TM, которая может быть использована в дальнейшей работе с документами подобного рода.

Системы автоматического проектирования

САПР - программное обеспечение, предназначенное для создания чертежей, конструкторской и технологической документации, а также 3D-моделей. В данный список включены наиболее распространённые CAx-программы (CAD, CAM, CAE).

Говоря об автоматизированном переводе, обычно подразумевают программы, осуществляющие перевод на основе технологии машинного перевода (Machine Translation). Однако существует и другая технология - Translation Memory, которая хотя и не столь широко известна российским пользователям, но, тем не менее, имеет ряд преимуществ.

Бурное развитие технического прогресса привело к увеличению числа технических устройств, машин и другой сложной техники, без которых жизнь современного человека практически немыслима. Например, объем документации для европейского самолета Airbus исчисляется десятками тысяч страниц. Как показывают данные исследования, проведенного в конце 2004 года ассоциацией LISA (LISA 2004 Translation Memory Survey), 42% опрошенных переводят около 1 млн. слов в год, у 24% компаний - участников опроса ежегодный объем переводов составляет 1-5 млн., 12% переводят от 5 до 10 млн., объем переводов остальных компаний - от 10 до 500 и более миллионов слов в год. В частности, большинство производителей сегодня не ограничиваются своим локальным рынком и активно осваивают региональные рынки. При этом локализация продукции, в том числе перевод описания продукта на местный язык, является одним из обязательных условий для выхода на новый рынок.

В то же время, хотя производители регулярно выпускают новые версии своих продуктов - автомобилей, экскаваторов, компьютеров и мобильных телефонов, программного обеспечения, - далеко не все из них принципиально отличаются от предыдущих моделей. Подчас новая модель телефона представляет собой слегка измененную (или рестайлинговую) предыдущую модель. Новые версии продаются лучше, поэтому производителям приходится регулярно обновлять свои продукты. В результате документация по каждому из таких продуктов зачастую на 70-90% совпадает с той, что была у предыдущей версии.

Два фактора - большой объем требующих перевода документов и их высокая повторяемость - послужили стимулом к созданию технологии Translation Memory (сокращенно именуется TM, общепринятый русский перевод этого термина отсутствует). Суть технологии TM можно образно передать одной фразой: «Не переводить один и тот же текст дважды». Иначе говоря, Translation Memory используется для повторного использования ранее сделанных переводов. Это позволяет серьезно сократить время на подготовку перевода, особенно при работе с текстами, имеющими высокую степень повторяемости.

Технологию Translation Memory часто путают с машинным переводом (Machine Translation), которая, безусловно, тоже полезна и интересна, но ее описание не является целью настоящей статьи. Использование технологии ТМ повышает скорость перевода за счет уменьшения объема механической работы. Однако важно отметить, что TM не выполняет перевод за переводчика, а является мощным инструментом для сокращения затрат при переводе повторяющихся текстов.

Технология ТМ работает по принципу накопления результатов перевода: в процессе перевода в базе ТМ сохраняются исходный текст и его перевод. Для облегчения обработки информации и сравнения различных документов система Translation Memory разбивает весь текст на отдельные кусочки, которые называются сегментами. Такими сегментами чаще всего являются предложения, но могут быть приняты и другие правила сегментации. При загрузке нового текста система TM осуществляет сегментирование и сравнивает сегменты исходного текста с уже имеющимися в подключенной базе переводов. Если системе удается найти полностью или частично совпадающий сегмент, то его перевод отображается с указанием совпадения в процентах. Сегменты, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается только перевести новые сегменты и отредактировать частично совпадающие.

Как правило, задается порог совпадений на уровне не ниже 75%, так как если установить меньший процент совпадений, то увеличатся затраты на редактирование текста. Каждое изменение или новый перевод сохраняются в ТМ, так что нет необходимости переводить одно и то же дважды!

Важно также постоянно пополнять базу Translation Memory, сохраняя в базе (или в базах, если перевод выполняется по различным тематикам) пары сегментов «исходный текст - правильный перевод». Это позволит значительно сократить время, необходимое для перевода сходных текстов. Помимо снижения трудоемкости перевода система TМ позволяет выдержать единство терминологии и стиля во всей документации.

Использование технологии ТМ обеспечивает переводчику следующие преимущества:

  • повышение производительности труда. Подстановка даже на 80% совпадающих сегментов из базы переводов может сократить время работы над переводом на 50-60%. Как показывает практика, гораздо эффективнее править уже готовый перевод, чем переводить заново - «с нуля»;
  • единство терминологии и стиля при наличии базы переводов по тематике переводимого документа. Это особенно важно при переводе узкоспециальной документации;
  • организация работы коллектива переводчиков с гарантированным качеством перевода благодаря доступу к общей базе Translation Memory.

Отдельно отметим, что в западных странах, где технология Translation Memory давно уже стала де-факто обязательным инструментом переводчика, средства, потраченные на создание базы переводов, рассматриваются не как затраты, а, скорее, как инвестиции в стабильную и качественную работу, что увеличивает не только прибыль, но и стоимость самой компании.

Рынок систем Тranslation Мemory

Бесспорным лидером на рынке систем Translation Memory являются программы SDL-TRADOS. Летом 2005 года произошло объединение двух крупнейших разработчиков систем ТМ - компаний SDL и TRADOS (программные продукты под торговой маркой TRADOS хорошо известны многим пользователям), и теперь они выпускают совместный продукт, который является законодателем стандартов в области Translation Memory.

Новая система SDL-TRADOS имеет расширенные (настраиваемые пользователем) функциональные возможности нечеткого соответствия (поиск по совпадениям в базе переводов), а также инструментарий для проверки качества переводимых документов. Программа осуществляет проверку орфографии и защищает содержимое блоков памяти с помощью технологии шифрования.

Система поддерживает такие форматы, как Word DOC и RTF, online help RTF, PowerPoint, FrameMaker, FrameMaker +SGML, FrameBuilder, Interleaf, QuickSilver, Ventura, QuarkXPress, PageMaker, SGML/HTML/XML, включая HTML Help, RC (Windows Resource), Bookmaster (DCF) и Troff. Помимо системы SDL-TRADOS, на IT-рынке имеются и другие системы ТМ. Особенно широко представлены французские производители.

Система французской компании Atril (www.atril.com) называется. Ее разработчики сначала организовали собственное бюро перевода технической документации, после чего возникла идея создания специализированного ПО на основе технологии Translation Memory.

Это самостоятельное приложение с систематизированным меню. Система может создавать базы ТМ, а также базы данных терминологии и подключать словари. Процесс перевода осуществляется в специальной оболочке Project, куда при ее создании прикрепляется файл, который необходимо перевести, и подключаются дополнительные настройки: база ТМ, словари и др. Текст переводится в специальной таблице, где напротив каждой графы его оригинала нужно заполнить вариант перевода. К преимуществам также относится дополнительная функция для перевода файлов различных форматов, которая позволяет сохранить исходное форматирование файла.

Память переводов или Translation memory

Па́мять переводо́в (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») - база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже - часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, англ. exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.

Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы Translation Memory также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.

В каждой конкретной системе Translation Memory данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который могут порождать практически все системы ПП. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик работающий с OmegaT может использовать память переводов, созданную в ТРАДОСе (Trados) и наоборот.

Большинство систем Translation Memory как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

Список программных систем Translation memory (памяти переводов)

В соответствии с недавними обзорами использования систем памяти переводов (translation memory) к наиболее популярным системам относятся.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: