Total Easy Aligner

Здесь речь пойдёт о небольшой программе, с помощью которой я выполняю alignment текстов из игр и из переводов, для создания терминологии.

Для чего нужна такая программа?

Для создания терминологических пар из готовых переводов (alignment). Эти данные затем можно использовать при автоматизированном переводе (например, в MemoQ, Trados, Transit NXT, Across).

Для создания билингуальных книг. Такая книга состоит из текстов двух языков и предложения можно сравнивать и использовать в изучении языков. Контекст при этом сохраняется.

Эта программа не предназначена для очень больших файлов и больше подходит для текстов без тегов (для простого текста). Лучше всего она подходит для работы с текстовыми файлами или Excel-файлами.

Описание программы

  • создавать небольшие (для удобной работы не более 20 000 сегментов) tmx-файлы с посегментными парами из двух языков. Проекты можно создавать из обычных текстовых файлов, а также Excel и tmx-файлов.
  • Редактирование проектов включает:
    • Перемещение, разделение, удаление и объединение сегментов.
    • Поиск, замена, фильтрование.
    • Поиск нечётких совпадений (Fuzzy) и вариантов в проекте и внешней памяти переводов (Translation Memory).
  • Создание и использование в проекте терминологии.

Экспортирование готовых проектов в Excel, текстовые файлы, файлы HTML или файлы TMX.

История создания

Я готовлю в настоящий момент обновление к переводу прохождения к Twilight Princess. Это был довольно долгий проект, который я начал делать прямо в форуме и некоторые пользователи помогали мне в этом. Текст был довольно юморной, но в нём очень уж много ошибок, проблем в стилистике и орфографии. Не говоря уже о том, что там отстутствовала какая-либо постоянная терминология. Опыт с переводами к другим играм показал, что использование терминологии и использование программ, помогающих с переводом, дают большой скачок в качестве. Поэтому я решил полностью перечитать текст, сделать его полностью своим (то есть я перевёл те части, которые до этого были переведены другими участниками) и согласовать терминологию с терминологией, использующейся в любительском переводе на русский язык.

Большую помощь я получил от автора перевода к игре.

Итак, терминология. Как же мне сделать всё так удобно, чтобы можно было пользоваться терминологией?

Шаг первый: я решил сделать alignment дампа из игры и перевода игры. Около 10 файлов нужно было предложение за предложением «выравнять» и сохранить в формате, который потом можно было бы использовать при проверке перевода прохождения.

Для этого alignment’а я написал небольшую программу, о которой я хотел бы рассказать.

С помощью программы я загружаю файл (это был TMX) с посегментным перечислением предложений. Изначально эти пары сегментов не совпадают. После этого у меня: слева английский, справа русский. Суть сглаживания текста заключается в том, чтобы определить исходному сегменту соответствующий сегмент в переводе. Если просматривать предложение за предложением, можно чокнуться. Поэтому я добавил функцию сравнения. Сегмент слева и справа сравниваются на предмет наличия особых знаков или количества слов или символов и в итоге выдаётся определённое значение (SV — similarity value). Кроме того, программа показывает некоторые вспомогательные сигналы (например, если сегменты заканчиваются на один и тот же знак или одинаковое количество скобок). Таким образом можно быстро перепрыгивать (программа пробегает мимо) все пары сегментов, которые имеют высокий балл схожести.

Можно установить минимальное значение SV, затем, нажимая на NSV (next low similarity value segment) можно перепрыгивать к следующему сегменту с низким значением. Если всё идёт хорошо — программа может перепрыгивать сразу несколько десятков или сотен сегментов! Это очень экономит время.

Если же я нахожу сегменты, которые нуждаются в обработке, у меня есть все необходимые для этого опции: удаление сегмента, склеивание с предыдущим, следующим, перемещение, копирование и так далее.

Но и это не всё! Программу можно использовать для перевода (но возможности, конечно, ограничены). Для этого я добавил возможность проверки вариантов и поиск fuzzy matches.

К примеру я могу посмотреть, есть ли предложения, похожие на «Do you remember what that spirit said?», чтобы свериться с тем, как было сформулировано похожее предложение.

Все эти вещи программа находит в текущем проекте, но что если у вас уже есть готовые переводы, которые вы тоже хотите использовать?

Эта функция называется External TM. Я загружаю другой файл с другой памятью переводов и могу использовать её для поиска fuzzy.

— моя программа для создания билингуальных текстов и памяти переводов для двух языков.

TotalEasyAligner

 

5066 Всего 3 Сегодня