Перейти к содержимому
Strategium.ru

Методика "быстрого" перевода модов для игр Crusader Kings 2,Victoria 2,Hearts of Iron 3,Europa Universalis 3 с помощью нейросетей


kuzmich774

Рекомендованные сообщения

kuzmich774
(изменено)

Методика "быстрого" перевода модов для игр Crusader Kings 2,Victoria 2,Hearts of Iron 3,Europa Universalis 3 с помощью нейросетей

 

Количество иностранных модов игр серии Paradox, использующих в локализации файлы в формате баз данных CSV велико.Для перевода таких игр могут использоваться различные авторские программы для перевода,такие как Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. ,Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. и другие.Но такие программы привязаны к алгоритмам сервисов перевода,которые они используют.Так как со временем алгоритмы этих сервисов меняются,эти программы перестают работать.К тому же эти программы не обеспечивают 100% перевод файлов и сохранении структуры программных тегов и программных объектов и их методов.

 

Перевод модов для игр серии Paradox(создание локализации) заключается в переводе файлов,расположенных в папке localisation мода.Для игр серии Paradox:Victoria2,Hearts of Iron 3,Europa Universalis 3 - это файлы базы данных csv.Также нужно скопировать нужный шрифтов в папку мода: название мода\gfx\fonts.В 70% случаев это шрифты,аналогичные шрифтам из папки \gfx\fonts ванильной версии игры.

 

 

В этой статье представлена Методика "быстрого" перевода модов для игр Crusader Kings 2,Victoria 2,Hearts of Iron 3,Europa Universalis 3 с помощью нейросети google.translate.C помощью этой методики мной переведено и опубликовано на форуме:  Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. - 44 мода,Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. - 17 модов,Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. - 9 модов, Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. - 1 мод 

 

 

Базы данных csv состоят из столбцов с переменными, и столбцов со значениями переменных ,которые используются в коде мода(в событиях,меню,игровом интерфейсе).Эти значения могут состоять из обычного текста на английском и программных тегов и на английском(например, $COUNTRY$,$DATE$ и др.),а также программных объектов и их методов(например Root.Object.GetName – это метод GetName объекта Object класса Root),которые связаны с кодом мода.Этот столбец на английском языке нам и понадобится.Для его первичной обработки понадобится обычный Microsoft Excel

 

Методика быстрого перевода модов для игр Crusare Kings 2,Victoria 2,Hearts of Iron3,Europa Universalis 3 состоит из пяти этапов:

 

1.Подготовка Excel-файлов из  файлов CSV локализации,путём открытия с помощью Excel CSV-файла и копирования столбца со значениями переменных для перевода(обычно это второй столбец на английском языке) в отдельную папку.

 

Выделите курсором мышки и скопируйте второй столбец со значениями переменных в первом столбце от начала до конца текста.Это можно сделать нажав "Ctrl+C" на клавиатуре или нажав правую кнопку мышки,и выбрав в меню "Копировать".Создайте Папку "Original",в неё вы будете складывать excel-файлы для дальнейшего перевода.Создайте в этой папке Excel-файл.Откройте его,зайдите в первую ячейку и вставьте в него скопированное содержимое файла.Это можно сделать нажав "Ctrl+V" на клавиатуре или нажав правую кнопку мышки,и выбрав в меню "Вставить".

 

2.Подготовка первичного перевода файлов Excel,полученного через сервисы перевода такие как , Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. , , Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. ,Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. , Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. и др. серисы,использующие машинный перевод и нейросети(для сравнения и выбора наилучшего перевода),где вы складываете каждый переведённый файл в директорию соответствующую названию нейросети.Обычно  достаточно одного сервиса - Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое.

 

Сразу же после того как вы создали Excel-файл и вставили в него столбец,откройте в браузере сайт Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. .Выберите в меню "Документы" - > "Выбрать файлы" - > Выберите файл Excel,выберите подготовленный Excel файл,нажмите "Перевести"(важно,чтобы стоял перевод с английского на русский),ждёте 5-10 секунд.Когда файл переведётся,будет доступна кнопка "Скачать перевод",жмёте её.

 

3.Вставка столбца с переводом из скачанного файла в столбец с английскими значениями

 

Тут же,в левом нижнем окне браузера открываете скачанный переведённый файл,и будет выделен первый столбец с переводом(если не выделен,сами его выделяете курсором мышки) и копируете его целиком от начала до конца текста.Это можно сделать нажав "Ctrl+C" на клавиатуре или нажав правую кнопку мышки,и выбрав в меню "Копировать".Переходите в изначальный файл локализации и сразу же вставляете скопированный столбец с переводом в файл локализации вместо английского,так чтобы значения изначальных файлов и перевода совпадали.

Это можно сделать нажав "Ctrl+V" на клавиатуре или нажав правую кнопку мышки,и выбрав в меню "Вставить".

 Сразу же сохраняете файл локализации теперь уже с переводом.

 

4.Такие манипуляции необходимо последовательно проделать со всеми файлами локализации.Теперь у вас готова папка с первично переведёнными с помощью нейросети файлами.Изначально в них есть ошибки,сделанные при переводе нейросетью - это и по ошибке переведённые программные теги или просто некорректный перевод(так как у английских слов много разных значений и нейросеть не знает в каком контексте их использовать)Обычно использую нейросеть Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. - в ней меньше всего ошибок.

 

5.Когда только начинал переводить,мне приходилось вручную проверять каждый файл локализации.Это занимало много времени и давало нагрузку на зрение.Теперь же,после накопленного опыта по переводу,знаю какие стандартные ошибки в программных тегах бывают при переводе Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. и на что их надо заменить.

 

Необходимо полученные после перевода файлы обработать,чтобы убрать ошибки с неверно переведёнными программными тегами.Для обработки этих файлов использую программу Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. .

Запустите Notepad++,выберите меню Файл->Открыть->Папка с переводом->Выберите сразу все файлы с переведённой локализацией.

Выберите меню Поиск->Найти->Замена

Теперь в строке "Найти" нужно написать значение по ошибке переведённого программного тега и в строке "Заменить на" нужно написать правильный программный тег и выбрать кнопку "Заменить всё во всех открытых документах".Будут заменены все по ошибке переведённые программные теги во всех файлах локализации.

Вот список по ошибке переведёных программных тегов и значения правильных программных тегов,на что их надо заменить.  

 

Для модов Victoria 2,Hearts of Iron 3,Europa Universalis 3 подойдёт следующий список:

 

Спойлер

$МЕССЕНДЖЕР$ $MESSENGER$
$
АКТОР$ $ACTOR$
$
ЭФФЕКТ$ $EFFECT$
$
ЭФФЕКТЫ$ $EFFECTS$
$
ПРОВ$ $PROV$
$
ИМЯ$ $NAME$
$
ПОЛУЧАТЕЛЬ$ $RECIPIENT$
$
ПОЛУЧАТЕЛЮ$ $RECIPIENT$
$
ПОЛУЧАТЕЛЯ$ $RECIPIENT$
$
ПРОТИВ$ $VERSUS$
$
ТИП$ $TYPE$
$
АСТАТЕЙТ$ $ASTATE$
$
ТЕКСТ$ $TEXT$
$
ВОЙНУ$ $WAR$
$
ВОЙНА$ $WAR$
$
НАПРАВЛЕНИЕ$ $ЗНАЧЕНИЕ$ $DIRECTION$ $VALUE$
$
СТОИМОСТЬ$ $VALUE$
$
НАПРАВЛЕНИЕ$ $DIRECTION$
$
ЗНАЧЕНИЕ$ $VALUE$
$
ЦЕННОСТЬ$ $VALUE$
$
ТЕРМИНЫ$ $TERMS$
$
РЕГИОН$ $REGION$
$
ЗАЩИТНИК$ $DEFENDER$
$
АТТАКЕР$ $ATTACKER$
$
СОБЫТИЕ$ $EVENT$
$
ВЫПУСК$ $ISSUE$
$
КАТЕГОРИЯ$ $CATEGORY$
$
ПОДРОБНОСТИ$ $DETAILS$
$
ПОБЕДИТЕЛЬ$ $WINNER$
$
СТРАНА$ $COUNTRY$
$
СТРАНУ$ $COUNTRY$
$
ВАРИАНТ$ $OPTION$
$
ТОВАРОВ$ $GOODS$
$
ТОВАР$ $GOOD$
$
ТОВАРЫ$ $GOODS$
$
ИЗОБРЕТЕНИЕ$ $INVENTION$
$
ДРУГОЕ$ $OTHER$
$
РЕЗУЛЬТАТ$  $RESULT$ 
$
ЗДАНИЕ$ $BUILDING$
$
ДАТА$ $DATE$
$
НАЦИЯ$ $NATION$
$
ИХ$ $THEM$
$
ПАРТИЯ$ ($ИДЕОЛОГИЯ$)\n $PARTY$ ($IDEOLOGY$)\n
$
ИДЕОЛОГИЯ$ $IDEOLOGY$
$
ИДЕОЛОГИИ$ $IDEOLOGY$
$
ПРОЦЕНТ$ $PERCENT$
$
ЧТО$ $WHAT$
$
ФАБРИКА$ $FACTORY$
$
ФАБРИКУ$ $FACTORY$
$
ВЕЧЕРИНКА$ $PARTY$
$
ПОБЕДИТЕЛЬ$ $WINNER$
$
ШТАТ$ $STATE$
$
ИСТЕЦА$$CLAIMANT$
$
ВОЗМОЖНЫЙ$ $WHO$
$
ОТРЕЗАНИЕ$ $ABDICATOR$
$
ШТАТЕ$ $STATE$
$
АМОЛЕТ$ $AMOUNT$
$
РЕСУРСОВ$ $RESOURCE$
$
СУММУ$ $AMOUNT$ 
$
НОВЫЙ$ $NEW$
$
ЛОРД$ $LORD$
$
ОБЯЗАТЕЛЬНАЯ$ $REQUIRED$
$
АГРЕССОР$ $AGRESSOR$
$
ТРЕТЬ$ $THIRD$
$
ТРЕТИЙ$ $THIRD$
$
КАПИТАЛ$ $CAPITAL$
$
ГОД$ $YEAR$
$
ГОДА$ $YEAR$

 


 

Для модов Сrusader Kings 2 подойдёт следующий список:

 

Спойлер

 

$МЕССЕНДЖЕР$ $MESSENGER$
$АКТОР$ $ACTOR$
$ЭФФЕКТ$ $EFFECT$
$ЭФФЕКТЫ$ $EFFECTS$
$ПРОВ$ $PROV$
$ИМЯ$ $NAME$
$ПОЛУЧАТЕЛЬ$ $RECIPIENT$
$ПОЛУЧАТЕЛЮ$ $RECIPIENT$
$ПОЛУЧАТЕЛЯ$ $RECIPIENT$
$ПРОТИВ$ $VERSUS$
$ТИП$ $TYPE$
$АСТАТЕЙТ$ $ASTATE$
$ТЕКСТ$ $TEXT$
$ВОЙНУ$ $WAR$
$ВОЙНА$ $WAR$
$НАПРАВЛЕНИЕ$ $ЗНАЧЕНИЕ$ $DIRECTION$ $VALUE$
$СТОИМОСТЬ$ $VALUE$
$НАПРАВЛЕНИЕ$ $DIRECTION$
$ЗНАЧЕНИЕ$ $VALUE$
$ЦЕННОСТЬ$ $VALUE$
$ТЕРМИНЫ$ $TERMS$
$РЕГИОН$ $REGION$
$ЗАЩИТНИК$ $DEFENDER$
$АТТАКЕР$ $ATTACKER$
$СОБЫТИЕ$ $EVENT$
$ВЫПУСК$ $ISSUE$
$КАТЕГОРИЯ$ $CATEGORY$
$ПОДРОБНОСТИ$ $DETAILS$
$ПОБЕДИТЕЛЬ$ $WINNER$
$СТРАНА$ $COUNTRY$
$СТРАНУ$ $COUNTRY$
$ВАРИАНТ$ $OPTION$
$ТОВАРОВ$ $GOODS$
$ТОВАР$ $GOOD$
$ТОВАРЫ$ $GOODS$
$ИЗОБРЕТЕНИЕ$ $INVENTION$
$ДРУГОЕ$ $OTHER$
$РЕЗУЛЬТАТ$  $RESULT$ 
$ЗДАНИЕ$ $BUILDING$
$ДАТА$ $DATE$
$НАЦИЯ$ $NATION$
$ИХ$ $THEM$
$ПАРТИЯ$ ($ИДЕОЛОГИЯ$)\n $PARTY$ ($IDEOLOGY$)\n
$ИДЕОЛОГИЯ$ $IDEOLOGY$
$ИДЕОЛОГИИ$ $IDEOLOGY$
$ПРОЦЕНТ$ $PERCENT$
$ЧТО$ $WHAT$
$ФАБРИКА$ $FACTORY$
$ФАБРИКУ$ $FACTORY$
$ВЕЧЕРИНКА$ $PARTY$
$ПОБЕДИТЕЛЬ$ $WINNER$
$ШТАТ$ $STATE$
$ИСТЕЦА$$CLAIMANT$
$ВОЗМОЖНЫЙ$ $WHO$
$ОТРЕЗАНИЕ$ $ABDICATOR$
$ШТАТЕ$ $STATE$
$АМОЛЕТ$ $AMOUNT$
$РЕСУРСОВ$ $RESOURCE$
$СУММУ$ $AMOUNT$ 
$НОВЫЙ$ $NEW$
$ЛОРД$ $LORD$
$ОБЯЗАТЕЛЬНАЯ$ $REQUIRED$
$АГРЕССОР$ $AGRESSOR$
$ТРЕТЬ$ $THIRD$
$ТРЕТИЙ$ $THIRD$
$КАПИТАЛ$ $CAPITAL$
$ГОД$ $YEAR$
$ГОДА$ $YEAR$
Гото Перейти к

$ГДЕ$ $WHERE$
$ВРАГ$ $ENEMY$
$РЕЛИГИЯ$ $RELIGION$
$RELIGION$ $RELIGION$
ALE$
$КТО$ $WHO$
$ЧТО$ $WHAT$
$ПРЕЕМНИК$ $SUCCESSOR$
$КОГДА$ $WHEN$
$WHICH$
$СЕМЬЮ$ $FAMILY$
$КУЛЬТУРУ$ $CULTURE$
$КУЛЬТУРА$
$СТРАНЕ$ $COUNTRY$
$КАКИМ$ $WHAT$ 
$СКОЛЬКО$ $WHAT$
$СУПРУГА$ $SPOUSE$
$ГОСПОДИЦИНА$ $HONORIFIC$
$ТИТУЛ$ $TITLE$
$ВАССАЛ$ $VASSAL$
$ПОЛ$ $SEX$
$МАТЬ$ $MOTHER$
$РЕБЁНОК$ $CHILD$
$ПРИЧИНА$ $REASON$
$БОЛЕЗНИ$ $DISEASE$
$ПРЕСТИЖ$ $PRESTIGE$
$БЛАГОПОЛУЧИЕИМЯ$ $PIETYNAME$
$РЕЛИГИИ$ $RELIGION$
$ТИПА$ $TYPE$
$ПРАВИТЕЛЬСТВО$ $GOVERNMENT$
$ПРАВИТЕЛЬСТВЕННАЯ$
$ПРОТИВ|Y$  $AGAINST|Y$
$ТОТАЛЬНО|Y$  $TOTAL|Y$
$ЗА|Y$ $FOR|Y$
$ЗОЛОТО$ $GOLD$
$СЮЖЕТЕ$ $PLOT$
$ДОСТИЖЕНИЕ$$ACHIEVEMENT$
$ШТРАФ$ $PENALTY$

 

 

 

После того,как вы последовательно замените каждый неправильный тег на правильный,нажмите  в Notepad++ Файл->Сохранить всё.

 

Теперь можете скопировать папку localisation с переведённой локализацией в папку мода и наслаждаться переведённой игрой при помощи сервиса Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. .Сервис Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. даёт больше ошибок в программных тегах.

 

 

При возникновении ошибок,полученные файлы можно проверить вручную - теперь ошибок будет меньше(или вообще не будет)

 

Неверный перевод в файлах локализации исправляется так же - вы открываете в Notepad++ все файлы и ищете неверно переведённое слово,находите его и заменяете вручную.

 

Для того,чтобы посмотреть разные варианты перевода английских слов,можно использовать,например,словари Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. или Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое.

 

Сравнить переводы файлов локализации,сделанных на втором этапе в разных нейросетях можно в программе Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. .

Изменено пользователем kuzmich774

kuzmich774

В Дополнение к Методике "быстрого" перевода модов для игр Crusader Kings 2,Victoria 2,Hearts of Iron 3,Europa Universalis 3 с помощью нейросетей,публикую методику поиска и замены с помощью регулярных выражений,которая поможет существенно расширить возможности по редактированию полученного перевода с помощью нейросетей.

 

Методика поиска и замены с помощью регулярных выражений

 

Регулярные выражения в Notepad++ — это язык поиска, с помощью которого можно производить различные действия над строками документа

Это делается при помощи специальных метасимволов, при вводе которых производится поиск и выполнение манипуляций по принципу шаблонов. 

Применение регулярных выражений необходимо, когда нужно обработать большой массив текстовой информации, чтобы найти схожие, но не идентичные фрагменты текста.  Например: очистить текст от html-тегов, удалить простейший числовой ряд, привести даты к единому формату. 

Чтобы включить поиск по регулярному выражению в Notepad++, нужно нажать Ctrl + F (как и для обычного поиска) и во всплывшем окне переключиться в режим «регулярное выражение».  После этого в строку «Найти» можно вписывать шаблоны для поиска. 

 

 

Регулярные выражения и расширенный поиск

 

Поиск по регулярным выражениям является мощным инструментом,позволяющим расширить возможности обычного поиска и замены.

 

Также в программе Notepad++ вы можете использовать расширенный поиск и поиск,использующий регулярные выражения

 

Запустите Notepad++,выберите меню Файл->Открыть->Папка с переводом->Выберите сразу все файлы с переведённой локализацией.

 

Выберите меню Поиск->Найти.В панели Поиска в нижнем левом углу можно выбирать режим поиска:Обычный,Расширенный или по регулярным выражениям.

 

 

Подборка регулярных выражений и шаблонов,которые применяются в Notepad++

 

Разбор регулярных выражений

 

Символы

.

Точка. Обозначает любой символ

\

Экранирующий символ. Символы которые экранируются: ^, [, ., $, {, *, (, ), \, +, |, ?, <, >

^

Крышка. Начало строки

$

Конец строки

\d

Любая цифра

\D

Не цифра

\s

Пробел, табуляция, перенос строки

\S

Не пробел

\w

Любая буква латиницы, цифра, или знак подчёркивания

\W

Не латиница, не цифра, не подчёркивание

|

Или. Соединяет несколько вариантов

\b

Граница слова. Применяется когда нужно выделить, что искомые символы являются словом, а не частью другого слова

\B

Не граница слова

\<

Начало слова

\>

Конец слова

\A

Начало текста

\Z

Конец текста

*

Повторитель. Означает что предшествующий символ может работать 0 и более раз

+

Количество предшествующего не менее 1-го.

?

Ограничитель. Не более одного раза

[ ]

В квадратных скобках задаются символы к поиску, например [a-яА-Я], или [0-9]

[^ ]

Исключает из поиска символы указанные в квадратных скобках

()

В круглые скобки заключаются все комбинации с "или" и поиск начала и конца строк

{ }

В фигурных скобках указывается точное количество вхождений, например если надо две цифры, то \d{2}, если две или четыре, то \d{2,4}, если четыре и более, то {4,}

\n

Новая строка

 

 

Примеры Шаблонов регулярных выражений:

 

Найти даты написанные в формате дд месяц гггг г., остальное убрать

Найти:
(\d{1,2}+\s+[а-яА-Я]+\s+\d{2,4}+\s+[а-я]\.)|.
Заменить на:
$1

 

Найти дату со слешем, например: 20/5/2020, остальное убрать

 

Найти:
(\d{1,2}\/\d{1,2}\/\d{4})|.
Заменить на:
$1

 

Найти даты в формате дд.мм.гггг и дд-мм-гггг, остальное убрать

 

Найти:
(\d{1,2}+(-|\.)+\d{1,2}+(-|\.)+\d{2,4})|.
Заменить на:
$1

 

Найти всё между кавычек

"([^"]*)"

 

Найти всё между скобок

\(([^\(]*)\)

 

Перенести буквы в начало, в выражениях формата 6465C, 498558JR, 1286458975KTD и т.д.

Найти:
\b(\d*)([A-Z]+)(\d*)\b
Заменить на:
$2$1$3

 

Удалить всё в строке после определённого символа или слова, вместе с ним

Найти:
(.*)Примечания(.*)
Заменить на:
\1

 

Удалить всё после символа использующегося и в регулярных выражениях, например *

Найти:
(.*)\*(.*)
Заменить на:
\1

 

Сделать перенос строки перед каждой заглавной буквой

Найти:
(\S)([A-ZА-ЯЁ])
Заменить на:
$1\r\n$2

 

Убрать всю табуляцию

Найти:
\t
Заменить на:
Пусто

 

Удалить в строке всё после пробела

Найти:
^(.+?)\s.+$
Заменить на:
\1

 

Удалить во всех строках всё до определённого символа, например до ?

^.*\?

 

Удалить все строки в которых определённое число символов, например меньше 100

^(.{0,100})\r\n

 

Удалить все запятые, после которых идёт буква или пробел, но не цифра

,(?=\D)

 

Добавить в каждую пустую строку

Найти:
^\s*$
Заменить на:
Любой символ или слово

 

Объединяем предложения, с разделением пустой строкой

Найти:
(?<=[^.])\r\n\r\n
Заменить на:
Пусто

 

Найти все фрагменты кода расположенные между двумя словами

Найти:
#слово-начало.*?,слово-конец#is

 

Заменить определённый символ, например «-«, на другой символ, например «_», в словах начинающихся с определённого символа, например с «#».

Найти:
(/#[\w-]+/g)
Заменить на:
(/-/g, '_')

 

Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое. Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое.

 

Войдите или зарегистрируйтесь, чтобы увидеть скрытое содержимое.

Присоединиться к обсуждению

Вы можете оставить комментарий уже сейчас, а зарегистрироваться позже! Если у вас уже есть аккаунт, войдите, чтобы оставить сообщение через него.

Гость
Ответить в тему...

×   Вы вставили отформатированное содержимое.   Удалить форматирование

  Only 75 emoji are allowed.

×   Ваша ссылка автоматически преображена.   Отображать как простую ссылку

×   Предыдущее содержимое было восстановлено..   Очистить текст в редакторе

×   Вы не можете вставлять картинки напрямую. Загрузите или вставьте их через URL.

  • Сейчас на странице   0 пользователей

    • Нет пользователей, просматривающих эту страницу
  • Модераторы онлайн

    • alexis
×
×
  • Создать...