Parasent - Обработка параллельных текстов |
Parasent: Программа предназначена для извлечения пар предложений вида "оригинал-перевод" из текстов на иностранном и русском языке. Автор программы: Cайт разработчика Parasent Условия распространения: Бесплатная. Ссылка на скачивание: Скачать Parasent Скриншот окна программы: Подробное описание: У переводчиков часто накапливаются оригинальные и переведённые тексты, содержащих полезную информацию для последующей работы. Системы translation memory позволяют хранить и искать предложения на двух языках. Преимущество очевидно - не нужно дважды переводить одни и те же или похожие фрагменты текста. Однако, извлечение и упорядочивание информации из исходных текстов представляет некоторые трудности. Количество предложений в оригинале и переводе различается, возможны слияния, разделения и пропуски предложений. Всё это мешает корректно распараллеливать тексты и требует значительной ручной работы. Для обработки других пар текстов поместите их в каталог Texts по аналогии с имеющимся там примером. После окончания обработки в каталоге с исходными текстами будет создан файл с именем \'tab\' (без расширения), он содержит предложения оригинала и перевода в формате tab-delimited. Предварительные результаты обработки сохраняются в файле output.ind11, их можно просматривать в процессе обработки. Расширение словарных баз: |