Обзор программ для извлечения терминологии |
Особую значимость составление собственного глоссария приобретает при переводе больших объемов текста, если присутствует несколько файлов на перевод с единой терминологией (например, серия технических руководств). Использование глоссария позволяет, в таком случае, сохранить единство терминологии при переводе и сэкономить время, необходимое на поиск нужного варианта перевода. Кроме того, после завершения работы и сдачи перевода заказчику, глоссарий сохраняется у вас для возможного повторного использования. Чем извлекать терминологию?Существует множество программ для автоматизированного извлечения терминологии. Перечислим наиболее распространенные: Simple Concordance ProgramСайт разработчика: http://www.textworld.com Условия распространения: Бесплатная. Ссылка на скачивание: скачать Simple Concordance Program 4.09 (обязательно проверьте наличие новой версии на сайте разработчика) Описание: Простая в использования и предоставляемой функциональности программа, с помощью которой можно извлекать термины и словосочетания, задавая число слов в словосочетании. Поддерживаются алфавиты: Английский, Французский, Немецкий, Польский, Греческий, Русский. Программа извлекает найденные термины в список, которые, после этого, могут быть отредактированы вручную. Существует возможность подключить так называемый stop list - список из слов, которые не относятся к терминологии. К примеру, артикли, предлоги, общие слова (little, large). Вы можете взять stop list по следующей ссылке - скачать stop list (англ. язык, названия стран, предлоги, артикли, общие слова). MonoConc ProСайт разработчика: http://www.athel.com Условия распространения: Платная. Ссылка на скачивание: MonoConc Pro 3.0 DEMO (обязательно проверьте наличие новой версии на сайте разработчика) Описание: MonoConc Pro 3.0 имеет приемлемое количество настроек для поиска, но при этом является платной. Программа способна обеспечить сравнительно быстрый поиск, поддерживает анализ нескольких языков, среди них Английский, Испанский, Французский, Японский и Китайский. Concordancer for WindowsСайт разработчика: http://www.linglit.tu-darmstadt.de Условия распространения: Бесплатная. Ссылка на скачивание: Concordancer for Windows 3.0 (обязательно проверьте наличие новой версии на сайте разработчика) Описание: Простая и бесплатная в применении программа, но весьма ограниченная в настройках. Главным недостатком можно считать отсутствие возможности задать "черный список" терминов, в итоге в качестве терминов предлагается большое количество предлогов и артиклей. Нет фильтрации по частоте встречаемости терминов. MultiTerm ExtractСайт разработчика: http://www.sdl.com Условия распространения: Входит в состав системы Trados Multiterm, система платная. Описание: Прежде всего, отметим, что для работы с программой, вам понадобится версия Java 1.4.2_08, ни с какой другой версией Java программа работать не будет! Не забудьте удалить более новую версию Java перед установкой. Проверить вашу текущую версию Java, вы можете набрав в командной строке Windows команду: java -version. Очень функциональная программа. Среди наиболее полезных функций можно выделить:
PROMT Terminology Manager - PROMT TerMСайт разработчика: http://www.promt.ru Условия распространения: Входит в состав системы PROMT, система платная. Описание: Крайне удобная и простая в применении и настройках программа. Большое количество весомых плюсов: настройка "черного списка", гибкая настройка условий поиска (частота встречаемости, установка разделителей слов, и предложений и т.д.), мгновенный перевод найденных терминов, наглядная демонстрация контекста для найденного термина и тесная интеграция с системой TM Trados. В итоге, полученный после обработки результат требует минимальных усилий на редактуру. Word TabulatorСайт разработчика: http://www.rvb.ru Условия распространения: Бесплатно. Ссылка на скачивание: Word Tabulator 2.2.3 (обязательно проверьте наличие новой версии на сайте разработчика) Описание: Быстрая и простая программа. Однако из-за отсутствия возможности установки "черного списка" терминов, также выдает большое количество предлогов, артиклей и общих слов, таким образом, время и усилия, необходимые на редактуру увеличиваются. Поддерживается русский язык, а также присутствует подробная справка на русском языке. Сравнение эффективности программ извлечения терминологииРассмотрим возможности программ, на примере обработки текста взятого из книги G. J. Myers - The Art of Software Testing, 2nd Edition (глава 1).
ВыводыНа основе приведенных данных, можем заключить, что лидерами среди программ автоматизированного извлечения терминологии можно считать коммерческие продукты PROMT Terminology Manager (PROMT TerM) и MultiTerm Extract. Эти продукты поддерживают большое количество функций, значительно улучшающих эффективность работы и сокращающие время, необходимое на постредактирование полученных данных. Из бесплатных программ, можно выделить Simple Concordance Program- весьма простая в применении программа, имеет приемлемое количество настроек для поиска и предлагает хорошие результаты обработки. |