Системи автоматизованого перекладу тексту
Ідея використання комп'ютера для автоматичного перекладу текстів виникла ще на початку появи обчислювальної техніки. Для автоматичного перекладу документів з однієї мови на іншу розроблено багато різних програм. Однак через складнощі опису семантики природних мов до цього часу остаточно проблему перекладу ще не вирішено. Проте сучасні засоби автоматизації перекладу досягли такого рівня, який дає змогу ефективно використовувати їх на практиці. Це пов'язано з тим, що в наукових, технічних, економічних та інших текстах, на відміну від художніх, використовується обмежена кількість мовних конструкцій, які більше орієнтовано на однозначну інтерпретацію.
Програми автоматичного перекладу документів доцільно використовувати:
при абсолютному незнанні іноземних мов;
у разі необхідності одержати переклад швидко, наприклад, при перекладі Web-сторінок;
для створення підрядкового перекладу - чернетки, що використовується для повноцінного перекладу;
у разі пересилання документів іноземним партнерам.
До засобів автоматизації перекладу можна віднести два типи програм: електронні словники й програми перекладу.
Електронні словники - це засоби для перекладу окремих слів і виразів документа. Деякі з них забезпечують звуковий супровід перекладених слів. Серед найпопулярніших програм даного класу слід відзначити НБАРС - новий великий англо-російський словник, Контекст 3.51, ABBYY Lingvo та ін.
Програми перекладу забезпечують повний цикл перекладу всього документа: введення початкового тексту, переклад на іншу мову, редагування, форматування й збереження перекладеного тексту. Прикладами програм перекладу можуть бути PROMT та Language Master.
Програма PROMT
Цю програму (її більш ранні версії відомо під назвою Stylus) розроблено російською фірмою PROMT. Програма є додатком до операційних систем, таких як Windows 95, 98, NT 4.0, 2000 і може бути інтегрована в комплект програм Microsoft Office, зокрема, у програми Microsoft Word та Excel.
Можливості програми PROMT:
забезпечення перекладу документів з англійської, німецької та французької мов на російську і навпаки;
до неї можна підключати кілька десятків спеціалізованих словників, що забезпечує правильний переклад термінів, які стосуються певної області знань;
динамічне відслідковування напрямку перекладу, тобто визначення мови оригіналу і перекладу;
переклад вмісту буфера обміну, поточного параграфа, виділеного фрагмента тексту або всього тексту;
забезпечення будь-якого з можливих напрямків перекладу, підключення й відключення словників, доповнення та виправлення їх, складання списку зарезервованих слів, які не перекладаються;
робота безпосередньо з програмами розпізнавання текстів, наприклад, FineReader;
не виходячи з програми можна використати відомі способи редагування й форматування оригіналу та перекладу;
забезпечення перевірки орфографії оригіналу і перекладу після встановлення прикладних програм для перевірки правопису (LingvoCorrector, Пропис, Орфо, Hugo).
Головне вікно програми складається з трьох частин: дві призначені для відображення оригіналу тексту і його перекладу, третя - утворює інформаційну панель, де відображаються інформація про перекладений документ і спеціальні настройки. Вікно має стандартні елементи керування вікна Windows - заголовок, рядок меню, панелі інструментів і т.д.
Для швидкого запуску всіх програм, що входять до складу PROMT, призначений Інтегратор PROMT у вигляді окремої панелі робочого стола Windows. Кнопки панелі Інтегратора, а також пункти контекстного меню, яке викликається клацанням правою клавішею миші на значку Інтегратора, що є на панелі задач, дають змогу вибрати такі функції програми PROMT :
1.Переклад Clipboard (вміст буфера обміну).
2.Відкрити файл.
3.Відкрити WWW-вузол.
4.Пошук у WWW.
5.Запустити програму PROMT.
6.Запустити File Translator - програму перекладу файлів у пакетному режимі.
7.Запустити WebView - броузер-перекладач, що забезпечує синхронний переклад Web-сторінок при навігації у Internet.
8.Запустити Quick Translator - програму швидкого перекладу тексту, набраного з клавіатури.
Переклад окремих слів і виділених фрагментів можна здійснити прямо в тексті, навівши на них вказівник миші. Окремі фрагменти тексту можна перекласти без попереднього запуску програми PROMT. Для цього досить, знаходячись в будь-якому текстовому редакторі, наприклад, Notepad або Microsoft Word, скопіювати виділений фрагмент у буфер обміну і викликати функцію Переклад Clipboard Інтегратора PROMT.
Переклад документа за допомогою програми PROMT передбачає проведення кількох етапів:1.Введення документа, який необхідно перекласти. Документ може бути завантажений з файлу. Для цього слід виконати стандартну операцію відкриття файлу. Текст для перекладу може також бути набраний на клавіатурі у власному редакторі програми. Для цього треба спочатку створити новий документ за допомогою відповідної команди. Для перекладу введеного з клавіатури тексту без виклику основного вікна програми PROMT можна також скористатися функцією Quick Translator Інтегратора PROMT. У вікні програми Quick Translator, крім перекладу, можна виконати також інші дії з оригіналом і перекладеним текстом: скопіювати переклад у буфер обміну, змінити напрямок перекладу, підключити додаткові словники тощо.
2.Уточнення параметрів перекладу. Після того, як підготовлено оригінал тексту, що підлягає перекладу, слід визначається напрямок перекладу, тобто з якої мови на яку мову буде здійснюватися переклад, а також уточнити формат тексту оригіналу (формат файлу тексту оригінала, наприклад MS Word файл, форматований текст RTF і т.д.).
3.Підготовка тексту до перекладу. Вибраний документ відображається в області тексту оригіналу. Перед початком перекладу доцільно перевірити орфографію, оскільки неправильно написані слова будуть сприйматися програмою як невідомі і залишаться без перекладу. У разі необхідності текст можна зберегти для подальшої роботи як документ PROMT. У документі можуть бути слова і словосполучення, які не повинні перекладатися, наприклад, прізвища, назви програмних продуктів (Windows 98, Microsoft Word 2000 тощо). Іноді застосовують транслітерацію - запис із використанням іншого алфавіту, що відповідає написанню або вимові мовою оригіналу (наприклад, прізвище Brown бажано перекласти не як Коричневий, а Браун).
Інколи доводиться відмовлятися від перекладу цілих абзаців, наприклад, текстів програм на алгоритмічних мовах. Щоб відмовитися від перекладу окремих слів, їх треба зарезервувати, тобто встановити на цьому слові курсор, а потім клацнути мишею на відповідній кнопці панелі інструментів або вибрати пункт Зарезервировать... у контекстному меню чи меню Перевод.
Можна зарезервувати фрагмент тексту, заздалегідь виділивши його або цілий абзац. У тексті всі зарезервовані слова й абзаци, що мають залишитися без перекладу, виділяють зеленим кольором. Якість перекладу визначається повнотою словників, які використовуються, з урахуванням граматичних правил. Для кожного документа можна задати набір словників, які переглядаються у певному порядку до першого виявлення слова для перекладу. Програмою PROMT для перекладу передбачено три типи словників:
генеральний словник (містить загальновживану лексику і побутове значення слів). Він використовується завжди, причому останнім з усіх словників. Зміна цього словника неможлива;
спеціалізовані словники (містять терміни з різних областей). Редагувати ці словники не можна, але їх можна підключати й відключати під час перекладу. Базове постачання програми не містить додаткових словників і їх необхідно встановлювати окремо;
словник користувача (створюється користувачем) До нього додаються слова, яких немає в інших словниках, а також уточнені переклади тих або інших слів Як правило, цей словник переглядають насамперед. Словник користувача можна редагувати.
Список словників, що використовуються під час перекладу, відображається у вікні інформаційної панелі. Підключення словників здійснюється за допомогою відповідної команди програми PROMPT.
4.Переклад документа. Переклад документа починається після вибору користувачем відповідної команди з меню Перевод. Перекладений документ заноситься в область перекладу. Невідомі слова виділяються червоним кольором, а зарезервовані - зеленим. Список невідомих і зарезервованих слів відображається на інформаційній панелі у відповідних вкладках. У разі необхідності невідомі слова можна занести в словник користувача. Початковий текст і переклад можна редагувати, форматувати та перекладати повторно.
5.Збереження результатів. Після завершення робіт із текстами, оригінал і переклад можна зберегти в одному з форматів, що підтримуються програмою, використовуючи стандартні команди збереження файлу.
Програма PROMT забезпечує ряд додаткових можливостей, які розглянемо окремо.
1.Сумісна робота з програмою розпізнавання текстів. Якщо до комп'ютера підключено сканер і встановлено програму оптичного розпізнавання текстів, наприклад, FineReader, то її можна запустити безпосередньо з програми перекладу PROMT. Використовуючи сканер, програма FineReader забезпечить перетворення надрукованого на папері тексту на електронну форму і передасть його до програми для перекладу й редагування.
2.Сумісна робота з пакетом Microsoft Office. Програму перекладу PROMT можна інтегрувати з Word і Microsoft Excel. Це дає змогу перекладати відкриті в цих додатках документи, не виходячи з програм.3.Переклад Web-сторінок. До складу програми PROMT входить додаткова програма WebView, яка забезпечує підключення користувача до Web-вузлів, пошук інформації у мережі Internet й автоматичний переклад Web-сторінок з англійської, німецької, французької мов на російську і навпаки. Запустити цю програму можна з панелі Інтегратора PROMT .
Програма Language Master
Програма PROMT 98 не забезпечує переклад з інших мов на українську мову і зворотний переклад. Можна спочатку перекласти документ на російську мову, а потім використати додаткові програми перекладу з російської мови на українську, такі як Рута, РУМП та ін. Цей підхід, крім загальних незручностей, збільшує час, що витрачається на переклад, підвищує ймовірність помилок тощо. Програма Language Master (LM) вільна від цих недоліків, оскільки є лінгвістичним засобом для трьох мов: російської, української та англійської і призначена для підготовки документів на будь-якій з цих мов або їх комбінації та подальшого перекладу тексту на одну з трьох мов у будь-якому напрямку. В наступних версіях передбачається підключення німецької мови.
Система машинного перекладу LM дає змогу здійснювати переклад тексту і перевірку орфографії у різних додатках до Windows 95, 98, NT. Крім того, LM автоматично інтегрується з текстовим редактором Microsoft Word, при цьому Microsoft Word набуває нових функціональних можливо-стей перекладу документів, а LM - розширених засобів редагування й форматування перекладених текстів. До переваг програми LM можна віднести її компактність та простий інтерфейс. Особливості програми LM такі:
забезпечується переклад документів з англійської, російської і української мов у будь-якому напрямку;
є конвертор текстових файлів із формату DOS у формат Windows;
забезпечується перевірка орфографії для всього тексту або виділеного фрагмента будь-якою з трьох мов. Відкоректований текст зберігається в буфері обміну для подальшої заміни;
є можливість підключення до програми додаткових словників з економіки та інформатики;
забезпечується динамічне відслідковування напрямку перекладу (мови оригіналу і перекладу);
програма перекладає окремі слова, виділений фрагмент тексту або весь текст, а також файл або групи файлів у пакетному режимі;
забезпечується збереження при перекладі в середовищі Microsoft Word параметрів форматування оригіналу й розташування малюнків, графіків, таблиць та інших об'єктів, вигляду оригіналу;
забезпечується повноцінне використання можливостей Microsoft Word щодо редагування, форматування й перевірки орфографії.
Система машинного перекладу LM складається з двох компонентів:
незалежного програмного модуля;
модуля розширення Microsoft Word.
Незалежний програмний модуль. Незалежний програмний модуль взаємодіє з будь-якими активними додатками Windows, в яких можлива робота з текстом і реалізовані функції роботи з буфером обміну (наприклад, текстовими редакторами, програмами розпізнавання текстів, браузерами тощо). Щоб перекласти слово, фрагмент або весь документ, необхідно їх виділити і в контекстному меню незалежного програмного модуля вибрати пункт Переклад. Після визначення й підтвердження напрямку перекладу та тематики документа здійснюється переклад. Результат перекладу зберігається в буфері обміну і відображається в спеціальному вікні.
Перекладаючи фрагмент, слід мати на увазі, що LM перекладає текст як зв'язані речення з урахуванням усіх граматичних особливостей обох мов. Неперекладені з різних причин слова (помилки в оригіналі, відсутність у словниках) позначаються у вікні перекладу тексту червоним кольором. Їх можна також додати до списку неперекладених слів. Під час перекладу окремого слова у вікні перекладу тексту відображаються виділене слово і всі значення його перекладу, а в буфері обміну зберігається слово оригіналу. Для перекладу файлів або групи файлів їх необхідно заздалегідь виділити у вікні програми перегляду файлової системи. Можна виділити папку, при цьому будуть перекладені всі текстові файли, що знаходяться в ній. Після виділення треба запустити режим перекладу з контекстного меню LM. Програма автоматично вибирає тільки текстові файли формату Windows або DOS із будь-яким розширенням.
Для перекладу файлів складного формату необхідно використати текстовий редактор Microsoft Word. Переклад файлів здійснюється без відображення у будь-якому вікні. Динаміка роботи з кожним файлом відображається на панелі задач у вигляді відсотка перекладеного обсягу тексту. Після завершення роботи на екрані з'являється підсумкове вікно зі списком перекладених файлів. Результат перекладу заноситься у файл з назвою, аналогічною первинному файлу, з доданим за замовчуванням знаком ~. Переклад файлів здійснюється у фоновому режимі, тому можна продовжувати роботу з іншими програмами.Програма LM має засіб перевірки тексту па наявність орфографічних помилок. Перевірка орфографії, як і переклад, проводиться над фрагментом тексту, який необхідно скопіювати в буфер обміну. Запуск перевірки орфографії здійснюється вибором відповідного пункту в контекстному меню незалежного програмного модуля. Слово з помилкою можна відредагувати безпосередньо у вікні або використати функціональні кнопки. Якщо слово написано правильно, але відсутнє в словнику, то його можна занести в словник. При цьому виконується операція Породження словоформ. Здебільшого словоформи генеруються коректно вже під час видачі діалогового вікна, і користувачеві залишається тільки підтвердити правильність операції.
Модуль розширення Microsoft Word. Він підключається автоматично і забезпечує сумісну роботу текстового редактора Word із перекладачем - програмою LM. Під час запуску Microsoft Word у головному меню з'являються додатковий пункт Мастер і додаткова панель інструментів LM. Коли здійснюється переклад, вікно програми поділяється на дві частини: у верхній знаходиться текст оригіналу, а в нижній відображається його переклад.
Модуль розширення LM в середовищі Microsoft Word дозволяє здійснювати переклад окремих слів, переклад цілого документа з збереженням параметрів форматування і розташування малюнків, графіків, таблиць та інших об'єктів, перевірку орфографії, роботу з словниками, а також конвертацію текстів DOS у Windows. Під час перекладу відбувається автоматичне визначення мови документа, а користувачеві надається можливість задати напрямок перекладу й уточнити тематику документа.
При роботі з програмами перекладу слід пам'ятати, що оскільки ці програми поки ще далекі від ідеалу, автоматичний програмний переклад дає змогу зрозуміти, про що йдеться в оригіналі, але перекладений текст потребує редагування.
Використана література
1.Курс користувачів персональним комп’ютером. Автори : Г.В.Саєнко та Т.Б.Волобуєва. 2006 рік.
2.Практичний курс інформатики. Автори : В.Д.Руденко; О.М.Макарчук; М.О.Патланжоглу.
3.Караванова Т. П. Розвиток творчості учнів при вивченні інформатики: Авторська програма погли¬бленого вивчення інформатики.—Чернівці: ОНМІПО, 2006.—44с.
4.Рудненко В.Д.,Макарчук О.М., Патланжоглу М.О.Практичний курс інформатики / За ред. Мадзігона В.М. - К.:Фенікс, 2007. -304 с.
5.Глушаков С.В. ,Персональний комп'ютер. Учебний курс.-Харків:Фомо;М.:ООО.Фирма "Издательство Аст",2004.-499с.
6.Гордієнко Г.В. Входження України у всесвітню систему інформації. // Нова політика. - 1999 р. - №5 – С. 64-67.
7.Демінський С.О. Гроші в Мережі. // Політика і культура. - 2001. - №5 (88) / 13-19 лютого. - С. 34-36.
8.Демонополізація “Інтернету”. // Молода дипломатія. - 2000. - №4 (18). – 17 с.
9.Інформаційна тривога. // Пробудись. - 1998. - 8 січня. – С. 3-12.