Семантико-синтаксична модель автоматичного перекладу
Ці гіпотетичні зв'язки далі інтерпретуються в семантичному компоненті системи.
Частина синтаксичного компоненту, що виконує перераховані вище функції, називається первинним синтаксичним аналізом. Первинний синтаксичний аналіз встановлює та переводить в синтаксичну структуру лише "сильні" зв'язки, а для "слабких" прораховує всі позиційно можливі варіанти.
Результатом роботи первинного синтаксичного аналізатору буде структура, що в загальному випадку не є деревом: у ній можуть бути розриви та альтернативні зв'язки. Така структура називається первинним синтаксичним представленням.
Після роботи первинного синтаксичного аналізатору починається робота первинного семантичного аналізатору, що інтерпретує зв‘язки первинного синтаксичного представлення, а також гіпотетичні слабкі зв‘язки. Інтерпретовані (підтверджені) зв‘язки розглядаються вторинним синтаксичним аналізатором, який враховує властивості правильної синтаксичної структури. У результаті відкидаються зайві синтаксичні інтерпретації первинного синтаксичного аналізу, а також вводяться нові синтаксичні зв‘язки, що відповідають інтерпретованим слабким зв‘язкам.
Отже, наявність семантичного компоненту в системі суттєво впливає на структуру та межі синтаксичної складової системи. Границю між синтаксисом та семантикою зсунуто в бік семантики.
Семантичний аналіз
Бажано, щоб у системі було щонайменше два рівня семантичного аналізу: первинний, що дає інтерпретацію вузлів та зв‘язків, утворених на попередніх рівнях, у термінах спеціальної синтаксичної мови, і власне сам семантичний аналіз, що працює на основі заданої граматики змісту.
У системі ФРАП реалізовано лише первинний семантичний аналіз. До його функцій належать:
1.Інтерпретація синтаксичних вузлів, тобто вибір лексичних значень слів, або утворення семантичних вузлів. Ця процедура проводиться на базі семантичного словника, в якому кожному синтаксичному вузлу відповідає множина семантичних вузлів.
2.Інтерпретація сильних синтаксичних зв‘язків (зв‘язків, встановлених Аналізатором). Вона відбувається на основі словарної інформації про моделі керування кожного семантичного вузла. Модель керування в даній системі визначається як набір смислових валентностей семантичного вузла разом з відповідними морфолого- синтаксичними способами реалізації їх у фразі. Розпізнавання моделі керування у фразі технічно зводиться до застосування словарних фільтрів до структурних та семантичних характеристик вузлів фрази та зв‘язків, знайдених на всіх попередніх етапах.
3.Фільтрація синтаксичних зв‘язків. Інтерпретуючи синтаксичні зв‘язки, встановлені Аналізатором, семантичний аналіз підтверджує їхню правильність. Відмовляючи деякому зв‘язку в інтерпретації, семантичний аналіз переводить його з підкласу сильних (куди він потрапив через формальну подібність до сильних) до підкласу слабких, які інтерпретуються пізніше.
4.Перерозподіл вузлів і зв‘язків при перекладі. Він потрібен на тих ділянках, що не піддаються прямому перекладу (вузол – у вузол, зв‘язок – у зв'язок). Такі ділянки є конструкціями, та перекладаються за допомогою спеціального словнику конструкцій.
5.Вибір російського перекладного еквівалента. Для кожного семантичного вузла в словнику визначено російський еквівалент. Як умови вибору російського еквівалента можна використовувати будь-які відомості, отримані при роботі системи. Так наприклад, навіть тип смислових опущень, що супроводжують деяке слово у фразі, є смисловим контекстом, що підказує той чи інший переклад.
6.Інтерпретація слабких зв‘язків. Для слабких (гіпотетичних) зв‘язків сформована таблиця їхніх позицій та можливих синтаксичних "хазяїв". Інтерпретація слабких зв‘язків необхідна для коректного перекладу, оскільки вони не перекладаються через моделі управління.Інструментом аналізу слабких зв‘язків є словник відносин. На вхід подається: сам лексико-граматичний елемент, що пов‘язує два вузли (це може бути прийменник, сполучник чи розподільний знак), набір граматичних та синтаксичних характеристик для слабокерованого вузла та його можливого хазяїна. На виході – смислове відношення, а також російські синтаксичні кореляти. Також може видаватися уточнений французький синтаксичний зв‘язок.