Лексикографічна структура семантичного словника в моделях класу Смисл текст
ПСС => ГСС
ГССвхід => ГССвихідвласне переклад
ГССвихід => ГССпохідперефразування
ГСС => ПСС
ПСС => МСсинтез
МС => Речення
На всіх етапах, за винятком першого та останнього, необхідно звертатися до ТКС, який, таким чином, виявляється вельмисуттєво зв’язаним з граматичним компонетом системи, являючи з нею один (інтегральний) опис мови. Тому для успішної роботи системи необхідно мати максимально узгоджені один з одним граматику і словник. Це дуже складно зробити, бо цей словник має вміщувати, як можна більше інформації про мову, але без такого словника автоматизований переклад (саме ПЕРЕКЛАД) буде неможливий.
Словарна стаття ТКС являє собою підмножину деякої множини зон, у котрих записується інформація про відповідні властивості лексичних одиниць. Кожна зона, за винятком першої, вводиться своєю поміткою – абревіатурою з прописних латинських букв, з двокрапкою. Ось ці зони:
(1)Вхід – порядковий номер та ім’я лексичної одиниці, з номером омоніма та номером значення;
(2)TRANS – переклад:
(3)DEF – тлумачення лексичної одиниці в термінах лексичних функцій;
(4)POR – частина мови;
(5)LIM – морфологічні, синтаксичні та обмеження, що поєднуються, на дане значення слова, на безумовний зворот чи на слово у складі фраземи;
(6)SYNT – синтаксичні ознаки;
(7)DES – дескриптори (семантичні ознаки);
(8)GOV – синтаксичні ознаки та дескриптори типового синтаксичного власника;
(9)MG – модель чи моделі керування;(10)PREL – потенційні синтаксичні зв’язки для слова у складі фраземи;
(11)LF – лексичні функції;
(12)TRSFS – поверхнево-синтаксичні перетворення для фразем – “мікросинтагми”;
(13)TRSFD – глибинно-синтаксичні перетворення для фразем;
(14) - неформальна зона ілюстрацій та приміток.
Зони (1) та (4) обов’язкові в будь-якій словниковій статті. В словникових статтях фразем обов’язкові зони (12) та (13). Решта зон факультативні.
Однією з двох центральних проблем будь-якої системи АП (автоматизованого перекладу) є вирішення проблеми неоднозначності при аналізі – морфологічної, синтаксичної і лексичної омонімії та лексичної полісемії. (Друга центральна проблема – можливість породити достатню синонімію при синтезі, щоб подолати лексико-синтаксичні розходження між вхідною і вихідною моваим).