Обробка зображень, розпізнавання образів
2. Розпізнвання образів
Основні постановки задачі розпізнавання образів - Розпізнавання образів є однією з найбільш фундаментальних проблем теорії інтелектуальних систем. З іншого боку, задача розпізнавання образів має величезне практичне значення. Замість терміну "розпізнавання" часто використовується інший термін - "класифікація". Ці два терміни у багатьох випадках розглядаються як синоніми, але не є повністю взаємозамінюваними. Кожний з цих термінів має свої сфери застосування, і інтерпретація обох термінів часто залежить від специфіки конкретної задачі
Задача ідентифікації, яка полягає у тому, щоб вирізнити певний конкретний об'єкт серед йому подібних (наприклад, впізнати серед інших людей свою дружину).
Віднесення об'єкту до того чи іншого класу. Це може бути, наприклад, задача розпізнавання літер або прийняття рішення про наявність дефекту у деякій технічній деталі. Віднесення об'єкта до певного класу відображає найбільш типову проблему класифікації, і, коли говорять про розпізнавання образів, найчастіше мають на увазі саме цю проблему Саме її ми і будемо розглядати в першу чергу.
Кластерний аналіз, який полягає в розділенні заданого набору об'єктів на класи - групи об'єктів, схожі між собою за тим чи іншим критерієм. Цю задачу часто називають класифікацією без учителя, оскільки, на відміну від задачі 2, класи апріорно не задані.
Як уже зазначалося раніше, проблеми розпізнавання легко вирішуються людьми, причому робиться це, як правило, підсвідомо. Спроби ж побудувати штучні системи розпізнавання не настільки переконливі. Основна проблема полягає у тому, що часто неможливо адекватно визначити ознаки, на основі яких слід здійснювати розпізнавання. Для задач, для яких такі ознаки вдається виділити, штучні системи розпізнавання набули значного поширення і широко використовуються. Методи розпізнавання образів та технічні системи, що реалізують ці методи, широко використовуються на практиці. Наведемо деякі з них.
Розпізнавання літер
Окрім усього іншого, ця проблема має велике значення для власне комп'ютерних технологій. Системи розпізнавання літер працюють разом зі сканерами - пристроями, які використовуються для введення до комп'ютера друкованих зображень і текстів. При введенні друкованого тексту сканер формує лише графічне зображення; для того, щоб створити текстовий документ, з яким може працювати текстовий редактор, необхідно впізнати на цьому зображенні окремі літери. Аналогічним чином, розпізнавання літер є необхідним для підтримки пристроїв рукописного введення. Цими пристроями, зовні схожими на звичайну авторучку, часто комплектуються надпортативні комп'ютери (персональні помічники). Основна мета цих пристроїв - замінити введення з клавіатури, що є незручним для багатьох користувачів.
Розпізнавання мовиСьогодні інтенсивно розвиваються технології, пов'язані, по-перше, з голосовим керуванням комп'ютером, а по-друге - з введенням текстів з голосу. Робототехніка. Застосування методів розпізнавання в робототехніці є абсолютно природним і необхідним, оскільки роботи повинні безпосередньо сприймати зовнішній світ, і, відповідно, мати пристрої машинного зору.
В останні роки розпізнавання образів знаходить усе більше застосування в повсякденному житті. Розпізнавання мови і рукописного тексту значно спрощує взаємодія людини з комп'ютером, розпізнавання друкованого тексту використовується для перекладу документів в електронну форму. Популярна думка, що розпізнавання, як та інші алгоритми штучного інтелекту, є чорна магія, недоступна простим смертної. Насправді ж алгоритми, що лежать в основі розпізнавання, досить очевидні, потрібно лише зайти ледве здалеку і визначитися з термінами.
Базовим є невизначене поняття безлічі. У комп'ютері безліч представляється набором неповторюваних однотипних елементів. Слово "неповторюваних" означає, що якийсь елемент у безлічі або є, або його там немає. Універсальна безліч включає всі можливі для розв'язуваної задачі елементи, порожнє не містить жодного.
У класичній постановці задачі розпізнавання (дивно називати класичної науку, який від сили кілька десятиліть:) універсальна безліч розбивається на дріботі-образи. Образ якого-небудь об'єкта задається набором його приватних проявів. У випадку з розпізнаванням тексту в універсальну безліч увійдуть усі можливі знаки, в образ "И" - усі можливі накреслення цієї букви, а програма розпізнавання займається тим, що на основі невеликого набору прикладів накреслень кожної букви (навчальної вибірки) визначає, яку з них символізує введена карлючка.