Методи отримання знань в «Deductor warehouse»
Deductor Viewer - робоче місце користувача. Дозволяє відділити процес побудови моделей від використання вже готових моделей. Всі складні операції по підготовці моделей виконуються аналітиками-експертами за допомогою Deductor Studio, а Deductor Viewer забезпечує користувачам простий спосіб роботи з готовими результатами, приховує від них всі складнощі побудови моделей і не пред'являє високих вимог до кваліфікації співробітників.Архітектура системи побудована таким чином, що вся робота по аналізу даних в Deductor Studio базується на виконанні наступних дій: імпорт даних, обробка даних, візуалізація, експорт даних.
Процес побудови моделей в Deductor ґрунтується на наступних трьох принципах: використання обробників, використання візуалізаторів, створення сценаріїв.
Обробка і візуалізація - дві атомарні операції з даними в Deductor. Під обробкою розуміються будь-які маніпуляції над набором даних: від найпростіших (наприклад, сортування) до складних (побудова нейроної мережі). Обробник можна представити у вигляді «чорного ящика», на вхід якого подається набір даних, а на виході формується перетворений набір даних.
Реалізовані в Deductor обробники задовольняють основну потребу в аналізі даних і створення закінчених аналітичних рішень на базі Data Mining. Будь-який набір даних можна візуалізувати яким-небудь доступним способом або декількома способами, оскільки візуалізація допомагає інтерпретувати побудовані моделі.
В Deductor Warehouse передбачені наступні способи візуалізації даних.
- OLAP. Багатовимірне представлення даних. Будь-які дані, що використовуються в програмі, можна подивитися у вигляді крос-таблиці і крос-діаграми.
- Таблица. Стандартне табличне уявленні з можливістю фільтрації даних.
- Диаграмма. Графік зміни будь-якого показника.
- Гистограмма. Графік розкиду показників.
- Статистика. Статистичні показники набору даних.
- Диаграмма рассеяния. Графік відхилення прогнозованих за допомогою моделі значень від реальних. Може бути побудована тільки для безперервних величин і лише після використання механізмів побудови моделі, наприклад, нейромережі або лінійної регресії. Використовується для візуальної оцінки якості побудованої моделі.
- Таблица сопряженности. Призначена для оцінки результатів класифікації незалежно від моделі, що використовується. Використовується для оцінки якості класифікації.
- «Что-если». Таблиця і діаграма. Дозволяють «проганяти» через побудовану модель будь-які дані, що цікавлять користувача, і оцінити вплив того або іншого чинника на результат.
- Обучающая выборка. Набір даних, що використовується для побудови моделі.
- Диаграмма прогноза. Застосовується після використовування методу обробки - Прогнозирование. Прогнозні значення виділяються кольором.
- Граф нейросети. Візуальне відображення навченої нейромережі. Відображається структура нейроної мережі і значення ваги;
- Дерево решений. Відображення дерева рішень, отриманого при допомозі відповідного алгоритму.
- Дерево правил. Відображення в ієрархічному виді (у вигляді дерева) асоціативних правил.