Математико-географічна характеристика промисловості Львівської області
,
де m – кількість об’єктів;
а середнє квадратичне відхилення - за формулою [ 42 ].
.
Таксономічні методи класифікації ґрунтуються на виділенні груп об’єктів найбільш близьких у багатовимірному просторі. Для визначення ступеня близькості між об’єктами обчислюються таксономічні відстані між ними. Вихідною для обчислення таксономічних відстаней служить матриця нормованих значень показників.
В багатовимірному просторі обчислюють таксономічні відстані на основі функції відстаней. Найголовніша з них евклідова відстань , яка обчислюється за розширеною теоремою Піфагора :
[ 42 ] ;
На основі матриці таксономічних відстаней об’єкти групуються за допомогою різноманітних прийомів. Найпоширенішим є прийом “дерева поєднань”.
Метод “дерева поєднань” описав американський вчений Б.Беррі . Він полягає у своєрідній обробці і графічному відображенні матриці таксономічних відстаней (рис. 1.4.1 ).
Рис. 1.4.1 Граф “дерево поєднань”.
Для цього у певній матриці вибирають найменший елемент. Припустимо, що це число 0.57, що міститься на перетині рядка N і стовпчика C ( або рядка C і стовпчика N ). Відстань 0.57 означає, що у багатовимірному просторі серед інших об’єктів C і N перебувають найближче один до одного. Це означає також , що вони містяться і на більш менш однаковій відстані до інших об’єктів. Звідси об’єкти С і N можна замінити іншим, третім об’єктом ( позначимо його через U ). Відстань третього, похідного об’єкта до інших об’єктів покладають усередненій сумі відстаней об’єктів С і N до кожного з інших об’єктів. Наприклад , якщо відстань від С до В становить 3.05 , а від N до В - 3.29, то відстань від U до В кладуть (3.05+3.29 ) / 2 = 6.34 / 2 = 3.17. Обчислюють таким чином відстані від U до інших об’єктів. Матриця таксономічних відстаней з розмірності m*n перетвориться у матрицю розмірністю (m-1)*(m-1).
Злиття двох об’єктів (C і N) позначають графічно з допомогою – “дерева поєднань”. На ньому проводять ребра від вершин С і N до вершини U, яка символізує злиття об’єктів С і N в одну групу.
Далі в матриці таксономічних відстаней розмірністю ( m-1 ) * ( m-1 ) знаходять новий найменший елемент. Ним є елемент 1.70 на перетині рядка А і стовпчика М. Тому рядки А і М ( та стовпчики А і М ) зливаються у новий рядок (стовпчик) шляхом усереднення суми значень їх елементів. Розмір матриці знову зменшується і стає ( m-2 ) * ( m-2 ). На графі відкладається нове поєднання елементів.
Цей процес триває доти, поки матриця таксономічних відстаней не буде розмірності 2 x 2. При цьому на певному етапі об’єднуються не два вихідні об’єкти ( наприклад, А і М ), а один вихідний об’єкт та об’єкт, одержаний у результаті злиття двох інших, або два похідні об’єкти.
Оцінка якості розбиття вихідної множини об’єктів на класи – складна математична проблема. Існує багато критеріїв цього процесу, один із найважливіших є мінімізація внутрішньогрупової та максимізація міжгрупової дисперсії.
На практиці група класів часто-густо визначається апріорно. Коли “ дерево поєднань” вже побудоване, то за його зовнішнім виглядом можна визначити, які об’єкти утворюють групи .
Кожну із виділених груп об’єктів трактують як їх клас. Це означає , що об’єкти в певній групі подібні, однорідні. Якщо ж до того ці об’єкти суміжні на земній поверхні, то вони утворюють однорідні регіони. На картографічній моделі кожен з таких регіонів зафарбовують в один колір.