Līdzības un attāluma mēri
Klasteru līdzības jeb attāluma mērs ir kvantitatīvs lielums, kas daudzdimensiju analīzē raksturo saikni jeb līdzību starp pētāmajiem objektiem. Klasteru analīze spēj dot atšķirīgus rezultātus vieniem un tiem pašiem datiem, līdz ar to, lai pareizi izvēlētos līdzības mēru, jānovērtē gan mainīgā veids, gan mērvienību skala, gan pētāmā objekta būtību. Kad dotie dati ir sadalīti klasteros, var aprēķināt to līdzības jeb tuvuma precīzu novērtējumu. Atkarībā no mainīgā veida tiek izdalītas divas attālumu mēru pamatgrupas: mēri mainīgajiem, kas pieder metriskajai skalai[1] un mēri bināriem mainīgajiem.
Mēri metriskiem mainīgajiem
labot šo sadaļu- Eiklīda attālums — attālums starp diviem punktiem daudzdimensiju telpā (tas atbilst tos savienojošā nogriežņa garumam).
- Eiklīda attāluma kvadrāts — šāda pieeja ļauj lielāku svaru piešķirt tieši lielajiem attālumiem. Šo metodi vienmēr jāizmanto, ja veidojot klasterus tiek izmantota mediānu vai Ward metode.
- Pīrsona korelācijas koeficients - atrodas intervālā no -1 līdz 1.
- Kosinuss — arī šis koeficients atrodas robežās no -1 līdz 1, taču ir aprēķināms pēc mazliet citādākas formulas.
- Čebiševa attālums[2] — par šo attālumu izvēlās lielāko pēc moduļa starpību, kas atbilst izvēlēto novērojumu vērtībām.
- Kvartālu jeb Manhatanas attālums — aprēķina kā vērtību pāru starpību absolūto vērtību summu. Divu dimensiju gadījumā tas nav Eiklīda taisnvirziena attālums starp diviem punktiem, bet gan ceļš, kas jāveic, lai nokļūtu "Manhatanā no vienas ēkas līdz otrai pa savstarpēji perpendikulārām ielām".
- Minkovska attālums. Vispārināts Minkovska attālums tiek nosaukts par pakāpes attālumu, kas tiek aprēķināts pēc šādas formulas:
- Minkovska attālumu parasti lieto, pieņemot, ka pakāpe p ir 1 vai 2, iegūstot attiecīgi Manhatanas un Eiklīda attālumus. Savukārt, pakāpei p tiecoties uz bezgalību, tiek iegūts Čebiševa attālums:
Mēri bināriem mainīgiem
labot šo sadaļu- Eiklīda attāluma kvadrāts — arī binārajiem mainīgajiem izmanto šo attāluma mēru, taču interpretācija ir mazliet atšķirīga, jo rādītājs parāda novērojumu skaitu, kuriem viens no kritērijiem neizpildās, bet otrs izpildās.
- Eiklīda attālums — aprēķināms kā kvadrātsakne no iepriekš minētā rādītāja.
- Citi mēri, tajā skaitā: attāluma starpība, starpības etalons, dispersija, forma, kā arī Lance un Williams attāluma mēri.
Atsauces
labot šo sadaļuĀrējās saites
labot šo sadaļu- Vizuāls pārskats par attālumu mēriem
- StatSoft mājaslapa Arhivēts 2015. gada 1. maijā, Wayback Machine vietnē.
- SciTopics mājaslapa