Līdzības un attāluma mēri

Klasteru līdzības jeb attāluma mērs ir kvantitatīvs lielums, kas daudzdimensiju analīzē raksturo saikni jeb līdzību starp pētāmajiem objektiem. Klasteru analīze spēj dot atšķirīgus rezultātus vieniem un tiem pašiem datiem, līdz ar to, lai pareizi izvēlētos līdzības mēru, jānovērtē gan mainīgā veids, gan mērvienību skala, gan pētāmā objekta būtību. Kad dotie dati ir sadalīti klasteros, var aprēķināt to līdzības jeb tuvuma precīzu novērtējumu. Atkarībā no mainīgā veida tiek izdalītas divas attālumu mēru pamatgrupas: mēri mainīgajiem, kas pieder metriskajai skalai[1] un mēri bināriem mainīgajiem.

Mēri metriskiem mainīgajiem

labot šo sadaļu
  • Eiklīda attālums — attālums starp diviem punktiem daudzdimensiju telpā (tas atbilst tos savienojošā nogriežņa garumam).
  • Eiklīda attāluma kvadrāts — šāda pieeja ļauj lielāku svaru piešķirt tieši lielajiem attālumiem. Šo metodi vienmēr jāizmanto, ja veidojot klasterus tiek izmantota mediānu vai Ward metode.
  • Pīrsona korelācijas koeficients - atrodas intervālā no -1 līdz 1.
  • Kosinuss — arī šis koeficients atrodas robežās no -1 līdz 1, taču ir aprēķināms pēc mazliet citādākas formulas.
  • Čebiševa attālums[2] — par šo attālumu izvēlās lielāko pēc moduļa starpību, kas atbilst izvēlēto novērojumu vērtībām.
  • Kvartālu jeb Manhatanas attālums — aprēķina kā vērtību pāru starpību absolūto vērtību summu. Divu dimensiju gadījumā tas nav Eiklīda taisnvirziena attālums starp diviem punktiem, bet gan ceļš, kas jāveic, lai nokļūtu "Manhatanā no vienas ēkas līdz otrai pa savstarpēji perpendikulārām ielām".
  • Minkovska attālums. Vispārināts Minkovska attālums tiek nosaukts par pakāpes attālumu, kas tiek aprēķināts pēc šādas formulas:
 
Minkovska attālumu parasti lieto, pieņemot, ka pakāpe p ir 1 vai 2, iegūstot attiecīgi Manhatanas un Eiklīda attālumus. Savukārt, pakāpei p tiecoties uz bezgalību, tiek iegūts Čebiševa attālums:
 

Mēri bināriem mainīgiem

labot šo sadaļu
  1. Mark S. Aldenderfer, Roger K. Blashfield Cluster analysis, 1985.
  2. М. С. Олдендерфер, Р. К. Блэшфилд. Кластерный анализ. Финансы и статистика, 1989.

Ārējās saites

labot šo sadaļu