Скачать книгу

1. Joonisel 1 esitatud inimeste pikkus ja kehakaal

      Kovariatsioon

      Niisiis, üldiselt kaldub kehakaal muutuma koos pikkusega, kuid see koosmuutus ei ole alati ühesugune. Näiteks inimene A on kõige lühem, kuid kaalub rohkem kui B või C. Samuti kaalub kõige pikem inimene g vähem kui temast lühem, kuid kogukam F. Seega, ehkki seos on ilmne, ei saa me pikkuse põhjal ideaalse täpsusega ennustada, kui palju keegi kaalub. Teisisõnu, võime ütelda, et koosmuutus ehk kovariatsioon pikkuse ja kaalu vahel on olemas, kuid see ei ole täiuslik.

      Kovariatsioon Covxy muutujate x ja y vahel on defineeritud järgmiselt:

      Seega näitab kovariatsioon kahe muutuja koosmuutust: kas ühe muutuja kasvuga teine muutuja kasvab või kahaneb.

      Kõige mugavam on kahe tunnuse koosmuutust vaadata pildil, sest inimese silm on küllalt hea koosmuutuste avastaja. Joonisel 2 on horisontaalteljele kantud seitsme inimese kaal ja vertikaalteljele nende pikkus.

      JOONIS 2. Koosmuutuvus.

      Pildil oleva joone kohta ei ütle me hetkel midagi, kuid võime anda vihje. Kui prooviksime joonistada silma järgi pildile ühe sirge, millele kõik punktid Ast kuni Gni oleksid maksimaalselt lähedal, siis oleks selle joone asukoht pildil üsna sarnane joonistatuga.

      Koosmuutuse arvutamine

      Nagu eespool toodud valemist näha, tuleb kahe tunnuse kovariatsiooni leidmiseks mõlema tunnuse hajuvuste valemid n-ö kokku sulatada. Oluline on tähele panna, et kahe tunnuse väärtused peavad olema paarides. Pikkuse ja kehakaalu näites on üheks paariks ühe kindla inimese pikkus ja kehakaal. Vastavalt ülaltoodud valemile tuleb kovariatsiooni leidmiseks kummagi muutuja üksikväärtused lahutada keskmisest ja üksteisega läbi korrutada. Tuleks hoolega tähele panna, et hälbeid ei võeta siin ruutu, sest ka negatiivsed väärtused on informatiivsed. Saadud korrutised liidetakse ning jagatakse läbi paaride arvuga (eelnevas näites inimeste arvuga, kelle mõõtude põhjal pikkuse ja kehakaalu seost arvutatakse). Toome aga appi ka päris numbrid.

      1. Keskmine pikkus on 1,78 m ja kehakaal 71,14 kg.

      2. Kodanike A kuni G pikkuste hälbed keskmisest on seega vastavalt –0,26, –0,18, –0,10, 0,00, 0,08, 0,16 ja 0,31 ning kehakaalude hälbed vastavalt –17,14, –22,14, –21,14, –4,14, –1,14, 38,86 ja 26,86.

      Kui need hälbed paarides läbi korrutada, saame tulemusteks vastavalt 4,46, 3,99, 2,11, 0,00, –0,09, 6,22 ja 8,33. Hälvete korrutisi kokku liites saame summaks 25,01. Et kovariatsioon on võrdne hälvete korrutise aritmeetilise keskmisega, siis jagame saadud summa inimeste arvuga ning saame 25,01/7 = 3,57. Seda numbrit nimetataksegi kovariatsioonikordajaks.

      Miks me nii tegime? Selle arvutuskäigu aluseks olev idee on tegelikult äärmiselt lihtne. Kui tunnuse üksikuid väärtusi võrreldakse keskmisega, siis keskmisest väikesemad väärtused saavad negatiivse märgi ning suuremad positiivse märgi, kusjuures mida suurem on erinevus keskmisest, seda suurem on ka hälve ühes või teises suunas. Kovariatsiooni arvutamise käigus moodustame kahe tunnuse väärtustest paarid – meie näites iga inimese kohta pikkus ja kehakaal – ning vaatame kummagi paariliikme hälbeid korraga. Kui ühe tunnuse väärtuse muutumine on mingil määral seotud teise tunnuse väärtuste muutumisega, siis peaksid hälbed olema märgi mõttes süstemaatiliselt kas sarnased (kui tunnuste väärtused muutuvad samas suunas ehk ühe suurenedes suureneb ka teine) või erinevad (kui tunnuste väärtused liiguvad eri suundades – ühe vähenedes teine suureneb). Samuti peaksid need suhtelise suuruse mõttes olema sarnased.

      Oma näites näeme, et viiel juhul seitsmest käib keskmisest lühem pikkus koos keskmisest madalama kehakaaluga (A, B ja C), suurem pikkus aga suurema kehakaaluga (F ja G). Lühikeste ja kergete inimeste puhul (A, B ja C) on mõlema tunnuse väärtuste hälbed keskmisest negatiivse suunas ning suhteliselt suured. Nende hälvete korrutamine annab meile kaks suhteliselt suurt positiivset väärtust. Sama juhtub pikkade ja suure kehakaaluga inimeste puhul (F ja G). Nende tunnustepaaride puhul kehtib eeldatav seos hästi ja need paarid kasvatavad tublisti kovariatsioonikordaja väärtust. Samas näeme, et ühe inimese puhul (E) on seos vastupidine: kehakaalu hälve on negatiivne (kaal on alla keskmise), aga pikkuse hälve on positiivne (pikkus on üle keskmise). Kui inimesed A, B, C, F ja G kasvatasid kovariatsioonikordaja lugeja väärtust, siis E hoopis kahandab seda, sest tema puhul leitud hälvete korrutamine annab meile negatiivse numbri. Viimane mees valimis (D), mõjutab aga kovariatsioonikordaja lugeja väärtust üsna vähe (õigupoolest üldse mitte), sest nii tema kehakaal kui pikkus on lähedal keskmisele ja tema puhul leitud hälvete korrutis seega olematu.

      Kovariatsioonikordaja lõplik väärtus sõltub sellest, kui palju on korrelatsiooni kasvu panustanud paare ning kui tugevasti nad panustavad võrreldes nende paaridega, kes kordaja väärtust kahandavad või üldse eriti ei mõjuta. Meie näites andsid viis paari panuse kovariatsioonikordaja kasvu, üks paar kahandas seda ning üks ei mõjutanud peaaegu üldse. Seega oli panustajaid kõige rohkem, mistõttu kovariatsioonikordaja tuli nullist tublisti suurem.

      Samas võime ette kujutada ka niisugust olukorda, kus tunnuste vahel on vastupidine seos: ühe vähenedes teine hoopis süstemaatiliselt suureneb. Kui me vaatame näiteks päikesepaiste ning sademete hulga seost päevade kaupa, siis tõenäoliselt näeme, et mida rohkem ühel päeval sajab, seda vähem kipub sel päeval olema päikesevalgust. Niisuguste seoste puhul on kovariatsioonikordaja arvutamise loogika samasugune, ainus erinevus on selles, et hälvete märgid on süstemaatiliselt vastupidised ning nende korrutised seetõttu negatiivsed. See tähendab, et mida tugevam on tunnuste vastupidine seos, seda väikesem nullist on vastav kovariatsioonikordaja.

      Muidugi mõista ei ole enamik tunnuseid, mille vahel oleks põhimõtteliselt võimalik korrelatsiooni arvutada, üldse süstemaatiliselt seotud. Näiteks võib arvata, et meeste puhul ei ole juuste pikkus vähimalgi määral seotud kehakaaluga. Kui me juuste pikkuse ja kehakaalu korral kordaksime sarnast arvutuskäiku, nagu eespool pikkuse ja kehakaalu puhul, siis ilmselt leiaksime, et tekiks üsna võrdselt negatiivseid ja positiivseid hälvete korrutisi ning nende keskmine oleks seega nullilähedane. Muide, mehi ja naisi koos vaadates me ilmselt siiski leiaksime süstemaatilise seose: mida lühemad juuksed, seda suurem kehakaal. Põhjus on selles, et naistel kalduvad olema pikemad juuksed ning väikesem kehakaal kui meestel.

      Kovariatsioonikordaja on üpris informatiivne arv, sest näitab ära nii seose tugevuse (mida suurem on kordaja, seda tugevam seos) kui suuna (positiivne number tähendab tunnuste vahel samapidist, negatiivne number vastupidist seost). Siiski on selle numbriga seotud ka üks probleem. Nimelt nõuab kovariatsioonikordaja sisukas tõlgendamine lisainformatsiooni, sest selle muutlikkuse piirid ei ole standardsed – kovariatsioonikordaja minimaalne ja maksimaalne väärtus sõltuvad selle aluseks olnud tunnuste hajuvustest. Kovariatsioonikordaja maksimaalseks väärtuseks on kahe tunnuse standardhälvete (ruutjuur hajuvusest) korrutis ning minimaalseks väärtuseks seesama korrutis miinusmärgiga. See tähendab, et minimaalsed ja maksimaalsed väärtused on erisuguste lähteandmete puhul väga erinevad, mistõttu kovariatsioonikordaja tugevusele hinnangu andmine on mõnevõrra tülikas. Hoopis meeldivam oleks, kui tunnuste seoseid kirjeldavaid arve saaks väljendada mingil standardsel skaalal, mille otspunktid on kõigile teada ja alati samad. Nii oleks võimalik tunnuste seoste suunda ja tugevust mõista ilma igasuguse lisainformatsioonita, samuti oleks võimalik erinevate tunnustepaaride puhul leitud seoseid otseselt võrrelda.

      Õnneks on siin lahendus väga lihtne. Kui kovariatsioonikordaja võimalikud piirid on seotud selle arvutamise aluseks olnud tunnuste standardhälvete korrutisega, siis pole ju midagi lihtsamat, kui kovariatsioonikordaja sellesama standardhälvete korrutisega läbi jagada. Niisugune samm annakski meile soovitud standardse skaala, sest see jagatis saab varieeruda üksnes vahemikus –1…1. Kui kovariatsioonikordaja on võrdne oma minimaalse võimaliku väärtusega, siis jagamistehte tulemusena omandab see väärtuse –1. Kui kovariatsioonikordaja väärtus on

Скачать книгу