Suurimman uskottavuuden estimointi on tilastotieteellinen menetelmä, jota käytetään tilastollisen mallin parametrien estimointiin. Suurimman uskottavuuden menetelmä maksimoi uskottavuusfunktion mallin parametrien suhteen.
Suurimman uskottavuuden estimointi on alun perin Ronald Fisherin vuosina 1912–1922 esittelemä ja nimeämä menetelmä. Alkuperäistä teoriaa ovat sittemmin paikkailleet niin Fisher kuin myös Abraham Wald ja Harald Cramér, jotka molemmat tekivät lisärajoituksia teorian oletuksiin.
Suurimman uskottavuuden historian voidaan kuitenkin katsoa alkavan jo paljon aikaisemmin. Joseph-Louis Lagrange päätteli jo vuonna 1769, että halutun keskiarvon todennäköisin arvo on havaintojen aritmeettinen keskiarvo. Myös muun muassa Jakob Bernoullin (1769, 1778) ja Pierre-Simon Laplacen (1774) voidaan katsoa käyttäneen menetelmää. Carl Friedrich Gauss esitteli vuonna 1809 pienimmän neliösumman menetelmän, jonka tuottamat estimaatit ovat myös suurimman uskottavuuden estimaatteja silloin, kun satunnaisvirheet ovat normaalijakautuneita. Karl Pearson ja L.N.G Filon käsittelivät vuonna 1898 yleisen tason estimointiongelmaa, jossa on joukko moniulotteisia havaintoja, joiden jakauma riippuu tuntemattomista parametreista.[1]
Karl Pearson kritisoi Fisheriä ja suurimman uskottavuuden menetelmää siitä, ettei menetelmä uusi, vaan vain muunnos Gaussin esittämästä menetelmästä. Arthur Bowley vertasi suurimman uskottavuuden menetelmää Francis Ysidro Edgeworthin vuosina 1908-1909 tekemään työhön.[1][2]
Suurimman uskottavuuden menetelmän käyttämiseksi tarvitaan uskottavuusfunktio.
Olkoon
- on vektori, joka sisältää uskottavuusfunktion parametrit
- on havainnon otos (data)
- on datan todennäköisyysjakauman tiheysfunktio
Uskottavuusfunktio voidaan nyt määritellä seuraavasti
Menetelmä etsii :lle sellaisen estimaatin, joka maksimoi uskottavuusfunktion L(θ) arvon. Suurimman uskottavuuden estimaattori määritellään siis seuraavasti:
Usein oletetaan, että havainnot ovat toisistaan riippumattomia ja samoin jakautuneita. Tällöin voidaan lauseke kirjoittaa muotoon
Koska lineaarisen ja logaritmisen funktion ääriarvot löytyvät samoista pisteistä, voidaan sama esittää myös logaritmifunktioiden avulla, jolloin kertolaskun sijaan voidaan käyttää log-uskottavuutta, eli summaa
Suurimman uskottavuuden menetelmä estimoi θ0:n etsimällä sellaisen θ:n arvon, joka maksimoi uskottavuusfunktion. Tämä estimointimenetelmä määrää θ0:n suurimman uskottavuuden estimaatin
mikäli sellainen on olemassa. Suurimman uskottavuuden estimaatti on sama riippumatta siitä, maksimoidaanko uskottavuus- vai log-uskottavuusfunktiota, sillä logaritmi on monotonisesti kasvava funktio.
Suurimman uskottavuuden estimaattoreilla ei ole optimaalisia ominaisuuksia äärellisillä otoksilla.[3] Suurimman uskottavuuden estimointimenetelmä kuitenkin omaa useita haluttuja ominaisuuksia: Otoskoon kasvaessa kohti ääretöntä suurimman uskottavuuden estimaattoreilla on seuraavat ominaisuudet:
- Tarkentuvuus: suurimman uskottavuuden estimaatit suppenevat kohti estimoitavaa arvoa
- Asymptoottinen normaalisuus: otoskoon kasvaessa suurimman uskottavuuden estitmaattien jakauma lähestyy normaalijakaumaa
- Tehokkuus, eli se saavuttaa Cramér–Rao alarajan otoskoon lähestyessä ääretöntä. Tämä tarkoittaa sitä, ettei millään tarkentuvalla estimaattorilla ole alhaisempaa keskineliövirhettä kuin suurimman uskottavuuden estimaatilla
Normaalijakaumalla on tiheysfunktio
jolloin yhteistiheysfunktio n:n kokoiselle otokselle riippumattomia ja identtisesti jakautuneita normaalisia satunnaismuuttujia on
eli
missä on otoksen keskiarvo.
Tällä jakaumaperheellä on kaksi parametria θ = (μ, σ), joten maksimoimme uskottavuuden, , molempien parametrien suhteen.
Nyt voidaan laskujen helpottamiseksi käyttää log-uskottavuutta, sillä sen maksimoivat samat parametrien arvot jotka maksimoivat uskottavuuden.
josta saadaan ratkaisu :n estimaatiksi
Joka on funktion maksimi :lle, sillä se on funktion ainoa käännepiste ja funktion toinen derivaatta on pienempi kuin nolla. Koska :n odotusarvo on annetun jakauman parametrin arvo,
niin suurimman uskottavuuden estimaattori on harhaton.
Vastaavasti derivoidaan log-uskottavuus σ:n suhteen ja asetetaan tulos nollaksi:
jonka ratkaisu on
ja sijoittamalla saadaan
Nyt odotusarvo voidaan laskea merkitsemällä , jolloin saadaan estimaatiksi
ja hyödyntämällä tietoa ja , saadaan
Tämä tarkoittaa sitä, että on harhainen. Mutta on kuitenkin tarkentuva.
Formaalisti sanotaan, että :n suurimman uskottavuuden estimaattori on:
Moniulotteista normaalijakaumaa noudattavat satunnaismuuttujat X ja Y ovat riippumattomia vain, mikäli niiden yhteistiheysfunktio on niiden tiheysfunktioiden tulo, eli
Olkoon nyt kokoa n oleva vektori satunnaismuuttujia , jossa jokaisella muuttujalla on keskiarvo . merkitään lisäksi kovarianssimatriisi :lla.
Tällöin näiden n:n satunnaismuuttujan yhteistiheysfunktio on
Kahden muuttujan tapauksessa yhteistiheysfunktioksi saadaan
Tällaisissa tapauksissa, joissa yhteistiheysfunktio on olemassa uskottavuusfunktio määritellään, kuten yllä määritelmässä.
- ↑ a b Stigler, Stephen M.: The Epic Story of Maximum Likelihood. Statistical Science, 2007, 22. vsk, nro 4, s. 598–620. doi:10.1214/07-STS249
- ↑ Aldrich, John: R. A. Fisher and the making of maximum likelihood 1912–1922. Statistical Science, 1997, 12. vsk, nro 3, s. 162–176. doi:10.1214/ss/1030037906 MR:1617519
- ↑ Pfanzagl, Johann: Parametric statistical theory, s. 207–208. Berlin, DE: Walter de Gruyter, 1994. ISBN 3-11-013863-8
- In Jae Myung: Tutorial on maximum likelihood estimation. Journal of Mathematical Psychology, 2002. [1] (Arkistoitu – Internet Archive)
- Stock, James H. - Watson, Mark W.: Introduction to Econometrics. Addison Wesley, 2003.