Метад максімальнай праўдападобнасці

З пляцоўкі testwiki
Перайсці да навігацыі Перайсці да пошуку

Метад максімальнай праўдападобнасці (ММП) — метад Шаблон:Нп5 Шаблон:Нп5 меркаванага размеркавання імавернасцей на аснове выбаркі назіранняў. Ацэнка дасягаецца Шаблон:Нп5 Шаблон:Нп5 такім чынам, каб згодна з меркаванай Шаблон:Нп5 Шаблон:Нп5 былі найбольш праўдабадобнымі. Шаблон:Нп5 у Шаблон:Нп5, які максімізуе функцыю праўдападобнасці, называецца ацэнкай максімальнай праўдападобнасці[1]. Логіка метаду адначасова інтуіцыйная і гнуткая, таму ён стаў дамінуючым сродкам Шаблон:Нп5[2][3][4].

Калі функцыя праўдападобнасці Шаблон:Нп5, можна прымяніць Шаблон:Нп5 для знаходжання яе максімумаў. У некаторых выпадках максімум функцыі праўдападобнасці можна знайсці аналітычна; напрыклад, ацэнка Шаблон:Нп5 для мадэлі лінейнай рэгрэсіі максімізуе праўдападобнасць, калі мяркуецца, што ўсе назіранні маюць нармальнае размеркаванне з роўнай дысперсіяй[5].

З пункту гледжання Шаблон:Нп5, ацэнка максімальнай праўдападобнасці, як правіла, эквівалентная Шаблон:Нп5 з раўнамерным апрыёрным размеркаваннем (або нармальным апрыёрным размеркаваннем з бесканечным стандартным адхіленнем). У Шаблон:Нп5 метад максімальнай праўдападобнасці — асаблівы выпадак Шаблон:Нп5 з мэтавай функцыяй роўнай праўдападобнасці.

Прынцыпы

Набор назіранняў мадэлюецца як выпадковая Шаблон:Нп5 з невядомага супольнага размеркавання, якое задаецца наборам Шаблон:Нп5. Мэта метаду максімальнай праўдападобнасці — знайсці параметры, для якіх назіранні маюць найбольшую супольную імавернасць. Параметры, якія задаюць супольнае размеркаванне, запісваюцца як вектар θ=[θ1,θ2,,θk]𝖳, таму кажуць, што гэтае размеркаванне адносяцца да Шаблон:Нп5 {f(;θ)θΘ}, дзе Θ — Шаблон:Нп5, канечнамернае падмноства Шаблон:Нп5. Падстаўляючы назіранні 𝐲=(y1,y2,,yn) у функцыю шчыльнасці супольнага размеркавання, атрымліваем рэчаісназначную функцыю

n(θ)=n(θ;𝐲)=fn(𝐲;θ),

якая называецца Шаблон:Нп5. Для Шаблон:Нп5, fn(𝐲;θ) можна запісаць як здабытак аднамерных функцый шчыльнасці імавернасці:

fn(𝐲;θ)=k=1nfk𝗎𝗇𝗂𝗏𝖺𝗋(yk;θ).

Мэта метаду максімальнай праўдападобнасці — знайсці такія значэнні параметраў мадэлі з прасторы параметраў, для якіх функцыя праўдападобнасці будзе максімальнай[6]:

θ^=argmaxθΘn(θ;𝐲).

Інтуітыўна, знойдзенае такім чынам значэнне параметраў робіць назіранні найбольш імавернымі. Значэнне θ^=θ^n(𝐲)Θ, якое максімізуе функцыю праўдападобнасці n, называецца значэннем ацэнкі максімальнай праўдападобнасці. Калі існуе Шаблон:Нп5 θ^n:nΘ, то такая функцыя называецца Шаблон:Нп5 максімальнай праўдападобнасці. Звычайна гэтая функцыя задаецца на прасторы элементарных падзей і яе аргументам выступае пэўная выбарка. Шаблон:Нп5 ўмова яе існавання — непарыўнасць функцыі праўдападобнасці на Шаблон:Нп5 параметраў[7]. Для Шаблон:Нп5 Θ, функцыя праўдападобнасці можа павялічвацца не дасягаючы супрэмуму.

На практыцы часта бывае зручна працаваць з натуральным лагарыфмам функцыі праўдападобнасці, які называецца Шаблон:Нп5:

(θ;𝐲)=lnn(θ;𝐲).

Праз тое што лагарыфм — Шаблон:Нп5, максімум (θ;𝐲) дасягаецца пры тым самым значэнні θ, што і максімум n.[8]. Калі (θ;𝐲) — Шаблон:Нп5 на Θ, то Шаблон:Нп5 для максімуму (мінімуму) умовы

θ1=0,θ2=0,,θk=0

называюцца раўнаннямі праўдападобнасці. Для некаторых мадэляў удаецца знайсці іх аналітычныя развязкі θ^, але агульнага аналітычнага развязка задачы максімізацыі не існуе, і ацэнка максімальнай праўдападобнасці можа быць знойдзена толькі з дапамогай Шаблон:Нп5. Іншая праблема ў тым, што для канечных выбарак можа існаваць некалькі каранёў раўнанняў праўдападобнасці[9]. Шаблон:Нп5, матрыца частковых вытворных другога парадку, можа выкарыстоўвацца каб зразумець ці з’яўляецца знойдзены максімум θ^ лакальным:

𝐇(θ^)=[2θ12|θ=θ^2θ1θ2|θ=θ^2θ1θk|θ=θ^2θ2θ1|θ=θ^2θ22|θ=θ^2θ2θk|θ=θ^2θkθ1|θ=θ^2θkθ2|θ=θ^2θk2|θ=θ^].

Калі гесіян Шаблон:Нп5 ў θ^, то функцыя лакальна Шаблон:Нп5. Зручна тое, што найбольш вядомыя размеркаванні — у прыватнасці Шаблон:Нп5 — Шаблон:Нп5[10][11].

Абмежаваная прастора параметраў

Хаця звычайна абсяг вызначэння функцыі праўдападобнасці (Шаблон:Нп5) — канечнамернае падмноства Шаблон:Нп5, часам на яго могуць накладацца дадатковыя Шаблон:Нп5. У такім выпадку прастору параметраў можна запісаць як

Θ={θ:θk,h(θ)=0},

дзе h(θ)=[h1(θ),h2(θ),,hr(θ)] — Шаблон:Нп5 з k у r. Тады знайсці ацэнку максімальнай праўдападобнасці параметра θ з мноства Θ значыць знайсці θ, для якога дасягаецца максімум функцыі праўдападобнасці пры выкананні ўмоў h(θ)=0.

Тэарэтычна, самы натуральны падыход да гэтай задачы Шаблон:Нп5 — метад падстаноўкі. Гэта значыць дапаўненне ўмоў h1,h2,,hr да мноства h1,h2,,hr,hr+1,,hk такім чынам, што h=[h1,h2,,hk] — ін’екцыя з k у k, і рэпараметрызацыя функцыі праўдападобнасці ўвядзеннем ϕi=hi(θ1,θ2,,θk).[12]. Праз эквіварыянтнасць функцыі ацэнкі максімальнай праўдападобнасці, уласцівасці распаўсюджваюцца і на абмежаваныя ацэнкі[13]. Напрыклад, для многавымернага нармальнага размеркавання Шаблон:Нп5 Σ мусіць быць Шаблон:Нп5; гэта абмежаванне можна выканаць падстаноўкай Σ=Γ𝖳Γ, дзе Γ — рэчаісная Шаблон:Нп5, а Γ𝖳 — транспанаваная Γ (гл. Шаблон:Нп5 для доказу ін’ектыўнасці)[14].

На практыцы ўмовы звычайна накладаюцца Шаблон:Нп5, які прыводзіць да раўнанняў абмежаванай праўдападобнасці:

θh(θ)𝖳θλ=0 і h(θ)=0,

дзе λ=[λ1,λ2,,λr]𝖳 — вектар-слупок множнікаў Лагранжа, а h(θ)𝖳θ — матрыца Якобі частковых вытворных памеру Шаблон:Math[12]. Натуральна, калі абмежаванні не ўплываюць на максімум, множнікі Лагранжа маюць быць роўнымі нулю[15]. Гэта, у сваю чаргу, дазваляе правесці статыстычную праверку валіднасці абмежавання, вядомую як Шаблон:Нп5.

Уласцівасці

Ацэнка максімальнай праўдападобнасці — Шаблон:Нп5, якая максімізуе па θ Шаблон:Нп5 ^(θ;x). Калі назіранні Шаблон:Нп5, маем

^(θ;x)=1ni=1nlnf(xiθ),

што ёсць выбаркавым аналагам матэматычнага спадзявання лагарыфму праўдападобнасці (θ)=𝔼[lnf(xiθ)], узятага па сапраўднай шчыльнасці.

Ацэнка максімальнай праўдападобнасці не мае аптымальных уласцівасцей для канечных выбарак у тым сэнсе, што іншыя ацэнкі на канечных выбарках могуць мець большую канцэнтрацыю вакол сапраўднага значэння параметруШаблон:Sfn. Аднак, як і іншыя метады ацэнкі, ацэнка максімальнай праўдападобнасці мае шэраг прывабных Шаблон:Нп5: калі памер выбаркі павялічваецца да бясконцасці, паслядоўнасць ацэнак максімальнай праўдападобнасці мае наступныя ўласцівасці:

  • Шаблон:Нп5: паслядоўнасць ацэнак максімальнай праўдападобнасці збягаецца паводле імавернасці да ацэньваемага значэння.
  • Функцыянальная інварыянтнасць: Калі θ^ — ацэнка максімальнай праўдападобнасці для θ, а g(θ) — адвольнае пераўтварэнне над θ, то ацэнка максімальнай праўдападобнасці для α=g(θ) роўная α^=g(θ^).
  • Шаблон:Нп5: ацэнка дасягае ніжняй Шаблон:Нп5, калі памер выбаркі імкнецца к бесканечнасці. Гэта значыць, што ніводная слушная ацэнка не мае меншай асімптатычнай Шаблон:Нп5, чым ацэнка максімальнай праўдападобнасці (або іншыя ацэнкі, якія дасягаюць гэтай мяжы). Гэта таксама значыць, што для ацэнкі максімальнай праўдападобнасці ўласцівая Шаблон:Нп5.
  • Эфектыўнасць другога парадку пасля карэкцыі ўхілу.

Слушнасць

Пры выкананні прыведзеных ніжэй умоў, ацэнка максімальнай праўдападобнасці Шаблон:Нп5. Гэта значыць, што калі даныя былі ўтвораны функцыяй f(;θ0) і мы маем дастаткова вялікую колькасць назіранняў n, то магчыма знайсці значэнне θ0 з адвольнай дакладнасцю. У матэматычных тэрмінах гэта значыць, што калі n імкнецца да бесканечнасці, ацэнка θ^ Шаблон:Нп5 да сапраўднага значэння:

θ^mle p θ0.

Пры трохі стражэйшых умовах, ацэнка збягаецца Шаблон:Нп5 (або моцна):

θ^mle a.s. θ0.

На практыцы, даныя ніколі не ўтвараюцца f(;θ0). Наадварот, f(;θ0) — гэта мадэль, часта ў ідэалізаванай форме, працэсу, які ўтварае даныя. Паводле распаўсюджанага ў статыстыцы афарызму, Шаблон:Нп5. Такім чынам, сапраўдная слушнасць ніколі не дасягаецца на практыцы. Тым не менш, слушнасць часта ўважаецца пажаданай уласцівасцю для ацэнак.

Для слушнасці дастаткова наступных умоў.[16]

  1. Шаблон:Нп5 мадэлі: θθ0f(θ)f(θ0).Іншымі словамі, розным параметрам θ адпавядаюць розныя размеркаванні мадэлі. Калі гэтая ўмова не выконваецца, існуе пэўнае значэнне θ1, такое што θ0 і θ1 утвараюць роўныя размеркаванні даных. Тады немагчыма адрозніць гэтыя параметры нават з бясконцай колькасцю даных. Такія параметры называюцца Шаблон:Нп5.
    Ідэнтыфікавальнасць неабходная для слушнасці ацэнкі максімальнай праўдападобнасці. Калі гэтая ўмова выконваецца, абмежаваная функцыя лагарыфму праўдападобнасці (θ) мае адзіны глабальны максімум у θ0.
  2. Кампактнасць: прастора параметраў Θ мадэлі Шаблон:Нп5.

    Умова ідэнтыфікавальнасці гарантуе, што ў лагарыфма праўдападобнасці існуе адзіны глабальны максімум. Кампактнасць азначае, што праўдападобнасць не можа імкнуцца к максімальнаму значэнню ў нейкім іншым месцы (напрыклад як паказана на рысунку справа).
    Кампактнасць — толькі дастатковая, але не неабходная ўмова. Яна можа быць заменена некаторымі іншымі ўмовамі, такімі як:
    • адначасовая Шаблон:Нп5 функцыі лагарыфму праўдападобнасці і кампактнасць некаторага з яе непустых Шаблон:Нп5, або
    • існаванне кампактнага Шаблон:Нп5 N для θ0, такога што па-за наваколлем N функцыя лагарыфму праўдападобнасці меншая за максімум прынамсі на некаторы ε>0.
  3. Непарыўнасць: функцыя lnf(xθ) непарыўная ў θ для амаль усіх значэнняў x: [lnf(xθ)C0(Θ)]=1. Непарыўнасць можа быць замененая слабейшай умовай Шаблон:Нп5.
  4. Дамінантнасць: існуе інтэгравальная па размеркаванні f(xθ0) функцыя D(x), такая што |lnf(xθ)|<D(x)θΘ. Паводле раўнамернага закона вялікіх лікаў, умова дамінантнасці разам з непарыўнасцю гарантуе раўнамерную збежнасць паводле імавернасці лагарыфма праўдападобнасці: supθΘ|^(θx)(θ)| p 0. Умова дамінантнасці можа быць выкарыстана ў выпадку Шаблон:Нп5. Інакш, раўнамерная збежнасць паводле імавернасці можа быць забяспечана тым, што ^(θx) Шаблон:Нп5.

Калі неабходна прадэманстраваць, што ацэнка максімальнай праўдападобнасці θ^ збягаецца да θ0 Шаблон:Нп5, то мае выконвацца стражэйшая ўмова непарыўнай збежнасці амаль напэўна:

supθΘ^(θx)(θ) a.s. 0.

Акрамя таго, у дапушчэнні што даныя былі ўтвораны функцыяй f(;θ0), пры пэўных умовах можна паказаць, што ацэнка максімальнай праўдападобнасці Шаблон:Нп5 к нармальнаму размеркаванню[17]

n(θ^mleθ0) d 𝒩(0,I1),

дзе I — Шаблон:Нп5.

Функцыянальная інварыянтнасць

Калі θ^ — ацэнка максімальнай праўдападобнасці для θ, а g(θ) — трансфармацыя над θ, то ацэнка максімальнай праўдападобнасці для α=g(θ) роўная[18]

α^=g(θ^).

Яна максімізуе так званую Шаблон:Нп5:

L¯(α)=supθ:α=g(θ)L(θ).

Акрамя таго, ацэнка максімальнай праўдападобнасці інварыянтная ў дачыненні некаторых трансфармацый даных. Калі y=g(x), дзе g — біекцыя, якая не залежыць ад ацэньваемых параметраў, то функцыя шчыльнасці адпавядае

fY(y)=fX(x)|g(x)|

і функцыі праўдападобнасці для X і Y адрозніваюцца толькі множнікам, які не залежыць ад параметраў мадэлі.

Напрыклад, ацэнка максімальнай праўдападобнасці параметраў лог-нармальнага размеркавання такая самая як і ў нармальнага размеркавання, атрыманая на лагарыфмаваных даных.

Крыніцы

Шаблон:Reflist

Літаратура

Шаблон:Бібліяінфармацыя