Kufiri Cramér–Rao

Nga testwiki
Versioni i datës 6 gusht 2024 22:07 nga imported>InternetArchiveBot (Adding 1 book for Wikipedia:Vërtetueshmëria (20240806sim)) #IABot (v2.0.9.5) (GreenC bot)
(ndrysh) ← Version më i vjetër | Rishikimi i fundit (ndrysh) | Version më i ri → (ndrysh)
Kërceni tek navigimi Kërceni tek kërkimi
Ilustrimi i kufirit Cramer-Rao: nuk ka asnjë vlerësues të paanshëm që është në gjendje të vlerësojë parametrin (2-dimensional) me më pak variancë se lidhja Cramer-Rao, e ilustruar si elipsë e devijimit standard .

teorinë e vlerësimit dhe statistikë, kufiri Cramér–Rao ( CRB ) lidhet me vlerësimin e një parametri përcaktues (fiks, megjithëse i panjohur). Rezultati është emërtuar për nder të Harald Cramérit dhe C. R. Raos, [1] [2] [3] por gjithashtu është nxjerrë në mënyrë të pavarur nga Maurice Fréchet, [4] Georges Darmois, [5] dhe nga Alexander Aitken dhe Harold Silverstone . [6] [7] Njihet gjithashtu si kufiri i poshtëm Fréchet-Cramér–Rao ose Fréchet-Darmois-Cramér-Rao. Ai pohon se saktësia e çdo vlerësuesi të paanshëm është e shumta sainformacioni i Fisherit ; ose (në mënyrë të njëvlerëshme) reciprokja e informacionit Fisher është një kufi më i ulët në variancën e tij.

Një vlerësues i paanshëm që e arrin këtë kufi thuhet se është (plotësisht) efikas . Një zgjidhje e tillë arrin gabimin në katror të mesataruar më të ulët të mundshëm midis të gjitha metodave të paanshme, dhe për këtë arsye është vlerësuesi minimal i variancës së paanshme (VMVP). Megjithatë, në disa raste, nuk ekziston asnjë teknikë e paanshme që arrin kufirin. Kjo mund të ndodhë ose nëse për çdo vlerësues të paanshëm, ekziston një tjetër me një variancë rreptësisht më të vogël, ose nëse ekziston një vlerësues MVU, por varianca e tij është rreptësisht më e madhe se anasjellta e informacionit Fisher.

Kufiri Cramér–Rao mund të përdoret gjithashtu për të kufizuar variancën e vlerësuesve biased të paragjykimit të dhënë. Në disa raste, një qasje e njëanshme mund të rezultojë në një variancë dhe një gabim mesatar në katror që janë below kufirin e poshtëm të paanshëm Cramér–Rao; shih zhvendosjen e vlerësuesit .

Deklarata

Rasti skalar i paanshëm

Supozoni θ është një parametër i panjohur përcaktues i cili duhet vlerësuar nga n vëzhgimet (matjet) e pavarura të x, secila nga një shpërndarje sipas disa funksioneve të densitetit të probabilitetit f(x;θ) . Varianca e çdo vlerësuesi të paanshëm θ^ e θ më pas kufizohet [8] nga ana reciproke e informacionit Fisher I(θ) :

var(θ^)1I(θ)

ku informacioni i Fisherit I(θ) është përcaktuar nga

I(θ)=nEX;θ[((X;θ)θ)2]

dhe (x;θ)=log(f(x;θ)) është logaritmi natyror i funksionit të gjasave për një kampion të vetëm x dhe Ex;θ tregon vlerën e pritur në lidhje me densitetin f(x;θ) e X . Nëse nuk tregohet, në atë që vijon, pritshmëria merret në lidhje me X .

Nëse (x;θ) është dy herë i diferencueshëm dhe ekzistojnë kushte të caktuara të rregullsisë, atëherë informacioni i Fisherit mund të përcaktohet gjithashtu si më poshtë: [9]

I(θ)=nEX;θ[2(X;θ)θ2]

Efikasiteti i një vlerësuesi të paanshëm θ^ mat sa afër është varianca e këtij vlerësuesi me këtë kufi të poshtëm; efikasiteti i vlerësuesit përcaktohet si

e(θ^)=I(θ)1var(θ^)

ose variancën minimale të mundshme për një vlerësues të paanshëm pjesëtuar me variancën e tij të tanishme. Pra, kufiri i poshtëm Cramér–Rao jep

e(θ^)1 .

Rasti i përgjithshëm skalar

Një formë më e përgjithshme e kufirit mund të merret duke marrë parasysh një vlerësues të njëanshëm T(X), pritshmëria e të cilit nuk është θ por një funksion i këtij parametri, të themi, ψ(θ) . Prandaj E{T(X)}θ=ψ(θ)θ në përgjithësi nuk është e barabartë me 0. Në këtë rast, kufiri jepet nga

var(T)[ψ(θ)]2I(θ)

ku ψ(θ) është derivat i ψ(θ) (nga θ ), dhe I(θ) është informacioni i Fisherit i përcaktuar më sipër.

Rasti me shumë variacione

Zgjerimi i lidhjes Cramér–Rao në disa parametra, përcaktoni një vektor kolone parametri

θ=[θ1,θ2,,θd]Td

me funksionin e densitetit të probabilitetit f(x;θ) që plotëson dy kushtet e rregullsisë më poshtë.

Matrica e informacionit Fisher është a d×d matricë me element Im,k përcaktuar si

Im,k=E[θmlogf(x;θ)θklogf(x;θ)]=E[2θmθklogf(x;θ)].

Le 𝑻(X) të jetë një vlerësues i çdo funksioni vektorial të parametrave, 𝑻(X)=(T1(X),,Td(X))T, dhe shënoni vektorin e tij të pritjes E[𝑻(X)] nga ψ(θ) . Lidhja Cramér-Rao më pas thotë se matrica e kovariancës𝑻(X) kënaq

I(θ)ϕ(θ)Tcovθ(𝑻(X))1ϕ(θ) ,
covθ(𝑻(X))ϕ(θ)I(θ)1ϕ(θ)T

ku


Nëse 𝑻(X) është një vlerësues i paanshëm i θ (dmth, ψ(θ)=θ ), atëherë kufiri Cramér–Rao reduktohet në

covθ(𝑻(X))I(θ)1.

Kushtet e rregullsisë

Kufiri mbështetet në dy kushte të dobëta rregullsie mbi funksionin e densitetit të probabilitetit, f(x;θ), dhe vlerësuesin T(X) :

  • Informacioni i Fisherit është gjithmonë i përcaktuar; në mënyrë të barabartë, për të gjitha x sikurse f(x;θ)>0 , θlogf(x;θ)θlogf(x;θ)
  • Veprimet e integrimit në lidhje me x dhe diferencimi në lidhje me θ mund të ndërrohen në pritshmërinë e T ; kjo eshte,θ[T(x)f(x;θ)dx]=T(x)[θf(x;θ)]dxθ[T(x)f(x;θ)dx]=T(x)[θf(x;θ)]dx 

Një provë e pavarur për rastin e përgjithshëm skalar

Supozojmë se T=t(X) është një vlerësues me pritshmëri ψ(θ) (bazuar në vëzhgimet X ), pra atë E(T)=ψ(θ) . Qëllimi është që ta vërtetojmë këtë për të gjithë θ ,

var(t(X))[ψ(θ)]2I(θ).

Le X të jetë një ndryshore e rastit me funksion të densitetit të probabilitetit f(x;θ) . Këtu T=t(X) është një statistikë, e cila përdoret si vlerësues për ψ(θ) . Përcaktoni V si rezultat :

V=θlnf(X;θ)=1f(X;θ)θf(X;θ)

ku rregulli i zinxhirit përdoret në barazinë përfundimtare të mësipërme. Pastaj pritshmëria e V, shkruar E(V), është zero. Kjo është për shkak se:

E(V)=f(x;θ)[1f(x;θ)θf(x;θ)]dx=θf(x;θ)dx=0

ku derivati integral dhe i pjesshëm kanë këmbyer vendet (justifikohet me kushtin e dytë të rregullsisë).


Nëse marrim parasysh kovariancën cov(V,T) e V dhe T, ne kemi cov(V,T)=E(VT), sepse E(V)=0 . Duke e zgjeruar këtë shprehje kemi

cov(V,T)=E(T[1f(X;θ)θf(X;θ)])=t(x)[1f(x;θ)θf(x;θ)]f(x;θ)dx=θ[t(x)f(x;θ)dx]=θE(T)=ψ(θ)

përsëri sepse veprimet e integrimit dhe diferencimit ndërrohen (kushti i dytë).

Mosbarazimi Cauchy–Schwarz tregon këtë:

var(T)var(V)|cov(V,T)|=|ψ(θ)|

prandaj

var(T)[ψ(θ)]2var(V)=[ψ(θ)]2I(θ)

që vërteton propozimin.

Shembuj

Shpërndarja normale me shumë variacione

Për rastin e një shpërndarje normale <i id="mwATI">d</i> -variate

𝒙𝒩d(μ(θ),𝑪(θ))

matrica e informacionit të Fisherit ka elemente [10]

Im,k=μTθm𝑪1μθk+12tr(𝑪1𝑪θm𝑪1𝑪θk)

ku "tr" është gjurma .

Për shembull, le w[j] të jetë një shembull i n vëzhgime të pavarura me mesatare të panjohur θ dhe variancën e njohur σ2 .

w[j]𝒩d,n(θ1,σ2𝑰).

Pastaj informacioni i Fisher është një skalar i dhënë nga

I(θ)=(μ(θ)θ)T𝑪1(μ(θ)θ)=i=1n1σ2=nσ2,

dhe kështu kufiri Cramér–Rao jepet si

var(θ^)σ2n.

Variancë normale me mesataren e njohur

Supozoni se X është një ndryshore e rastit e shpërndarë normalisht me mesataren e njohur μ dhe variancë të panjohur σ2 . Merrni parasysh statistikën e mëposhtme:

T=i=1n(Xiμ)2n.

Atëherë T është i paanshëm për σ2, si E(T)=σ2 . Cila është varianca e T ?

var(T)=var(i=1n(Xiμ)2n)=i=1nvar(Xiμ)2n2=nvar(Xμ)2n2=1n[E{(Xμ)4}(E{(Xμ)2})2]

(barazia e dytë rrjedh drejtpërdrejt nga përkufizimi i variancës). Termi i parë është momenti i katërt në lidhje me mesataren dhe ka vlerë 3(σ2)2 ; i dyti është katrori i variancës, ose (σ2)2 . Kështu

var(T)=2(σ2)2n.

Tani, cili është informacioni i Fisher në vëzhgime. Kujtojmë se rezultati V përkufizohet si

V=σ2log[L(σ2,X)]

ku L është funksioni i përgjasisë . Kështu në këtë rast,

log[L(σ2,X)]=log[12πσ2e(Xμ)2/2σ2]=log(2πσ2)(Xμ)22σ2
V=σ2log[L(σ2,X)]=σ2[log(2πσ2)(Xμ)22σ2]=12σ2+(Xμ)22(σ2)2

ku barazia e dytë është nga llogaritja elementare. Kështu, informacioni në një vëzhgim të vetëm është vetëm minus pritshmëria e derivatit të V, ose

I=E(Vσ2)=E((Xμ)2(σ2)3+12(σ2)2)=σ2(σ2)312(σ2)2=12(σ2)2.

Kështu informacioni në një mostër të n vëzhgimet e pavarura janë të drejta n herë kjo, ose n2(σ2)2.

Kufiri Cramér–Rao thotë se

var(T)1I.

Në këtë rast, mosbarazimi është i ngopur (barazia arrihet), duke treguar se vlerësuesi është efikas .

Megjithatë, ne mund të arrijmë një gabim mesatar më të ulët në katror duke përdorur një vlerësues të njëanshëm. Vlerësuesi

T=i=1n(Xiμ)2n+2.

padyshim ka një variancë më të vogël, që është në fakt

var(T)=2n(σ2)2(n+2)2.

Anshmëria e tij është

(1nn+2)σ2=2σ2n+2

pra gabimi mesatar i tij në katror është

MSE(T)=(2n(n+2)2+4(n+2)2)(σ2)2=2(σ2)2n+2

që është më pak se ajo që vlerësuesit e paanshëm mund të arrijnë sipas kufirit Cramér–Rao.