Shpërndarja hi katror

Nga testwiki
Versioni i datës 1 tetor 2023 17:11 nga imported>Smallem (Përsht. e përkoh.-fillimi; Përshtat. e përkoh.-përfund.; Rreg. me param. e datës)
(ndrysh) ← Version më i vjetër | Rishikimi i fundit (ndrysh) | Version më i ri → (ndrysh)
Kërceni tek navigimi Kërceni tek kërkimi

Stampa:Infobox shpërndarja e gjasës

teorinë e probabilitetit dhe statistikë, shpërndarja hi-katrore (gjithashtu hi-katror ose χ2 -shpërndarja ) me k shkallë lirie është shpërndarja e një shume të katrorëve të k ndryshoreve rasti të pavarura standarde normale. Shpërndarja hi katror është një rast i veçantë i shpërndarjes gama dhe është një nga shpërndarjet më të përdorura të probabilitetit në statistikat konkluzive, veçanërisht në testimin e hipotezave dhe në ndërtimin e intervaleve të besimit . [1] [2] [3] Kjo shpërndarje quhet nganjëherë shpërndarja qendrore hi-katrore, një rast i veçantë i shpërndarjes më të përgjithshme joqendrore hi-katrore .

Shpërndarja hi-katrore përdoret kryesisht në testimin e hipotezave dhe në një masë më të vogël për intervalet e besimit për variancën e popullatës kur shpërndarja themelore është normale. Ndryshe nga shpërndarjet më të njohura si shpërndarja normale dhe shpërndarja eksponenciale, shpërndarja hi-katrore nuk përdoret aq shpesh në modelimin e drejtpërdrejtë të dukurive natyrore. Ajo lind në testet e hipotezave të mëposhtme, ndër të tjera:

Përkufizimet

Nëse Z1,Z2,...,Zk janë ndryshore rasti normale standarde të pavarura, atëherë shuma e katrorëve të tyre,

Q =i=1kZi2,

shpërndahet sipas shpërndarjes hi-katrore me k shkallë lirie. Kjo zakonisht shënohet si

Q  χ2(k)  ose  Q  χk2.

Shpërndarja hi-katrore ka një parametër: një numër i plotë pozitiv k që specifikon numrin e shkallëve të lirisë (numrin e ndryshoreve të rastit që mblidhen).

Paraqitje

Shpërndarja hi-katrore përdoret kryesisht në testimin e hipotezave dhe në një masë më të vogël për intervalet e besimit për variancën e popullatës kur shpërndarja e saj është normale. Ndryshe nga shpërndarjet më të njohura si shpërndarja normale dhe shpërndarja eksponenciale, shpërndarja hi-katrore nuk përdoret aq shpesh në modelimin e drejtpërdrejtë të fenomeneve natyrore. Ajo lind në testet e hipotezave të mëposhtme, ndër të tjera:

  • Testi hi-katror i pavarësisë në tabelat e kontigjencës
  • Testi hi-katror i përshtatshmërisë së të dhënave të vëzhguara me shpërndarjet hipotetike
  • Testi i raportit të përgjasisë për modelet e folezuara
  • Testi log-rank në analizën e mbijetesës
  • Testi Cochran–Mantel–Haenszel për tabelat e shtresuara të kontigjencës
  • Testi Wald
  • Testi i rezultateve

Është gjithashtu një përbërës i përkufizimit të shpërndarjes t dhe shpërndarjes F të përdorur në testet t, analizën e variancës dhe analizën e regresionit.

Supozoni se Z është një ndryshore e rastit e kampionuar nga shpërndarja normale standarde, ku mesatarja është 0 dhe varianca është 1 : ZN(0,1) . Tani, merrni parasysh ndryshoren e rastit Q=Z2 . Shpërndarja e ndryshores së rastit Q është një shembull i një shpërndarjeje hi-katrore:  Q  χ12 . Nënshkrimi 1 tregon se kjo shpërndarje e veçantë hi-katrore është ndërtuar nga vetëm 1 shpërndarje normale standarde. Një shpërndarje hi-katrore e ndërtuar duke ngritur në katror një shpërndarje normale standarde të vetme thuhet se ka 1 shkallë lirie. Kështu, ndërsa madhësia e kampionit për një test hipoteze rritet, shpërndarja e statistikave të testit i afrohet një shpërndarjeje normale. Ashtu si vlerat ekstreme të shpërndarjes normale kanë probabilitet të ulët (dhe japin vlera të vogla p), vlerat ekstreme të shpërndarjes hi-katrore kanë probabilitet të ulët.

Një arsye shtesë që shpërndarja hi-katrore përdoret gjerësisht është se ajo shfaqet si shpërndarja e kampionit të madh të testeve të raportit të përgjithësuar të përgjasisë (LRT). [4] LRT-të kanë disa veti të dëshirueshme; në veçanti, LRT-të e thjeshta zakonisht ofrojnë fuqinë më të lartë për të refuzuar hipotezën zero ( lema Neyman–Pearson ) dhe kjo çon gjithashtu në vetitë optimale të LRT-ve të përgjithësuara. Megjithatë, përafrimet normale dhe hi-katrore janë të vlefshme vetëm në mënyrë asimptotike. Për këtë arsye, është e preferueshme të përdoret shpërndarja t në vend të përafrimit normal ose përafrimit hi-katror për një madhësi të vogël kampioni. Në mënyrë të ngjashme, në analizat e tabelave të kontigjencës, përafrimi sipas hi-katror do të jetë i dobët për një madhësi të vogël kampioni dhe preferohet të përdoret testi i saktë i Fisher-it . Ramsey tregon se testi i saktë binomial është gjithmonë më i fuqishëm se përafrimi normal. [5]

Lancaster tregon lidhjet midis shpërndarjeve binomiale, normale dhe hi-katrore, si më poshtë. [6] De Moivre dhe Laplace vërtetuan se një shpërndarje binomiale mund të përafrohet me një shpërndarje normale. Konkretisht ata treguan normalitetin asimptotik të ndryshores së rastit

χ=mNpNpq

ku m është numri i vëzhguar i sukseseve në N prova, ku është probabiliteti i suksesit p, dhe q=1p .

Ngritja në katror e të dyja anëve të ekuacionit jep

χ2=(mNp)2Npq

Duke përdorur N=Np+N(1p), N=m+(Nm), dhe q=1p, ky ekuacion mund të rishkruhet si

χ2=(mNp)2Np+(NmNq)2Nq

Shprehja në të djathtë është e formës që Karl Pearson do ta përgjithësonte në formën

χ2=i=1n(OiEi)2Ei


χ2 = Statistika e testit kumulativ të Pearson-it, e cila në mënyrë asimptotike i afrohet a χ2 shpërndarja;

Oi = numri i vëzhgimeve të llojit i ;

Ei=Npi = frekuenca e pritur (teorike) e tipit i, e pohuar nga hipoteza zero se thyesa e tipit i në popullatë është pi ;

dhe n = numri i qelizave në tabelë.

Funksioni i dendësisë së probabilitetit

Funksioni i dendësisë së probabilitetit (FDP) i shpërndarjes hi-katrore është

f(x;k)={xk/21ex/22k/2Γ(k2),x>0;0,përndryshe.

ku Γ(k/2) tregon funksionin gama, i cili ka vlera të formës së mbyllur për numrin e plotë <span about="#mwt180" class="mwe-math-element" data-mw="{&quot;name&quot;:&quot;math&quot;,&quot;attrs&quot;:{},&quot;body&quot;:{&quot;extsrc&quot;:&quot;k&quot;}}" id="7" typeof="mw:Extension/math"><span class="mwe-math-mathml-inline mwe-math-mathml-a11y" style="display: none;"><math xmlns="http://www.w3.org/1998/Math/MathML"> <semantics> <mrow class="MJX-TeXAtom-ORD"> <mstyle displaystyle="true" scriptlevel="0"> <mi>k</mi> </mstyle> </mrow> <annotation encoding="application/x-tex">{\displaystyle k}</annotation> </semantics> </math></span><img alt="k" aria-hidden="true" class="mwe-math-fallback-image-inline" data-cx="{&quot;adapted&quot;:false}" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/c3c9a2c7b599b37105512c5d570edc034056dd40" style="vertical-align: -0.338ex; width:1.211ex; height:2.176ex;"></span> .

Funksioni mbledhës i shpërndarjes

Chernoff i kufizuar për FMP dhe bishtin (1-FMP) të një ndryshoreje të rastit hi-katrore me dhjetë shkallë lirie ( k=10 )

Funksioni i tij mbledhës i shpërndarjes është:

F(x;k)=γ(k2,x2)Γ(k2)=P(k2,x2),

ku γ(s,t) është funksioni më i ulët i gama jo i plotë dhe P(s,t) është funksioni gama i rregulluar .

Në një rast të veçantë të k=2 Ky funksion ka formën e thjeshtë:

F(x;2)=1ex/2

Vetitë

Teorema e Koçranit

Nëse Z1,...,Zn janë n.r të pavarura të shpërndara në mënyrë identike (iid), standarde normale, atëherë t=1n(ZtZ¯)2χn12 ku Z¯=1nt=1nZt.

Mbledhja

Nga përkufizimi i shpërndarjes hi-katrore rezulton se shuma e ndryshoreve të pavarura hi-katrore është gjithashtu e shpërndarë sipas ligjit hi-katror. Konkretisht, nëse Xi,i=1,n janë ndryshore të pavarura hi-katror me ki, i=1,n shkallët e lirisë, përkatësisht, atëherë Y=X1++Xn është hii-katror i shpërndarë me k1++kn shkallë lirie.

Mesatarja e kampionit

Mesatarja e kampionit së n iid ndryshoreve hi-katror me k shkallë lirie shpërndahet sipas një shpërndarjeje gama me formë α dhe shkallë θ parametrat:

X=1ni=1nXiGamma(α=nk/2,θ=2/n)ku Xiχ2(k)

Në mënyrë asimptotike, duke pasur parasysh se për një parametër shkallë α duke shkuar në pafundësi, një shpërndarje Gama konvergjon drejt një shpërndarjeje normale me pritje μ=αθ dhe variancë σ2=αθ2, mesatarja e kampionit konvergjon drejt:

XnN(μ=k,σ2=2k/n)

Përqendrimi

Shpërndarja hi-katrore shfaq përqendrim të fortë rreth mesatares së saj. Kufijtë standardë të Laurent-Massart [7] janë:

P(Xk2kx+2x)exp(x)
P(kX2kx)exp(x)

Vetitë asimptotike

Formula e përafërt për mesataren (nga transformimi Wilson–Hilferty) krahasuar me kuantilin numerik (lart); dhe dallimi (blu) dhe ndryshimi relativ (e kuqe) ndërmjet sasisë numerike dhe formulës së përafërt (poshtë). Për shpërndarjen hi-katror, vetëm numrat e plotë pozitiv të shkallëve të lirisë (qarqet) kanë kuptim.

Nga teoremën qëndrore limite, meqenëse shpërndarja hi-katrore është shuma e k variabla të rastit të pavarura me mesatare dhe variancë të fundme, ajo konvergjon në një shpërndarje normale për të mëdha k . Për shumë qëllime praktike, për k>50 shpërndarja është mjaft e afërt me një shpërndarje normale, kështu që ndryshimi është i papërfillshëm. [8] Konkretisht, nëse Xχ2(k), atëherë si k priret drejt pafundësisë, shpërndarja e (Xk)/2k priret drejt një shpërndarje normale standarde. Megjithatë, konvergjenca është e ngadaltë siç është edhe anësia 8/k dhe kurtoza e tepërt është 12/k .

Shpërndarja e kampionit të ln(χ2) konvergjon në normalitet shumë më shpejt se shpërndarja e kampionit të χ2, [9] pasi transformimi logaritmik heq shumë nga asimetria. [10]

Funksionet e tjera të shpërndarjes hi-katror konvergjojnë më shpejt në një shpërndarje normale. Disa shembuj janë:

  • Nëse Xχ2(k) atëherë 2X shpërndahet përafërsisht normalisht me mesatare 2k1 dhe variancë njësi (1922, nga RA Fisher, shih (18.23), f. 426 i Johnson. [2]
  • Nëse Xχ2(k) atëherë X/k3 shpërndahet përafërsisht normalisht me mesatare 129k dhe variancë 29k. [11] Ky njihet si transformimi Wilson–Hilferty, shih (18.24), f. 426 i Johnson. [2]
    • Ky transformim normalizues çon drejtpërdrejt në përafrimin mesatar të përdorur zakonisht k(129k)3duke u kthyer prapa nga mesatarja, e cila është edhe mediana, e shpërndarjes normale.

Shpërndarjet e ndërlidhura

  • Kur k, (χk2k)/2kd N(0,1) ( shpërndarje normale )
  • χk2χk2(0) ( Shpërndarja joqendrore hi-katrore me parametër joqëndror λ=0 )
  • Nëse YF(ν1,ν2) atëherë X=limν2ν1Y ka shpërndarje hi-katror χν12
  • Si një rast i veçantë, nëse YF(1,ν2) atëherë X=limν2Y ka shpërndarje hi-katror χ12
  • 𝑵i=1,,k(0,1)2χk2 ( Norma në katror e k ndryshoreve të rastit standarde të shpërndara normalisht është një shpërndarje hi-katrore me k shkallë lirie )
  • Nëse Xχν2 dhe c>0, atëherë cXΓ(k=ν/2,θ=2c) . ( shpërndarja gama )
  • Nëse Xχk2 atëherë Xχk ( shpërndarja hi )
  • Nëse Xχ22, atëherë XExp(1/2) është një shpërndarje eksponenciale .
  • Nëse Xχ2k2, atëherë XErlang(k,1/2) është një shpërndarje Erlang .
  • Nëse XErlang(k,λ), atëherë 2λXχ2k2
  • Nëse XRayleigh(1) ( Shpërndarja Rayleigh ) atëherë X2χ22
  • Nëse XMaxwell(1) ( Shpërndarja Maxwell ) atëherë X2χ32
  • Nëse Xχν2 atëherë 1XInv-χν2 ( Shpërndarja inverse-hi-katrore )
  • Shpërndarja hi-katrore është një rast i veçantë i shpërndarjes Pearson të tipit III
  • Nëse Xχν12 dhe Yχν22 janë të pavarur atëherë XX+YBeta(ν12,ν22) ( shpërndarja beta )
  • Nëse XU(0,1) ( shpërndarje uniforme ) atëherë 2log(X)χ22
  • Nëse XiLaplace(μ,β) atëherë i=1n2|Xiμ|βχ2n2
  • Nëse Xi ndjek shpërndarjen normale të përgjithësuar (lloji 1) me parametra μ,α,β atëherë i=1n2|Xiμ|βαχ2n/β2 [12]
  • Shpërndarja hi-katrore është një transformim i shpërndarjes Pareto
  • Shpërndarja e studentit është një transformim i shpërndarjes hi-katrore
  • Shpërndarja e studentit mund të merret nga shpërndarja hi-katror dhe shpërndarja normale
  • Shpërndarja joqendrore beta mund të merret si një transformim i shpërndarjes hi-katror dhe shpërndarjes joqendrore hi-katrore
  • Shpërndarja joqendrore t mund të merret nga shpërndarja normale dhe shpërndarja hi-katrore

Një ndryshore hi-katror me k shkallët lirie përkufizohet si shuma e katrorëve të k ndryshoreve rasti të pavarura standarde normale.

Shpërndarja hi-katrore është gjithashtu e lidhur natyrshëm me shpërndarjet e tjera që dalin nga shpërndarja gausiane. Veçanërisht,

  • Y është i shpërndarë sipas F, YF(k1,k2) nëse Y=X1/k1X2/k2, ku X1χk12 dhe X2χk22 janë statistikisht të pavarura.
  • Nëse X1χk12 dhe X2χk22 janë statistikisht të pavarura atëherë X1+X2χk1+k22 . Nëse X1 dhe X2 nuk janë të pavarura atëherë X1+X2 nuk shpërndahet sipas hi-katror.

Metodat llogaritëse

Shkallët e lirisë (shl) χ2 vlera [13]
1 0,004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.63 10.83
2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61 5.99 9.21 13.82
3 0.35 0,58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 11.34 16.27
4 0.71 1.06 1.65 2.20 3.36 4.88 5.99 7.78 9.49 13.28 18.47
5 1.14 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52
6 1.63 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 16.81 22.46
7 2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 18.48 24.32
8 2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12
9 3.32 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 21.67 27.88
10 3.94 4.87 6.18 7.27 9.34 11.78 13.44 15.99 18.31 23.21 29.59
p -vlera (probabiliteti) 0,95 0,90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001