Shpërndarja e Studentit

Nga testwiki
Kërceni tek navigimi Kërceni tek kërkimi

Stampa:Infobox shpërndarja e gjasës

teorinë e probabilitetit dhe statistikë, shpërndarja t e Studentit (ose thjesht shpërndarja t ) tν është një shpërndarje e vazhdueshme probabiliteti që përgjithëson shpërndarjen normale standarde . Ashtu si kjo e fundit, ajo është simetrike rreth zeros dhe në formë këmbane.

Megjithatë, tν ka bishta më të rëndë dhe sasia e masës së probabilitetit në bishta kontrollohet nga parametri ν . Për ν=1 shpërndarja e t Studentit tν bëhet shpërndarje standarde Cauchy, ndërsa për ν bëhet shpërndarje normale standarde N(0,1) .

Shpërndarja e studentit luan një rol në një numër analizash statistikore të përdorura gjerësisht, duke përfshirë testin t Student për vlerësimin e rëndësisë statistikore të ndryshesës midis dy mesatareve të mostrës, ndërtimin e intervaleve të besimit për ndryshesën midis dy mesatareve të popullsisë dhe në analiza e regresit linear.

Në formën e shkallës-vendndodhje shpërndarja t lst(μ,τ2,ν) ajo përgjithëson shpërndarjen normale dhe gjithashtu lind në analizën Bejesiane të të dhënave nga një familje normale si një shpërndarje e përbërë kur margjinalizohet mbi parametrin e variancës.

ku

Përkufizimi

Funksioni i dendësisë së probabilitetit

Shpërndarja t e studentit ka funksionin e dendësisë së probabilitetit (PDF) të dhënë nga

f(t)=Γ(ν+12)νπΓ(ν2)(1+t2ν)(ν+1)/2,

ku ν është numri i shkallëve të lirisë dhe Γ është funksioni gama. Kjo mund të shkruhet edhe si

f(t)=1νB(12,ν2)(1+t2ν)(ν+1)/2,

ku B është funksioni Beta. Në veçanti për shkallët e lirisë me vlerë të plotë ν ne kemi:

Për ν>1 çift,

Γ(ν+12)νπΓ(ν2)=(ν1)(ν3)532ν(ν2)(ν4)42

Për ν>1 tek,

Γ(ν+12)νπΓ(ν2)=(ν1)(ν3)42πν(ν2)(ν4)53

Funksioni i dendësisë së probabilitetit është simetrik, dhe forma e tij e përgjithshme i ngjan formës së këmbanës me mesatare 0 dhe variancë 1, përveç se është pak më e ulët dhe më e gjerë. Ndërsa numri i shkallëve të lirisë rritet, shpërndarja t i afrohet shpërndarjes normale me mesataren 0 dhe variancën 1. Per kete arsye ν njihet edhe si parametri i normalitetit. [1]

 

Funksioni mbledhës i shpërndarjes

Funksioni i shpërndarjes mbledhëse (FSHM) mund të shkruhet në termat e I, funksioni beta jo i plotë i rregulluar. Për t > 0,

F(t)=tf(u)du=112Ix(t)(ν2,12),

Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) devijimi standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes t .

x(t)=νt2+ν.

Raste të veçanta

Vlerat e caktuara të ν jepni një formë të thjeshtë për shpërndarjen së Studentit.

ν PDF CDF shënime
1 1π(1+t2) 12+1πarctan(t) Shih shpërndarjen Cauchy
2 122(1+t22)3/2 12+t221+t22
3 2π3(1+t23)2 12+1π[13t1+t23+arctan(t3)]
4 38(1+t24)5/2 12+38t1+t24[1112t21+t24]
5 83π5(1+t25)3 12+1π[t5(1+t25)(1+23(1+t25))+arctan(t5)]
12πet2/2 12[1+erf(t2)] Shikoni Shpërndarja normale, Funksioni i gabimit

Vendndodhja-shkalla e shpërndarjes t

Shndërrimi i shkallës-vendndodhje

Shpërndarja t e studentit përgjithësohet në shpërndarjen e tre parametrave vendndodhje-shkalla t lst(μ,τ2,ν) duke futur një parametër vendndodhjeje μ dhe një parametër shkallë τ . Me

Ttν

dhe transformimi i familjes në shkallë vendi

X=μ+τT

marrim

Xlst(μ,τ2,ν)

Raste të veçanta

  • Nëse X ndjek një shpërndarje Studenti shkallë-vendndodhje Xlst(μ,τ2,ν) pastaj për ν X shpërndahet normalisht XN(μ,τ2) me mesatare μ dhe variancë τ2 .
  • Shpërndarja e Studentit shkallë-vendndodhje lst(μ,τ2,ν=1) me shkallë lirie ν=1 është e njëvlerëshme me shpërndarjen Cauchy Cau(μ,τ) .
  • Shpërndarja t -shkallë-vendndodhje lst(μ=0,τ2=1,ν) me μ=0 dhe τ2=1 reduktohet në shpërndarjen e Studentit tν

Si lind shpërndarja t (karakterizimi)

Shpërndarja e mostrës së statistikës Student

Shpërndarja t lind si shpërndarja e mostrës së statistikës t . Më poshtë diskutohet statistika t në një kampion, për statistikën t korresponduese me dy mostra shihni T-testin e Studentit .

Vlerësimi i paanshëm i variancës

Le x1,,xnN(μ,σ2) të jenë mostra të pavarura dhe të shpërndara identikisht nga një shpërndarje normale me mesatare μ dhe variancë σ2 . Varianca mesatare dhe e paanshme e kampionit jepen nga:

x¯=x1++xnn,s2=1n1i=1n(xix¯)2.

Statistika t që rezulton (një mostër) jepet nga

t=x¯μs2/ntn1.

dhe shpërndahet sipas një shpërndarjeje që ndjek ligjin e Studentit me n1 shkallët e lirisë.

Vlerësimi i variancës PM

Në vend të vlerësimit të paanshëm s2 ne gjithashtu mund të përdorim vlerësuesin e përgjasisë maksimale

sML2=1ni=1n(xix¯)2

duke dhënë statistikën

tML=x¯μsML2/n=nn1t.

Kjo shpërndahet sipas shpërndarjes t shkallës-vendndodhje:

tMLlst(0,τ2=n/(n1),n1).

Përdorimet

Në përfundimin statistikor frekuentist

Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) shmangia standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse do të dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes së Studentit .

Intervalet e besimit dhe testet e hipotezave janë dy procedura statistikore në të cilat kërkohen kuantiljet e shpërndarjes së mostrës së një statistike të caktuar (p.sh. rezultati standard ). Në çdo situatë ku kjo statistikë është një funksion linear i të dhënave, pjesëtuar me vlerësimin e zakonshëm të shmangies standarde, sasia që rezulton mund të rishkallëzohet dhe të përqendrohet për të ndjekur shpërndarjen e Studentit. Analizat statistikore që përfshijnë mesataret, mesataret e ponderuara dhe koeficientët e regresionit të gjitha çojnë në statistika që kanë këtë formë.

Testimi i hipotezave

Një numër statistikash mund të tregohet se kanë shpërndarje t-Studenti për mostrat me madhësi mesatare nën hipotezat zero që janë me interes, në mënyrë që shpërndarja e Studentit të formojë bazën për testet e rëndësisë. Për shembull, shpërndarja e koeficientit të korrelacionit të Spearman ρ, në rastin zero (korrelacion zero) përafrohet mirë me shpërndarjen t për madhësitë e mostrës mbi 20. 

Intervalet e besimit

Supozoni se numri A është zgjedhur i tillë që

Pr(A<T<A)=0.9,

kur T ka një shpërndarje Studenti me n − 1 shkallë lirie. Nga simetria, kjo është njësoj si të thuash që A kënaq kushtin

Pr(T<A)=0.95,

pra A është "përqindja 95" e kësaj shpërndarjeje probabiliteti, ose A=t(0.05,n1) . Atëherë

Pr(A<XnμSn/n<A)=0.9,

dhe kjo është e njëvlerëshme me

Pr(XnASnn<μ<Xn+ASnn)=0.9.

Prandaj, intervali, pikat fundore të të cilit janë

Xn±ASnn

është një interval besimi 90% për μ. Prandaj, nëse gjejmë mesataren e një grupi vëzhgimesh që mund të presim në mënyrë të arsyeshme të kemi një shpërndarje normale, mund të përdorim shpërndarjen e Studentit për të shqyrtuar nëse kufijtë e besimit në atë mesatare përfshijnë disa vlera të parashikuara teorikisht - siç është vlera e parashikuar nën një hipotezë zero .

Është ky rezultat që përdoret në testet e Studentit : meqenëse ndryshesa midis mesatareve të mostrave nga dy shpërndarje normale shpërndahet normalisht, shpërndarja t-Student mund të përdoret për të ekzaminuar nëse kjo diferencë mund të supozohet në mënyrë të arsyeshme të jetë zero. .

Tabelë e vlerave të zgjedhura

Tabela e mëposhtme liston vlerat për shpërndarjet t-Student me ν shkallë lirie për një sërë zonash kritike të njëanshme ose të dyanshme. Kolona e parë është ν, përqindjet përgjatë majës janë nivele besimi dhe numrat në trupin e tabelës janë tα,n1 faktorët e përshkruar në seksionin mbi intervalet e besimit .

I njëanshëm 75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95%
I dyanshëm 50% 60% 70% 80% 90% 95% 98% 99% 99.5% 99.8% 99.9%
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
60 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 2.860 3.160 3.373
0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
I njëanshëm 75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95%
I dyanshëm 50% 60% 70% 80% 90% 95% 98% 99% 99.5% 99.8% 99.9%

Llogaritja e intervalit të besimit

Le të themi se kemi një mostër me madhësi 11, mesatare të kampionit 10 dhe variancë të mostrës 2. Për shkallën e besimit 90% me 10 gradë lirie, vlera e njëanshme t nga tabela është 1.372. Pastaj me interval besimi të llogaritur nga

Xn±tα,νSnn,

ne përcaktojmë se me 90% besim kemi një mesatare të vërtetë që ndodhet poshtë

10+1.372211=10.585.

Me fjalë të tjera, 90% e rasteve kur një prag i sipërm llogaritet me këtë metodë nga mostra të veçanta, ky prag i sipërm tejkalon mesataren e vërtetë.

Dhe me 90% besim ne kemi një mesatare të vërtetë që ndodhet më lart

101.372211=9.414.

Me fjalë të tjera, 90% e rasteve kur një prag më i ulët llogaritet me këtë metodë nga mostra të veçanta, ky prag më i ulët qëndron nën mesataren e vërtetë.

Kështu që me 80% besim (llogaritur nga 100% − 2 × (1 − 90%) = 80%), kemi një mesatare të vërtetë që shtrihet brenda intervalit

(101.372211,10+1.372211)=(9.414,10.585).