Shpërndarja normale

Nga testwiki
Kërceni tek navigimi Kërceni tek kërkimi

Stampa:Infobox shpërndarja e gjasësstatistikë, një shpërndarje normale ose shpërndarje Gausiane është një lloj shpërndarjeje e vazhdueshme probabiliteti për një ndryshore të rastësishme me vlera reale . Forma e përgjithshme e funksionit të densitetit të probabilitetit të tij është

f(x)=1σ2πe12(xμσ)2

Parametri μ është mesatarja ose pritja matematike e shpërndarjes (dhe gjithashtu mesorja dhe moda e saj), ndërsa parametri σ është devijimi standard i tij. Varianca e shpërndarjes është σ2 . Një ndryshore e rastësishme me shpërndarje Gausiane thuhet se është e shpërndarë normalisht .

Shpërndarjet normale janë të rëndësishme në statistikë dhe shpesh përdoren në shkenca natyrore dhe sociale për të përfaqësuar ndryshore rasti me vlera reale, shpërndarjet e të cilave nuk dihen. [1] [2] Rëndësia e shpërndarjes normale vjen pjesërisht për shkak të teoremës së qendrore limite . Ai thotë se, në disa kushte, mesatarja e shumë zgjedhjeve (vëzhgimeve) të një ndryshoreje rasti me pritje dhe dispersion të fundëm është në vetvete një ndryshore rasti - shpërndarja e së cilës konvergjon në një shpërndarje normale teksa numri i zgjedhjeve rritet. Prandaj, madhësitë fizike që priten të jenë shuma e shumë proceseve të pavarura, siç janë gabimet e matjes, shpesh kanë shpërndarje që janë pothuajse normale. [3]

Për më tepër, shpërndarjet Gausiane kanë disa veti unike që janë të vlefshme në studimet analitike. Për shembull, çdo kombinim linear i disa ndryshoreve që ndjekin ligj normal është një ndryshore rasti që ndjek po një ligj normal. Shumë rezultate dhe metoda, të tilla si përhapja e pasigurisë dhe përshtatja e parametrave të katrorëve më të vegjël, mund të nxirren në mënyrë analitike në formë të qartë kur ndryshoret përkatëse shpërndahen normalisht.

Një shpërndarje normale nganjëherë quhet joformalisht një kurbë këmbanë . [4] Megjithatë, shumë shpërndarje të tjera janë në formë këmbane (të tilla si Cauchy, e Studentit dhe shpërndarjet logjistike ).

Shpërndarja e probabilitetit njëdimensional përgjithësohet për vektorët në shpërndarjen normale multivariate dhe për matricat në shpërndarjen normale të matricës .

Përkufizimet

Shpërndarja normale standarde

Rasti më i thjeshtë i një shpërndarjeje normale njihet si shpërndarja normale standarde ose shpërndarja normale njësi . Ky është një rast i veçantë kur μ=0 dhe σ=1, dhe përshkruhet nga ky funksion i densitetit të probabilitetit (ose densiteti):

φ(z)=ez2/22π.

Ndryshorja z ka një mesatare 0 dhe variancë dhe devijim standard të barabartë me 1. Dendësia φ(z) arrin majën e saj 1/2πz=0 dhe pikat e infleksionit në z=+1 dhe z=1 .

Shpërndarja e përgjithshme normale

Çdo shpërndarje normale është një modifikim i shpërndarjes normale standarde, domeini i së cilës është shtrirë me një faktor σ (devijimi standard) dhe më pas zhvendoset me μ (vlera mesatare):

f(xμ,σ2)=1σφ(xμσ)

Nqs Z ndjek ligjin normal standard, atëherë X=σZ+μ do të ketë një shpërndarje normale me pritje matematike μ dhe devijim standard σ. Në mënyrë analoge, nëse X ndjek një ligj normal me parametera μ dhe σ2, atëherë shpërndarja e Xmund të rishkallëzohet dhe të zhvendoset duke zbatuar formulën Z=(Xμ)/σ për ta kthyer atë në shpërndarjen normale standarde. Ndryshorja Z quhet ndrysha forma e standardizuar e X.

Shënimi

Shpërndarja normale shpesh shënohet me simbolet N(μ,σ2) ose 𝒩(μ,σ2) . [5] Kështu kur një ndryshore rasti X zakonisht ndjek një ligj normal me mesatare μ dhe devijimi standard σ, mund të shkruhet

X𝒩(μ,σ2).

Funksioni mbledhës i shpërndarjes

Funksioni kumulativ (mbledhës) i shpërndarjes (CDF) i shpërndarjes normale standarde, zakonisht i shënuar me germën e madhe greke Φ, jepet si integrali

Φ(x)=12πxet2/2dt

Funksioni i gabimit erf(x) jep probabilitetin që një ndryshore rasti, me shpërndarje normale dhe mesatare 0 dhe variancë 1/2 të bjerë në intervalin [x,x] . Kjo është:

erf(x)=2π0xet2dt

Këto integrale nuk mund të shprehen në terma të funksioneve elementare, pra janë të paintegrueshme me kuadraturë, dhe shpesh thuhet se janë funksione speciale . Megjithatë, njihen shumë përafrime numerike të tyre.

Të dy funksionet janë të lidhura ngushtë, domethënë

Φ(x)=12[1+erf(x2)]

Për një shpërndarje normale të zakonshme me dendësi f, pritje matematike μ dhe devijimi σ, funksioni mbledhës i shpërndarjes është

F(x)=Φ(xμσ)=12[1+erf(xμσ2)]

Një përafrim i shpejtë i CDF-së së shpërndarjes normale standarde mund të gjendet duke përdorur një përafrim nëpërmjet serisë Tejlor:

Φ(x)12+12πk=0n(1)kx(2k+1)2kk!(2k+1)

Devijimi standard dhe mbulimi

Për shpërndarjen normale, vlerat më pak se një devijim standard larg mesatares përbëjnë 68.27% të grupit; ndërsa dy devijime standarde nga mesatarja përbëjnë 95.45%; dhe tre devijime standarde përbëjnë 99.73%.

Rreth 68% e vlerave të nxjerra nga një shpërndarje normale janë brenda një devijimi standard σ larg mesatares [μσ;μ+σ]; rreth 95% e vlerave qëndrojnë brenda dy devijimeve standarde; dhe rreth 99.7% janë brenda tre devijimeve standarde. [4] Ky fakt njihet si rregulli 68-95-99.7 (empirik), ose rregulli 3-sigma .

Më saktësisht, probabiliteti që një realizim (rast) i n.r me ligj normal të jetë në intervalin ndërmjet μnσ dhe μ+nσ jepet nga

F(μ+nσ)F(μnσ)=Φ(n)Φ(n)=erf(n2).

Vetitë

Shpërndarja normale është e vetmja shpërndarje kumulantët e së cilës përtej dy të parave (dmth., përveç mesatares dhe variancës ) janë zero. Është gjithashtu shpërndarja e vazhdueshme me entropinë maksimale për një mesatare dhe variancë të caktuar. [6] [7] Geary ka treguar, duke supozuar se mesatarja dhe varianca janë të fundme, se shpërndarja normale është e vetmja shpërndarje ku mesatarja dhe varianca e llogaritur nga një grup i pavaru janë të pavarura nga njëra-tjetra. [8]

Shpërndarja normale është simetrike me bosht simetrie mesataren e saj dhe është jo zero mbi të gjithë vijën reale. Si e tillë, mund të mos jetë një model i përshtatshëm për variablat që janë në thelb pozitive ose shumë të anuara, si pesha e një personi ose çmimi i një aksioni . Ndryshore të tilla mund të përshkruhen më mirë nga shpërndarje të tjera, të tilla si shpërndarja log-normale ose shpërndarja Pareto .

Shpërndarja gausiane i përket familjes së shpërndarjeve të qëndrueshme. Me përjashtim të Gaussian-it që është një rast kufizues, të gjitha shpërndarjet e qëndrueshme kanë bishta të rëndë dhe variancë të pafundme. Është një nga shpërndarjet e pakta që janë të qëndrueshme dhe që kanë funksione të densitetit të probabilitetit të cilat mund të shprehen në mënyrë analitike, të tjerat janë shpërndarja Cauchy dhe shpërndarja Lévy .

Shpërndarjet e ndërlidhura

Teorema e kufirit qendror

Ndërsa numri i ngjarjeve diskrete rritet, funksioni fillon të ngjajë me një shpërndarje normale

Teorema qendrore limite pohon se në kushte të caktuara (mjaft të zakonshme), shuma e shumë ndryshoreve të rastit do të ketë një shpërndarje afërsisht normale. Më konkretisht, kur X1,,Xn janë variabla të rastësishme të pavarura dhe të shpërndara identikisht me të njëjtën shpërndarje çfarëdo, mesatare zero dhe variancë σ2 dhe Z është mesatarja e tyre e shkallëzuar nga n

Z=n(1ni=1nXi)

Atëherë, kur n rritet, shpërndarja e probabilitetit të Z do të prirent drejt shpërndarjes normale me mesatare 0 dhe variancë σ2 .

Teorema mund të shtrihet për variabla (Xi) që nuk janë të pavarura dhe/ose jo të shpërndara identikisht nëse vendosen kufizime të caktuara mbi shkallën e varësisë dhe momentet e shpërndarjeve.

Teorema e kufirit qendror nënkupton gjithashtu që shpërndarje të caktuara mund të përafrohen me shpërndarjen normale, për shembull:

  • Shpërndarja binomiale B(n,p) është afërsisht normale me mesatare np dhe variancë np(1p) për n të mëdha dhe për vlera të p jo shumë afër 0 ose 1.
  • Shpërndarja Poisson me parametër λ është afërsisht normale me mesatare λ dhe variancë λ, për vlera të mëdha të λ . [9]
  • Shpërndarja hi-katror χ2(k) është afërsisht normale me mesatare k dhe variancë 2k, për vlera të mëdha të k .
  • Shpërndarja e studentit t t(ν) është afërsisht normale me mesatare 0 dhe variancë 1 kur ν është e madhe.

Nëse këto përafrime janë të sakta mjaftueshëm varet nga qëllimi për të cilin nevojiten dhe nga shkalla e konvergjencës me shpërndarjen normale. Zakonisht ndodh që përafrime të tilla janë më pak të sakta në bishtat e shpërndarjes.

Veprimet dhe funksionet e ndryshoreve normale

Dendësia e probabilitetit, shpërndarja kumulative dhe shpërndarja kumulative e anasjelltë e çdo funksioni të një ose më shumë ndryshoreve normale të pavarura ose të ndërlidhura mund të llogariten me metodën numerike të gjurmimit të rrezeve [10] ( kodi Matlab ). Në seksionet e mëposhtme do të shohim disa raste të veçanta.

Veprimet mbi një ndryshore të vetme normale

Nëse X ndjek një ligj normal me mesatare μ dhe variancë σ2, atëherë

  • aX+b, për çdo numër real a dhe b, gjithashtu ndjek një shpërndarje normale, me mesatare aμ+b dhe devijim standard |a|σ . Kjo do të thotë se familja e shpërndarjeve normale është e mbyllur nën transformimet lineare .
  • Eksponenciali i X shpërndahet log-normalisht : eXln(N(μ,σ2)) .
  • Vlera absolute e X ka shpërndarje normale të palosshme : |X|Nf(μ,σ2) . Nëse μ=0 kjo njihet si shpërndarja gjysëm normale .
  • Vlera absolute e mbetjeve të normalizuara, pra |Xμ|/σ, ka shpërndarje hi me një shkallë lirie: |Xμ|/σχ1 .
  • Katrori i X/σ ka shpërndarjen joqendrore hi-katrore me një shkallë lirie: X2/σ2χ12(μ2/σ2) . Nëse μ=0, shpërndarja quhet thjesht hi-katrore .
  • (Xμ)2 ka një shpërndarje Lévy me vendndodhje 0 dhe shkallë σ2 .
Veprimet në dy ndryshore normale të pavarura
  • Nëse X1 dhe X2 janë dy ndryshore rasti normale të pavarura, me mesatare μ1, μ2 dhe devijime standarde σ1, σ2, atëherë shuma e tyre X1+X2 gjithashtu do të ndjekë një shpërndarje normale, [prova] me mesatare μ1+μ2 dhe variancë σ12+σ22 .
  • Në veçanti, nëse X dhe Y janë normale të pavarura me mesatare 0 dhe variancë σ2, atëherë X+Y dhe XY janë gjithashtu të pavarura dhe të shpërndara normalisht, me mesatare zero dhe variancë 2σ2 . Ky është një rast i veçantë i identitetit të polarizimit . [11]
  • Nëse X1, X2 janë dy n.r normale të pavarura me mesatare μ dhe devijim σ, dhe a, b janë numra realë arbitrarë, atëherë ndryshorja:X3=aX1+bX2(a+b)μa2+b2+μX3=aX1+bX2(a+b)μa2+b2+μ
  • Nëse Xk𝒩(mk,σk2), k{0,1} janë shpërndarje normale, atëherë mesatarja e tyre gjeometrike e normalizuar 1nX0α(x)X11α(x)dxX0αX11α është një shpërndarje normale 𝒩(mα,σα2) me mα=αm0σ12+(1α)m1σ02ασ12+(1α)σ02 dhe σα2=σ02σ12ασ12+(1α)σ02 (shih këtu për një vizualizim).
Veprimet në dy ndryshore normale standarde të pavarura

Nëse X1 dhe X2 janë dy n.r standarde të pavarura me mesatare 0 dhe variancë 1, atëherë

  • Shuma dhe diferenca e tyre ndjek një shpërndarje normale me mesatare zero dhe variancë dy: X1±X2𝒩(0,2) .
  • Produkti i tyre Z=X1X2 ndjek shpërndarjen e produktit [12] me funksionin e densitetit fZ(z)=π1K0(|z|) ku K0 është funksioni Bessel i modifikuar i llojit të dytë . Kjo shpërndarje është simetrike rreth zeros, e pakufizuar në z=0, dhe ka funksionin karakteristik ϕZ(t)=(1+t2)1/2 .
  • Raporti i tyre ndjek shpërndarjen standarde Cauchy : X1/X2Cauchy(0,1) .
  • Norma e tyre Euklidiane X12+X22 ka shpërndarjen Rayleigh .

Veprimet në shumë ndryshore normale të pavarura

  • Çdo kombinim linear i n.r normale është ndryshore rasti normale.
  • Nëse X1,X2,,Xn janë ndryshore të rastit normale standarde dhe të pavarura, atëherë shuma e katrorëve të tyre ka shpërndarjen chi-katror me n shkallë lirie X12++Xn2χn2.
  • Nëse X1,X2,,Xn janë n.r të pavarura të shpërndara normalisht me mesatare μ dhe variancë σ2, atëherë mesatarja e kampionit të tyre është e pavarur nga devijimi standard i mostrës. [13] Raporti i këtyre dy madhësive do të ketë shpërndarjen e Studentit me n1 shkallët e lirisë: t=XμS/n=1n(X1++Xn)μ1n(n1)[(X1X)2++(XnX)2]tn1.
  • Nëse X1,X2,,Xn, Y1,Y2,,Ym janë ndryshore rasti normale standarde të pavarura, atëherë raporti i shumave të tyre të normalizuara të katrorëve do të ndjekë shpërndarjen F me (n, m ) shkallë lirie: [14] F=(X12+X22++Xn2)/n(Y12+Y22++Ym2)/mFn,m.

Ndodhja dhe aplikimet

Ndodhja e shpërndarjes normale në problemet praktike mund të klasifikohet lirshëm në katër kategori:

  1. Shpërndarjet saktësisht normale;
  2. Ligjet përafërsisht normale, për shembull kur një përafrim i tillë justifikohet nga teorema qendrore limite ; dhe
  3. Shpërndarjet e modeluara si normale – shpërndarja normale është shpërndarja me entropinë maksimale për një mesatare dhe variancë të caktuar.
  4. Problemet e regresionit - shpërndarja normale gjendet pasi efektet sistematike janë modeluar mjaft mirë.

Normalitet i saktë

Gjendja bazë e një oshilatori harmonik kuantik ka shpërndarjen Gausiane.

Madhësi të caktuara në fizikë shpërndahen normalisht, siç u demonstrua për herë të parë nga James Clerk Maxwell . Shembuj të madhësuve të tilla janë:

  • Funksioni i densitetit të probabilitetit të një gjendjeje bazë në një oshilator kuantik harmonik .
  • Pozicioni i një grimce që përjeton difuzion . Nëse fillimisht grimca ndodhet në një pikë specifike , atëherë pas t kohe, vendndodhja e saj përshkruhet nga një shpërndarje normale me variancë t, e cila kënaq ekuacionin e difuzionit . tf(x,t)=122x2f(x,t) . Nëse vendndodhja fillestare jepet nga një funksion i caktuar i densitetit g(x), atëherë dendësia në kohën t është konvolucioni i g dhe PDF-së normale.

Normalitet i përafërt

Shpërndarjet përafërsisht normale ndodhin në shumë situata, siç shpjegohet nga TQL . Kur rezultati prodhohet nga shumë efekte të vogla që veprojnë në mënyrë mbledhëse dhe të pavarur, shpërndarja e tij do të jetë afër normales. Përafrimi normal nuk do të jetë i vlefshëm nëse efektet veprojnë në mënyrë shumëzuese (në vend të shtimit), ose nëse ka një ndikim të vetëm të jashtëm që ka një madhësi dukshëm më të madhe se efektet e tjera.

  • Në problemet e numërimit, ku teorema qendrore limite përfshin një përafrim diskret në vazhdimësi dhe ku përfshihen shpërndarje pafundësisht të pjesëtueshme dhe të zbërthyeshme, si p.sh.
    • Ndryshore të rastit binomiale, të lidhura me variablat e përgjigjes binare;
    • Ndryshore të rastit Poisson, të lidhura me ngjarje të rralla;
  • Rrezatimi termik ka një shpërndarje Bose-Einstein në shkallë shumë të shkurtra kohore dhe një shpërndarje normale në shkallë më të gjata kohore për shkak të teoremës së kufirit qendror.

Normalitet i supozuar

Histogrami i gjerësisë së sepalit për Iris versicolor nga grupi i të dhënave të luleve të Iris, me shpërndarjen normale ë të përshtatshme të mbivendosur.

Ka metoda statistikore për të testuar në mënyrë empirike atë supozim; shih seksionin e mësipërm të testeve të normalitetit .

  • biologji, logaritmi i variableve të ndryshme priret të ketë një shpërndarje normale, domethënë, ata priren të kenë një shpërndarje log-normale (pas ndarjes në nënpopullatat meshkuj/femra), me shembuj që përfshijnë:
    • Matjet e madhësisë së indit të gjallë (gjatësia, lartësia, sipërfaqja e lëkurës, pesha); [15]
    • Gjatësia e shtojcave inerte (flokët, kthetrat, thonjtë, dhëmbët) e ekzemplarëve biologjikë, në drejtim të rritjes ;mendohet se trashësia e lëvores së pemës gjithashtu i përket kësaj kategorie;
    • Disa matje fiziologjike, si presioni i gjakut tek njerëzit e rritur.
  • Në financë, në veçanti modeli Black–Scholes, ndryshimet në logaritmin e kurseve të këmbimit, indekseve të çmimeve dhe indekseve të bursës supozohen normale (këto variabla sillen si interesi i përbërë, jo si interesi i thjeshtë dhe kështu janë shumëzues). Disa matematikanë si Benoit Mandelbrot kanë argumentuar se shpërndarjet log-Levy, të cilat posedojnë bishta të rëndë do të ishin një model më i përshtatshëm, veçanërisht për analizën për rrëzimet e tregut të aksioneve.
  • Gabimet e matjes në eksperimentet fizike shpesh modelohen nga një shpërndarje normale. Ky përdorim i një shpërndarjeje normale nuk nënkupton që dikush po supozon se gabimet e matjes shpërndahen normalisht, përkundrazi përdorimi i shpërndarjes normale prodhon parashikimet më konservatore të mundshme duke pasur parasysh vetëm njohuritë rreth mesatares dhe variancës së gabimeve. [16]
  • Në testimin e standardizuar, rezultatet mund të bëhen që të kenë një shpërndarje normale ose duke zgjedhur numrin dhe vështirësinë e pyetjeve (si në testin IQ ) ose duke i transformuar rezultatet e testit të papërpunuara në rezultate "output" duke i përshtatur ato në shpërndarjen normale. Për shembull, diapazoni tradicional i SAT prej 200–800 bazohet në një shpërndarje normale me një mesatare prej 500 dhe një devijim standard prej 100.
  1. Normal Distribution, Gale Encyclopedia of Psychology
  2. Stampa:Harvard citation text
  3. Lyon, A. (2014).
  4. 4,0 4,1 Stampa:Cite web Gabim citimi: Invalid <ref> tag; name ":1" defined multiple times with different content
  5. Stampa:Harvard citation text
  6. Stampa:Cite book
  7. Stampa:Cite journal
  8. Geary RC(1936) The distribution of the "Student's" ratio for the non-normal samples".
  9. Stampa:Cite web
  10. Stampa:Cite arXiv
  11. Stampa:Harvard citation text
  12. Stampa:Cite web
  13. Stampa:Cite journal
  14. Stampa:Cite book
  15. Stampa:Harvard citation text
  16. Stampa:Cite book