Shpërndarja hipergjeometrike

Nga testwiki
Kërceni tek navigimi Kërceni tek kërkimi

Stampa:Infobox shpërndarja e gjasës

teorinë e probabilitetit dhe statistikë, shpërndarja hipergjeometrike është një shpërndarje diskrete probabiliteti që përshkruan probabilitetin e k sukseseve (tërheqjet e rastit për të cilat objekti i tërhequr ka një veçori të caktuar) në n tërheqje pa zëvendësim, nga një popullsi e kufizuar me madhësi N që përmban saktësisht K objekte me atë veçori, ku çdo tërheqje është ose një sukses ose një dështim. Në të kundërt, shpërndarja binomiale përshkruan probabilitetin e k sukseseve në n tërheqje me zëvendësim.

Përkufizimet

Funksioni i masës së probabilitetit

Kushtet e mëposhtme karakterizojnë shpërndarjen hipergjeometrike:

  • Rezultati i çdo tërheqje (elementet e popullatës që janë marrë në popullim) mund të klasifikohet në një nga dy kategoritë ndërsjellazi përjashtuese (p.sh. Kalon/Dështon ose i Punësuar/I papunësuar).
  • Probabiliteti i një suksesi ndryshon në çdo tërheqje, pasi çdo tërheqje zvogëlon popullsinë ( kampionimi pa zëvendësim nga një popullsi e fundme).

Një ndryshore e rastit X ndjek shpërndarjen hipergjeometrike nëse funksioni i masës së probabilitetit të tij (fmp) jepet nga [1]

pX(k)=Pr(X=k)=(Kk)(NKnk)(Nn),

ku

  • N është madhësia e popullsisë,
  • K është numri i gjëndjeve të suksesshme në popullatë,
  • n është numri i barazimeve (dmth. sasia e tërhequr në çdo provë),
  • k është numri i sukseseve të vërejtura,
  • (ab) është një koeficient binomial .

FMP është pozitiv kur max(0,n+KN)kmin(K,n) .

Një ndryshore e rastit e shpërndarë hipergjeometrikisht me parametra N, K dhe n shkruhet si XHypergeometric(N,K,n) dhe ka funksion të masës së probabilitetit pX(k) si më sipër.

Vetitë

Shembull pune

Zbatimi klasik i shpërndarjes hipergjeometrike është kampionimi pa zëvendësim . Mendoni një vazo me dy ngjyra mermeri, të kuqe dhe të gjelbër. Përcaktoni tërheqjen e një mermeri të gjelbër si sukses (S) dhe tërheqjen e një mermeri të kuq si dështim (K) (analoge me shpërndarjen binomiale). Nëse ndryshorja N përshkruan numrin e të gjithë mermerëve në vazo dhe K përshkruan numrin e mermerëve të gjelbër, atëherë NK korrespondon me numrin e mermerëve të kuq . Në këtë shembull, X është ndryshorja e rastit, rezultati i së cilës është k, numri i mermerëve të gjelbër të nxjerrë në eksperiment. Kjo situatë ilustrohet nga tabela e mëposhtme e rasteve :

tërhequr ngelur në vazo total
mermerët e gjelbër k Kk K
mermerët e kuq nk N + k − n − K N - K
total n N − n N

Tani, supozoni (për shembull) se ka 5 mermerë të gjelbër dhe 45 të kuq në urnë (vazo). Duke qëndruar pranë vazos, ju mbyllni sytë dhe tërhiqni 10 mermerë pa zëvendësim. Sa është probabiliteti që saktësisht 4 nga 10 janë të gjelbër? Vini re se megjithëse po vëzhgojmë sukses/dështim, të dhënat nuk modelohen saktë nga shpërndarja binomiale, sepse probabiliteti i suksesit në çdo provë nuk është i njëjtë, pasi madhësia e popullsisë së mbetur ndryshon ndërsa heqim çdo mermer.

Ky problem përmblidhet nga tabela e mëposhtme e kontigjencës:

tërhequr pa tërhequr total
mermerët e gjelbër k = 4 Kk = 1 K = 5
mermerët e kuq nk = 6 N + k − n − K = 39 N − K = 45
total n = 10 N − n = 40 N = 50

Probabiliteti për të nxjerrë saktësisht k mermerë të gjelbër mund të llogaritet me formulën

P(X=k)=f(k;N,K,n)=(Kk)(NKnk)(Nn).

Prandaj, në këtë shembull llogaritni

P(X=4)=f(4;50,5,10)=(54)(456)(5010)=5814506010272278170=0.003964583.

Intuitivisht ne do të prisnim që të ishte edhe më e pamundur që të 5 mermerët e gjelbër të jenë në mesin e 10 të tërhequrve.

P(X=5)=f(5;50,5,10)=(55)(455)(5010)=1122175910272278170=0.0001189375,

Siç pritej, probabiliteti i tërheqjes së 5 mermerëve të gjelbër është afërsisht 35 herë më pak i mundshëm se ai i tërheqjes së 4 prej tyre.

Simetritë

Ndërrimi i roleve të mermerëve të gjelbër dhe të kuq:

f(k;N,K,n)=f(nk;N,NK,n)

Ndërrimi i roleve të mermerëve të tërhequr dhe jo të tërhequr:

f(k;N,K,n)=f(Kk;N,K,Nn)

Ndërrimi i roleve të mermerëve të gjelbër dhe të tërhequr:

f(k;N,K,n)=f(k;N,n,K)

Këto simetri gjenerojnë grupin dihedral D4 .

Kufijtë e bishtit

Le të jetë XHypergeometric(N,K,n) dhe p=K/N . Pastaj për 0<t<nK/N mund të nxjerrim kufijtë e mëposhtëm: [2]

Pr[X(pt)n]enD(ptp)e2t2nPr[X(p+t)n]enD(p+tp)e2t2n

ku

D(ab)=alogab+(1a)log1a1b

është divergjenca Kullback-Leibler dhe përdoret se D(ab)2(ab)2 . [3]

Nëse n është më e madhe se N/2, mund të jetë e dobishme të aplikoni simetri për të "përmbysur" kufijtë, të cilët japin sa vijon: [3] [4]

Pr[X(pt)n]e(Nn)D(p+tnNn||p)e2t2nnNnPr[X(p+t)n]e(Nn)D(ptnNn||p)e2t2nnNn

Konkluzioni statistikor

Testi hipergjeometrik

Testi hipergjeometrik përdor shpërndarjen hipergjeometrike për të matur rëndësinë statistikore të tërheqjes së një popullimi të përbërë nga një numër specifik k suksesesh (nga n tërheqjet totale) nga një popullsi me madhësi N që përmban K sukseset. Në një test për mbipërfaqësimin e sukseseve në kampion, vlera p hipergjeometrike llogaritet si probabilitet i tërheqjes në mënyrë të rastësishme të k ose më shumë sukseseve nga popullata në n tërheqjet totale. Në një test për nënpërfaqësim, vlera p është probabiliteti i tërheqjes së rastësishme të k ose më pak sukseseve.

Biologu dhe statisticieni Ronald Fisher

Testi i bazuar në shpërndarjen hipergjeometrike (testi hipergjeometrik) është identik me versionin përkatës me një bisht të testit ekzakt të Fisherit . [5]

Testi përdoret shpesh për të identifikuar se cilat nën-popullata janë të mbi ose nën-përfaqësuara në një popullim. Ky test ka një gamë të gjerë zbatimesh. Për shembull, një grup marketingu mund të përdorë testin për të kuptuar bazën e tyre të klientëve duke testuar një grup klientësh të njohur për mbipërfaqësim të nëngrupeve të ndryshme demografike (p.sh., gra, njerëz nën 30 vjeç).

Shpërndarjet e lidhura

Le të jetë XHypergeometric(N,K,n) dhe p=K/N .

  • Nëse n=1 atëherë X ka një shpërndarje Bernoulli me parametër p .
  • Le të ketë Y një shpërndarje binomiale me parametra n dhe p ; kjo modelon numrin e sukseseve në problemin analog të kampionimit me zëvendësim. Nëse N dhe K janë të mëdha në krahasim me n, dhe p nuk është afër 0 ose 1, atëherë X dhe Y kanë shpërndarje të ngjashme, dmth. P(Xk)P(Yk) .
  • Nëse n është e madhe, N dhe K janë të mëdha në krahasim me n, dhe p nuk është afër 0 ose 1 atëherë
P(Xk)Φ(knpnp(1p))

ku Φ është funksioni standard i shpërndarjes normale

Tabela e mëposhtme përshkruan katër shpërndarje që lidhen me numrin e sukseseve në një sekuencë tërheqjesh:

Me zëvendësim Asnjë zëvendësim
Numri i caktuar i tërheqjeve shpërndarja binomiale shpërndarja hipergjeometrike
Duke pasur parasysh numrin e dështimeve shpërndarje binomiale negative shpërndarje hipergjeometrike negative

Shpërndarja hipergjeometrike me shumë ndryshore

Stampa:Infobox shpërndarja e gjasës Modeli i një urne me mermerë të gjelbër dhe të kuq mund të shtrihet në rastin kur ka më shumë se dy ngjyra mermeri. Nëse ka Ki mermerë të ngjyrës i në urnë dhe ju merrni n mermerë në mënyrë të rastësishme pa zëvendësim, atëherë numri i mermerëve të secilës ngjyrë në mostër (k1,k2,...,kc) ka shpërndarjen hipergjeometrike shumëndryshore:

Pr(X1=k1,,Xc=kc)=i=1c(Kiki)(Nn)

Shembull

Supozoni se në një urnë ka 5 mermerë të zinj, 10 të bardhë dhe 15 të kuq. Nëse zgjidhen gjashtë mermere pa zëvendësim, probabiliteti që të zgjidhen saktësisht dy nga çdo ngjyrë është

P(2 black,2 white,2 red)=(52)(102)(152)(306)=0.079575596816976

Ndodhja dhe aplikimet

Zbatimi për auditimin e zgjedhjeve

  1. Stampa:Cite book
  2. Stampa:Citation.
  3. 3,0 3,1 Stampa:Cite web Gabim citimi: Invalid <ref> tag; name "wordpress.com" defined multiple times with different content
  4. Stampa:Citation.
  5. Stampa:Cite journal