Shpërndarja binomiale: Dallime mes rishikimesh

Nga testwiki
Kërceni tek navigimi Kërceni tek kërkimi
imported>AmbitiousDoughnut
vNuk ka përmbledhje të përpunimit
 
(Pa ndryshime)

Versioni aktual i datës 12 shtator 2023 15:35

Stampa:Infobox shpërndarja e gjasës

teorinë e probabilitetit dhe statistikë, shpërndarja binomiale me parametrat n dhe p është shpërndarja diskrete e probabilitetit, e cila përshkruan numrin e sukseseve në një seri prej p eksperimentesh të pavarura, ku çdo eksperiment i përgjigjet një pyetje po-jo, dhe secili merr një rezultat me vlerë buleane : sukses (me probabilitet p ) ose dështim (me probabilitet q=1p ). Një eksperiment i vetëm suksesi/dështimi quhet gjithashtu një provë Bernuli ose eksperiment Bernuli, dhe një seri e rezultateve quhet një proces Bernuli ; për një provë të vetme, p.sh., n=1, shpërndarja binomiale është një shpërndarje Bernuli .

Shpërndarja binomiale është baza për testin popullor binomial të rëndësisë statistikore . [1]

Shpërndarja binomiale përdoret shpesh për të modeluar numrin e sukseseve në një zgjedhje me madhësi n të nxjerrë me zëvendësim nga një popullatë me madhësi N . Nëse marrja e mostrave kryhet pa zëvendësim, tërheqjet nuk janë të pavarura dhe kështu shpërndarja që rezulton është një shpërndarje hipergjeometrike, jo binomiale. Megjithatë, për N shumë më të mëdha se n, shpërndarja binomiale mbetet një përafrim i mirë dhe përdoret gjerësisht në praktikë.

Përkufizimet

Funksioni i masës së probabilitetit

Në përgjithësi, nëse ndryshorja e rastit X ndjek shpërndarjen binomiale me parametrat n dhe p[0,1], shënojmë X(n,p). Probabiliteti për të arritur saktësisht k suksese në n prova të pavarura të Bernulit jepet nga funksioni i masës së probabilitetit :

f(k,n,p)=Pr(k;n,p)=Pr(X=k)=(nk)pk(1p)nk

për k = 0, 1, 2, ..., n, ku

(nk)=n!k!(nk)!

është koeficienti binomial, prandaj edhe emri i shpërndarjes. Formula mund të kuptohet si më poshtë: k sukseset ndodhin me probabilitet pk dhe nk dështimet ndodhin me probabilitet (1p)nk . Megjithatë, k sukseset mund të ndodhin kudo midis n provave, dhe ka (nk) mënyra të ndryshme të shpërndarjes së k sukseseve në një seri prej n provash.

Shembull

Supozoni se një monedhë e njëanshme bie kokë me probabilitet 0.3 kur hidhet. Probabiliteti për të vërejtur saktësisht 4 koka në 6 hedhje është:

(Këtu N = 6 hedhje, n = 4 hedhje kokë, p= 0.3 i rënies kokë)

f(4,6,0.3)=(64)0.34(10.3)64=0.059535.

Funksioni mbledhës i shpërndarjes

Funksioni mbledhës i shpërndarjes mund të shprehet si:

F(k;n,p)=Pr(Xk)=i=0k(ni)pi(1p)ni,

ku k është "dyshemeja" nën k, pra numri i plotë më i madh më i vogël ose i barabartë me k .

Vetitë

Pritja matematike dhe varianca

Nëse X(n,p), domethënë, X është një ndryshore rasti e shpërndarë binomialisht, n është numri total i eksperimenteve dhe p probabiliteti që çdo eksperiment të japë një rezultat të suksesshëm, atëherë pritja matematike e X është: [2]

E[X]=np.

Kjo rrjedh nga lineariteti i vlerës së pritur së bashku me faktin se X është shuma e n ndryshoreve të rastit identike Bernuli, secila me pritje matematike p . Me fjalë të tjera, nëse X1,,Xn janë ndryshore të rastit Bernuli identike (dhe të pavarura) me parametër p, atëherë X=X1++Xn dhe

E[X]=E[X1++Xn]=E[X1]++E[Xn]=p++p=np.

Varianca është:

Var(X)=npq=np(1p).

Modaliteti

Zakonisht moda statistikore e një shpërndarjeje binomiale (n,p) është e barabartë me (n+1)p, ku është funksioni dysheme . Megjithatë, kur (n+1)p është një numër i plotë dhe p nuk është as 0 as 1, atëherë shpërndarja ka dy moda: (n+1)p dhe (n+1)p1. Kur p është e barabartë me 0 ose 1, moda do të jetë përkatësisht 0 dhe n . Këto raste mund të përmblidhen si më poshtë:

moda={(n+1)pnëse (n+1)p është 0 ose një numër jo i plotë,(n+1)p  dhe  (n+1)p1nëse (n+1)p{1,,n},nnëse (n+1)p=n+1.

Mesorja

Në përgjithësi, nuk ka asnjë formulë të vetme për të gjetur mesataren për një shpërndarje binomiale, dhe madje mund të jetë jo unike. Megjithatë, janë vendosur disa rezultate të veçanta:

  • Nëse np është numër i plotë atëherë mesarja, mediana dhe moda përkojnë dhe janë të barabarta me np.[3]
  • Çdo medianë m duhet të shtrihet në intervalin npmnp.[4]
  • Një medianë m nuk mund të shtrihet shumë larg mesatares: |mnp|min(ln2,max(p,1p)).[5]
  • Mediana është unike dhe e barabartë me m=round(np) ku |mnp|minp,1p [4]
  • Kur p është numër racional (me përjashtim të p=1/2 dhe n tek) mediana është unike.[6]
  • Kur p=1/2 dhe n është numër tek, çdo numër m në intervalin n1mn+1 është mediane e shpërndarjes binomiale. Nëse p=1/2 dhe n është tek, atëherë m=n/2 është mediana unike.

Inferenca statistikore

Vlerësimi i parametrave

Kur dihet n, parametri p mund të vlerësohet duke përdorur herësin e sukseseve:

p^=xn.

Shpërndarjet e ndërlidhura

Shumat e binomeve

Nëse X(n,p) dhe X(m,p) janë ndryshore rasti binomiale të pavarura me të njëjtin probabilitet p, pastaj X+Y është përsëri një ndryshore binomiale; shpërndarja e saj është Z=X+Y(n+m,p): [7]

P(Z=k)=i=0k[(ni)pi(1p)ni][(mki)pki(1p)mk+i]=(n+mk)pk(1p)n+mk

Një ndryshore rasti e shpërndarë binomialisht X(n,p) mund të konsiderohet si shuma e n ndryshoreve të rastit me ligj Bernuli. Pra, shuma e dy ndryshoreve të rastit X,Y të shpërndara binomialisht X(n,p) dhe Y(m,p) është e njëvlerëshme me shumën e n+m ndryshoreve me ligj Bernuli, që do të thotë Z=X+Y(n+m,p). Kjo gjithashtu mund të vërtetohet drejtpërdrejt duke përdorur rregullin e shtimit.

Pjesëtimi i dy shpërndarjeve binomiale

Ky rezultat u nxor për herë të parë nga Katz dhe bashkëautorët në 1978. [8]

Le të jenë X(n,p1) dhe Y(m,p2) të pavarura. Le të jetë T=X/mY/n .

Atëherë log(T) është përafërsisht e shpërndarë normalisht me mesatare log(p1p2) dhe variancë 1p11n+1p21m

Përafrim normal

Funksioni i masës së probabilitetit binomial dhe përafrimi i funksionit të densitetit të probabilitetit normal për n = 6 dhe p = 0.5

Nëse n është mjaftueshëm e madhe, atëherë animi i shpërndarjes nuk është shumë i madh. Në këtë rast një përafrim i arsyeshëm me (n,p) jepet nga shpërndarja normale

𝒩(np,np(1p)),

dhe ky përafrim bazë mund të përmirësohet në një mënyrë të thjeshtë duke përdorur një korrigjim të përshtatshëm të vazhdimësisë . Përafrimi bazë përgjithësisht përmirësohet kur n rritet (të paktën 20) dhe është më i mirë kur p nuk është afër 0 ose 1. [9] Rregulla të ndryshme praktike mund të përdoren për të vendosur nëse n është mjaft i madh dhe p është mjaft larg nga ekstremet e zeros ose njëshit.

  • Një rregull [9] është që për n>5 përafrimi normal është i përshtatshëm nëse vlera absolute e anshmërisë është rreptësisht më e vogël se 0.3; domethënë nëse
|12p|np(1p)=1n|1ppp1p|<0.3.
  • Një rregull më i fortë thotë se përafrimi normal është i përshtatshëm vetëm nëse çdo gjë brenda 3 shmangieve standarde të mesatares së saj është brenda intervalit të vlerave të mundshme; pra vetëm nëse
μ±3σ=np±3np(1p)(0,n).
Ky rregull me 3 devijime standarde është i njëvlershëm me kushtet e mëposhtme, të cilat nënkuptojnë gjithashtu rregullin e parë të mësipërm.
n>9(1pp)andn>9(p1p).
  • Një rregull tjetër i përdorur zakonisht është që të dyja vlerat np dhe n(1p) duhet të jenë më të mëdhaja ose të barabarta me 5. Megjithatë, numri specifik ndryshon nga burimi në burim dhe varet nga sa i mirë dëshiron një përafrim.

Përafrimi Poisson

Shpërndarja binomiale konvergjon drejt shpërndarjes Poisson pasi numri i provave shkon në pafundësi ndërsa produkti np konvergjon në një kufi të fundëm. Prandaj, shpërndarja Poisson me parametrin λ=np mund të përdoret si një përafrim me (n,p) të shpërndarjes binomiale nëse n është mjaft e madhe dhe p është mjaftueshëm e vogël. Sipas dy rregullave, ky përafrim është i mirë nëse n20 dhe p0.05, ose nëse n100 dhe np10. [10]

Shpërndarje kufizuese

  • Teorema e kufirit të Puasonit : Ndërsa n i afrohet dhe p i afrohet 0 me prodhimin np të mbajtur fiks, ndryshorja binomiale X(n,p) i afrohet shpërndarjes Poisson me pritje matematike λ=np . [10]
  • Teorema de Moivre–Laplace : Ndërsa n i afrohet ndërsa p mbetet fikse, shpërndarja e
Xnpnp(1p)
i afrohet shpërndarjes normale me pritje matematike  0 dhe variancë  1. Ky rezultat ndonjëherë shprehet lirshëm duke thënë se shpërndarja e X është asimptotikisht normale me vlerën e pritur 0 dhe variancë 1. Ky rezultat është një rast specifik i teoremës së kufirit qendror .

Historia

Kjo shpërndarje u përftua nga Jakob Bernuli . Ai shqyrtoi rastin ku p=rr+s ku p është probabiliteti i suksesit dhe r dhe s janë numra të plotë pozitiv. Blez Paskali kishte shqyrtuar më herët rastin ku p=1/2.

  1. Stampa:Cite book
  2. See Proof Wiki
  3. Stampa:Cite journal
  4. 4,0 4,1 Stampa:Cite journal
  5. Stampa:Cite journal
  6. Stampa:Cite journal
  7. Stampa:Cite book
  8. Stampa:Cite journal
  9. 9,0 9,1 Stampa:Cite book Gabim citimi: Invalid <ref> tag; name "bhh" defined multiple times with different content
  10. 10,0 10,1 NIST/SEMATECH, "6.3.3.1. Counts Control Charts", e-Handbook of Statistical Methods.