Shpërndarja hipergjeometrike negative

Nga testwiki
Kërceni tek navigimi Kërceni tek kërkimi

Stampa:Infobox shpërndarja e gjasës

teorinë e probabilitetit dhe statistikë, shpërndarja hipergjeometrike negative përshkruan probabilitetet për marrjen e mostrave nga një popullsi e fundme pa zëvendësim, në të cilën çdo popullim mund të klasifikohet në dy kategori ndërsjellazi përjashtuese si Sukses/Dështim ose i Punësuar/I papunësuar. Ndërsa zgjedhjet e rastësishme bëhen nga popullsia, çdo tërheqje e mëpasshme zvogëlon popullsinë duke bërë që probabiliteti i suksesit të ndryshojë me çdo tërheqje. Ndryshe nga shpërndarja standarde hipergjeometrike, e cila përshkruan numrin e sukseseve në një madhësi fikse kampioni, në shpërndarjen hipergjeometrike negative, popullimet nxirren deri sa janë gjetur r dështime dhe shpërndarja përshkruan probabilitetin e gjetjes k sukseseve në një popullim të tillë. Me fjalë të tjera, shpërndarja negative hipergjeometrike përshkruan gjasat e k sukseseve në një popullim me saktësisht r dështime.

Përkufizimi

Ka N elemente, nga të cilat K përkufizohen si "suksese" dhe pjesa tjetër janë "dështime".

Elementet vizatohen njëri pas tjetrit, pa zëvendësime, derisa hasen r dështime. Pastaj, zgjedhja ndalon dhe numri i k sukseseve numërohet. Shpërndarja negative hipergjeometrike, NHGN,K,r(k) është shpërndarja diskrete e kësaj k .

Shpërndarja hipergjeometrike negative është një rast i veçantë i shpërndarjes beta-binomiale [1] me parametra α=r dhe β=NKr+1 të dy duke qenë numra të plotë (dhe n=K ).

Rezultati kërkon që ne të vëzhgojmë k suksese në (k+r1) tërheqje dhe copëzat (k+r)-th duhet të jenë dështime. Probabiliteti i të parës mund të gjendet me zbatimin e drejtpërdrejtë të shpërndarjes hipergjeometrike (HGN,K,k+r1(k)) dhe probabiliteti i kësaj të fundit është thjesht numri i dështimeve të mbetura (=NK(r1)) pjesëtuar me madhësinë e popullsisë së mbetur (=N(k+r1) . Probabiliteti për të pasur saktësisht k suksese deri në dështimin r-të (dmth. tërheqja ndalon sapo popullimi të përfshijë numrin e paracaktuar të r dështimeve) atëherë është prodhimi i këtyre dy probabiliteteve:

(Kk)(NKk+r1k)(Nk+r1)NK(r1)N(k+r1)=(k+r1k)(NrkKk)(NK).

Prandaj, një ndryshore e rastit X ndjek shpërndarjen hipergjeometrike negative nëse funksioni i masës së probabilitetit të tij (fmp) jepet nga

f(k;N,K,r)Pr(X=k)=(k+r1k)(NrkKk)(NK)për k=0,1,2,,K

ku

  • N është madhësia e popullsisë,
  • K është numri i gjëndjeve të suksesshme në popullatë,
  • r është numri i dështimeve,
  • k është numri i sukseseve të vërejtura,
  • (ab) është një koeficient binomial

Sipas dizajnit, probabilitetet shumohen në 1. Megjithatë, në rast se duam ta tregojmë në mënyrë eksplicite kemi:

k=0KPr(X=k)=k=0K(k+r1k)(NrkKk)(NK)=1(NK)k=0K(k+r1k)(NrkKk)=1(NK)(NK)=1,

ku kemi përdorur faktin se,

j=0k(j+mj)(nmjkj)=j=0k(1)j(m1j)(1)kj(m+1+kn2kj)=(1)k(kn2k)=(1)k(k(n+1)1k)=(n+1k),

i cili mund të nxirret duke përdorur identitetin binomial, (nk)=(1)k(kn1k) dhe identiteti Chu-Vandermonde, j=0k(mj)(nmkj)=(nk), i cili vlen për çdo vlerë komplekse m dhe n dhe çdo numër i plotë jo negativ k .

Pritja matematike

Gjatë numërimit të numrit k të sukseseve përpara r dështimeve, numri i pritshëm i sukseseve është rKNK+1 dhe mund të nxirret si më poshtë.

E[X]=k=0KkPr(X=k)=k=0Kk(k+r1k)(NrkKk)(NK)=r(NK)[k=0K(k+r)r(k+r1r1)(NrkKk)]r=r(NK)[k=0K(k+rr)(NrkKk)]r=r(NK)[k=0K(k+rk)(NrkKk)]r=r(NK)[(N+1K)]r=rKNK+1,

ku kemi përdorur marrëdhënien j=0k(j+mj)(nmjkj)=(n+1k), që kemi nxjerrë më lart për të treguar se shpërndarja negative hipergjeometrike ishte normalizuar siç duhet.

Varianca

Varianca mund të nxirret nga llogaritja e mëposhtme.

E[X2]=k=0Kk2Pr(X=k)=[k=0K(k+r)(k+r+1)Pr(X=k)](2r+1)E[X]r2r=r(r+1)(NK)[k=0K(k+r+1r+1)(N+1(r+1)kKk)](2r+1)E[X]r2r=r(r+1)(NK)[(N+2K)](2r+1)E[X]r2r=rK(Nr+Kr+1)(NK+1)(NK+2)

Atëherë varianca është Var[X]=E[X2](E[X])2=rK(N+1)(NKr+1)(NK+1)2(NK+2)

Shpërndarjet e ndërlidhura

Nëse tërheqja ndalet pas një numri konstant n tërheqjesh (pavarësisht nga numri i dështimeve), atëherë numri i sukseseve ndjek shpërndarjen hipergjeometrike, HGN,K,n(k) . Të dy funksionet janë të lidhura në mënyrën e mëposhtme: [2]

NHGN,K,r(k)=1HGN,NK,k+r(r1)

Shpërndarja negative-hipergjeometrike (si shpërndarja hipergjeometrike) merret me tërheqjet pa zëvendësim, kështu që probabiliteti i suksesit është i ndryshëm në çdo barazim. Në të kundërt, shpërndarja binomiale negative (si shpërndarja binomiale) merret me tërheqjet me zëvendësim, në mënyrë që probabiliteti i suksesit të jetë i njëjtë dhe provat të jenë të pavarura. Tabela e mëposhtme përmbledh katër shpërndarjet që lidhen me tërheqjen e sendeve:

Me zëvendësime Asnjë zëvendësim
# i sukseseve në # konstant të tërheqjeve shpërndarja binomiale shpërndarja hipergjeometrike
# i sukseseve në # konstant të dështimeve shpërndarje binomiale negative shpërndarje hipergjeometrike negative

Disa autorë [3] [4] përcaktojnë shpërndarjen negative hipergjeometrike si numrin e tërheqjeve të nevojshme për të marrë r dështime. Le të jetë Y shënimi këtë numër. Atëherë është e qartë se Y=X+r ku X është siç është përcaktuar më sipër. Prandaj FMP Pr(Y=y)=(y1r1)(NyNKr)(NNK) . Nëse e shënojmë numrin e dështimeve NK me M do të thotë që kemi Pr(Y=y)=(y1r1)(NyMr)(NM) . Bashkësia e përcaktimit e Y është bashkësia {r,r+1,,NM+r} . Është e qartë se E[Y]=E[X]+r=r(N+1)M+1 dhe ajo Var[X]=Var[Y] .

  1. Stampa:Cite book §6.2.2 (p.253–254)
  2. Negative hypergeometric distribution in Encyclopedia of Math.
  3. Rohatgi, Vijay K., and AK Md Ehsanes Saleh. An introduction to probability and statistics. John Wiley & Sons, 2015.
  4. Khan, RA (1994). A note on the generating function of a negative hypergeometric distribution. Sankhya: The Indian Journal of Statistics B, 56(3), 309-313.