Shpërndarja e probabilitetit

Nga testwiki
Kërceni tek navigimi Kërceni tek kërkimi

teorinë dhe statistikat e probabilitetit, një shpërndarje probabiliteti është funksioni matematik që jep probabilitetet e shfaqjes së rezultateve të ndryshme të mundshme për një eksperiment . [1] [2] Është një përshkrim matematik i një dukurie të rastit për sa i përket hapësirës së rezultateve së tij dhe probabiliteteve të ngjarjeve ( nëngrupe të hapësirës së kampionit). [3]

Për shembull, nëse X përdoret për të treguar rezultatin e një hedhje monedhe ("eksperimenti"), atëherë shpërndarja e probabilitetit të X do të merrte vlerën 0,5 (1 në 2 ose 1/2) për X=kokë, dhe 0,5 për X=pil(duke supozuar se monedha është e ndershme ). Më shpesh, shpërndarjet e probabilitetit përdoren për të krahasuar shfaqjen relative të shumë vlerave të ndryshme.

E ç'është shpërndarja e probabilitetit?

Një shpërndarje probabiliteti është një përshkrim matematikor i probabiliteteve të ngjarjeve, nënbashkësi të hapësirës së rezultateve . Hapësira e rezultateve, shpesh e shënuar me Ω, është grupi i të gjitha rezultateve të mundshme të një dukurie të rastit që po vëzhgohet; mund të jetë çdo grup: një grup numrash realë, një grup vektorësh, një grup vlerash arbitrare jo-numerike, etj. Për shembull, hapësira e mostrës së një rrokullisjeje monedhe do të ishte Ω = {kokë, pil} .

Për të përcaktuar shpërndarjet e probabilitetit për rastin specifik të ndryshoreve të rastësishme (në mënyrë që hapësira e rezultateve të mund të shihet si një grup numerik), është e zakonshme të bëhet dallimi midis ndryshoreve të rastit diskrete dhe absolutisht të vazhdueshme . Në rastin diskret, mjafton të specifikohet një funksion i masës së probabilitetit p caktimi i një probabiliteti për çdo rezultat të mundshëm: për shembull, kur hedhim një zar të drejtë, secila nga gjashtë vlerat 1 deri në 6 ka probabilitetin 1/6. Probabiliteti i një ngjarje më pas përcaktohet të jetë shuma e probabiliteteve të rezultateve që plotësojnë ngjarjen; për shembull, probabiliteti i ngjarjes "vërtet rrokulliset një vlerë e barabartë" ështëp(2)+p(4)+p(6)=1/6+1/6+1/6=1/2.Në të kundërt, kur një ndryshore e rastit merr vlera nga një vazhdimësi, atëherë zakonisht, çdo rezultat në vetvete ka probabilitet zero dhe vetëm ngjarjet që përfshijnë pafundësisht shumë rezultate, të tilla si intervalet, mund të kenë probabilitet pozitiv.

Për shembull, merrni parasysh matjen e peshës së një cope proshutë në supermarket dhe supozoni se peshorja ka shumë shifra saktësi. Probabiliteti që peshon saktësisht 500 g është zero, pasi ka shumë të ngjarë të ketë disa shifra dhjetore jo zero. Megjithatë, mund të kërkohet, në kontrollin e cilësisë, që një paketë prej "500 g" proshutë duhet të peshojë midis 490 g dhe 510 g me probabilitet të paktën 98%, dhe kjo kërkesë është më pak e ndjeshme ndaj saktësisë së instrumenteve matëse.

Grafiku i majtë tregon një funksion të dendësisë së probabilitetit. Grafiku i djathtë tregon funksionin mbledhës të shpërndarjes, për të cilin vlera në a është e barabartë me sipërfaqen nën kurbën e dendësisë së probabilitetit në të majtë të a .

Përkufizimi i përgjithshëm i probabilitetit

Një shpërndarje probabiliteti mund të përshkruhet në forma të ndryshme, si nga një funksion masiv probabiliteti ose një funksion shpërndarje mbledhëse. Një nga përshkrimet më të përgjithshme, i cili zbatohet për ndryshoret absolutisht të vazhdueshme dhe diskrete, është me anë të një funksioni probabiliteti. P:𝒜 hapësira hyrëse e të cilit 𝒜 është një σ-algjebër, dhe jep një probabilitet të numrit real si dalje të tij, veçanërisht, një numër në [0,1] .

Funksioni i mësipërm i probabilitetit karakterizon vetëm një shpërndarje probabiliteti nëse plotëson të gjitha aksiomat e Kolmogorov, domethënë:

  1. P(XE)0E𝒜, pra probabiliteti është jo negativ
  2. P(XE)1E𝒜, pra asnjë probabilitet nuk tejkalon 1
  3. P(XiEi)=iP(XEi) për çdo familje të ndarë të numërueshme grupesh {Ei}

Koncepti i funksionit të probabilitetit bëhet më rigoroz duke e përcaktuar atë si elementin e një hapësire probabiliteti (X,𝒜,P), ku X është grupi i rezultateve të mundshme, 𝒜 është bashkësia e të gjitha nënbashkësive EX probabiliteti i së cilës mund të matet, dhe P është funksioni i probabilitetit, ose masa e probabilitetit, që i cakton një probabilitet secilës prej këtyre nëngrupeve të matshme E𝒜 . [4]

Një shpërndarje probabiliteti, hapësira e rezultateve të së cilës është njëdimensionale (për shembull numrat realë ose numrat binarë) quhet univariate/njëndryshore, ndërsa një shpërndarje, hapësira e rezultateve së së cilës është një hapësirë vektoriale me dimension 2 ose më shumë quhet multivariate/shumëndryshore . Një shpërndarje e njëanshme jep probabilitetet e një ndryshoreje të vetme të rastit që merr vlera të ndryshme; një shpërndarje shumëndryshore (një shpërndarje e përbashkët probabiliteti ) jep probabilitetet e një vektori të rastit - një listë me dy ose më shumë ndryshore të rastit - duke marrë kombinime të ndryshme vlerash. Shpërndarjet e rëndësishme dhe të zakonshme të probabilitetit të njëanshëm përfshijnë shpërndarjen binomiale, shpërndarjen hipergjeometrike dhe shpërndarjen normale . Një shpërndarje shumëndryshore e hasur zakonisht është shpërndarja normale shumëndryshore .

Funksioni e dendësisë së probabilitetit (pdf) i shpërndarjes normale, i quajtur edhe gausian ose "lakorja këmbanë", shpërndarja më e rëndësishme absolutisht e vazhdueshme. Siç vërehet në figurë, probabilitetet e intervaleve të vlerave korrespondojnë me zonën nën kurbë.

Terminologjia

Disa koncepte dhe terma kyç, të përdorur gjerësisht në literaturë mbi temën e shpërndarjeve të probabilitetit, janë renditur më poshtë. [1]

Termat thelbësorë

  • Ndryshorja e rastit : merr vlera nga një hapësirë rezultatesh; probabilitetet përshkruajnë se cilat vlera dhe grup vlerash merren më shumë.
  • Ngjarje : grup vlerash (rezultatesh) të mundshme të një ndryshoreje të rastit që ndodh me një probabilitet të caktuar.
  • Funksioni i probabilitetit ose masa e probabilitetit : përshkruan probabilitetin P(XE) se ngjarja E, ndodh. [5]
  • Funksioni mbledhës i shpërndarjes : funksioni që vlerëson probabilitetinX do të marrë një vlerë më të vogël ose të barabartë me x për një ndryshore të rastit (vetëm për ndryshore të rastit me vlera reale).
  • Funksioni kuantil : inversi i funksionit të shpërndarjes mbledhëse. Jep x të tillë që, me probabilitet q, X nuk do të kalojë x .

Shpërndarjet diskrete të probabilitetit

  • Shpërndarja diskrete e probabilitetit : për shumë ndryshore të rastit me shumë vlera të fundme ose pafundësisht të numërueshme.
  • Funksioni i masës së probabilitetit ( fmp ): funksion që jep probabilitetin që një ndryshore e rastit diskrete të jetë e barabartë me një vlerë.
  • Shpërndarja e frekuencës : një tabelë që shfaq frekuencën e rezultateve të ndryshme in a sample .
  • Shpërndarja relative e frekuencës : një shpërndarje frekuence ku secila vlerë është ndarë (normalizuar) me një numër rezultatesh në një popullim (p.sh. madhësia e kampionit).
  • Shpërndarja kategorike : për ndryshore të rastit diskrete me një grup vlerash të fundme.

Shpërndarjet absolutisht të vazhdueshme

  • Shpërndarja absolutisht e vazhdueshme : për shumë ndryshore të rastit me shumë vlera të panumërta.
  • Funksioni i dendësisë së probabilitetit ( fdp ) ose dendësia e probabilitetit : funksion vlera e të cilit në çdo popullim të caktuar (ose pikë) në hapësirën e popullimit (bashkësia e vlerave të mundshme të marra nga ndryshorja e rastit) mund të interpretohet se ofron një gjasë relative që vlera e ndryshores së rastit do të ishte e barabartë me atë kampion.

Terma të ndërlidhura

  • <i id="mw6Q">Bashkësia e përcaktimit</i> : grup vlerash që mund të supozohen me probabilitet jozero nga ndryshorja e rastit. Për një ndryshore të rastit X, ndonjëherë shënohet si RX .
  • Bishtat : [6] rajonet afër kufijve të ndryshores së rastit, nëse fmp ose fdp janë relativisht të ulëta aty. Zakonisht ka formën X>a, X<b ose një bashkim i tyre.
  • Koka : [6] rajoni ku fmp ose fdp është relativisht i lartë. Zakonisht ka formën a<X<b .
  • Pritja matematike : mesatarja e peshuar e vlerave të mundshme, duke përdorur probabilitetet e tyre si pesha.
  • Mediana : vlera e tillë që gjysma e të dhënave ndodhen mbi të dhe gjysma e të dhënave nën të.
  • Moda : për një ndryshore të rastit diskrete, vlera me probabilitetin më të lartë; për një ndryshore të rastit absolutisht të vazhdueshme, një vendndodhje në të cilën funksioni i dendësisë së probabilitetit ka një kulm vendor.
  • Kuantili : Q-kuantili është vlera x në mënyrë që P(X<x)=q .
  • Varianca : momenti i dytë i fmp ose fdp rreth mesatares; një masë e rëndësishme e shpërndarjes së shpërndarjes.
  • Shmangia standarde : rrënja katrore e variancës, dhe si rrjedhim një masë tjetër e dispersionit.
  • <i id="mwARA">Simetria</i> : një veti e disa shpërndarjeve në të cilat pjesa e shpërndarjes në të majtë të një vlere specifike (zakonisht mediana) është një imazh pasqyrë i pjesës në të djathtë të saj.
  • Shtrirja/Anësia : një masë e animit në të cilën një fmp ose fdp "angjet" në njërën anë të mesatares së saj. Momenti i tretë i standardizuar i shpërndarjes.
  • Kurtoza : një masë e "dhjamosjes" së bishtave të një fdp ose fmp. Momenti i katërt i standardizuar i shpërndarjes.

Funksioni mbledhës i shpërndarjes

Në rastin e veçantë të një ndryshoreje të rastit me vlera reale, shpërndarja e probabilitetit mund të përfaqësohet në mënyrë të njëvlershme nga një funksion mbledhës i shpërndarjes në vend të një mase probabiliteti. Funksioni mbledhës i shpërndarjes së një ndryshoreje rasti X në lidhje me një shpërndarje probabiliteti p përkufizohet siF(x)=P(Xx).Funksioni mbledhës i shpërndarjes i çdo ndryshoreje të rastit me vlera reale ka vetitë:

  • F(x) është jozbritës;
  • F(x) është i vazhdueshëm nga e djathta ;
  • 0F(x)1 ;
  • limxF(x)=0 dhe limxF(x)=1 ; dhe
  • Pr(a<Xb)=F(b)F(a) .

Në të kundërt, çdo funksion F: që plotëson katër të parat nga vetitë e mësipërme është funksioni i shpërndarjes mbledhëse i ndonjë shpërndarje probabiliteti në numrat realë. [7]

Shpërndarja diskrete e probabilitetit

Funksioni i masës së probabilitetit (fmp) p(S) specifikon shpërndarjen e probabilitetit për shumën S të numërimeve nga dy zare . Për shembull, figura tregon se p(11)=2/36=1/18 . Fmp lejon llogaritjen e probabiliteteve të ngjarjeve si p.sh P(X>9)=1/12+1/18+1/36=1/6, dhe të gjitha probabilitetet e tjera në shpërndarje.
Funksioni i masës së probabilitetit të një shpërndarje diskrete probabiliteti. Probabilitetet e njëtoneve {1}, {3} dhe {7} janë përkatësisht 0.2, 0.5, 0.3. Një grup që nuk përmban asnjë nga këto pika ka probabilitet zero.
FMSH i një shpërndarje diskrete probabiliteti, . . .
... i një shpërndarjeje të vazhdueshme probabiliteti, . . .
... i një shpërndarje e cila ka një pjesë të vazhdueshme dhe një pjesë diskrete

Një shpërndarje diskrete probabiliteti është shpërndarja e probabilitetit të një ndryshoreje të rastit që mund të marrë vetëm një numër të numërueshëm vlerash [8] ( pothuajse me siguri ) [9] që do të thotë se probabiliteti i çdo ngjarjeje E mund të shprehet si një shumë (e fundme ose e pafundme e numërueshme ):P(XE)=ωAEP(X=ω),ku A është një bashkësi e numërueshme me P(XA)=1 . Kështu, ndryshoret diskrete të rastit (dmth. ndryshoret e rastit, shpërndarjet e probabilitetit të së cilave janë diskrete) janë pikërisht ato me një funksion të masës së probabilitetit p(x)=P(X=x) . Në rastin kur gama e vlerave është pafundësisht e numërueshme, këto vlera duhet të zbresin në zero aq shpejt sa probabilitetet të mblidhen deri në 1. Për shembull, nëse p(n)=12n për n=1,2,..., shuma e probabiliteteve do të ishte 1/2+1/4+1/8+=1 .

Shpërndarjet e njohura diskrete të probabilitetit të përdorura në modelimin statistikor përfshijnë shpërndarjen Poisson, shpërndarjen Bernoulli, shpërndarjen binomiale, shpërndarjen gjeometrike, shpërndarjen binomiale negative dhe shpërndarjen kategorike . [3]

Funksioni mbledhës i shpërndarjes

Një ndryshore e rastit diskrete me vlera reale mund të përkufizohet në mënyrë të njëvlershme si një ndryshore e rastit funksioni i shpërndarjes mbledhëse të së cilës rritet vetëm nga ndërprerjet e kërcimit - domethënë, fmsh-ja e saj rritet vetëm aty ku "kërcen" në një vlerë më të lartë dhe është konstante në intervale pa kërcime. Pikat ku ndodhin kërcimet janë pikërisht vlerat që mund të marrë ndryshorja e rastit. Kështu funksioni i shpërndarjes mbledhëse ka formënF(x)=P(Xx)=ωxp(ω).

Shpërndarja absolutisht e vazhdueshme

Një shpërndarje probabiliteti absolutisht e vazhdueshme është një shpërndarje probabiliteti mbi numrat realë me shumë vlera të panumërta të mundshme, siç është një interval i plotë në vijën reale, dhe ku probabiliteti i çdo ngjarjeje mund të shprehet si një integral. [10] Më saktësisht, një ndryshore reale e rastit X ka një shpërndarje probabiliteti absolutisht të vazhdueshme nëse ka një funksion f:[0,] të tillë që për çdo interval [a,b] probabiliteti i X i perket [a,b] jepet nga integrali i f gjatë I : [11] [12]P(aXb)=abf(x)dx.Ky është përkufizimi i një funksioni të dendësisë së probabilitetit, kështu që shpërndarjet absolutisht të vazhdueshme të probabilitetit janë pikërisht ato me një funksion të dëndësisë së probabilitetit. Në veçanti, probabiliteti që X të marrë ndonjë vlerë të vetme a (kjo dmth, aXa ) është zero, sepse një integral me kufijtë e sipërm dhe të poshtëm që përputhen është gjithmonë i barabartë me zero. Nëse intervali [a,b] zëvendësohet me çdo grup të matshëm A, barazia përkatëse vazhdon ende:P(XA)=Af(x)dx.

Funksioni mbledhës i shpërndarjes

Shpërndarjet absolutisht të vazhdueshme të probabilitetit siç përcaktohen më sipër janë pikërisht ato me një funksion të shpërndarjes mbledhëse absolutisht të vazhdueshme . Në këtë rast, funksioni i shpërndarjes mbledhëse F ka formënF(x)=P(Xx)=xf(t)dtku f është një dëndësi e ndryshores së rastit X në lidhje me shpërndarjen P .

Shënim mbi terminologjinë: Shpërndarjet absolutisht të vazhdueshme duhet të dallohen nga shpërndarjet e vazhdueshme, të cilat janë ato që kanë një funksion të shpërndarjes mbledhëse i cili është i vazhdueshëm.

  1. 1,0 1,1 Stampa:Cite book Gabim citimi: Invalid <ref> tag; name ":02" defined multiple times with different content
  2. Stampa:Cite book
  3. 3,0 3,1 Stampa:Cite book Gabim citimi: Invalid <ref> tag; name ":1" defined multiple times with different content
  4. Stampa:Cite book
  5. Chapters 1 and 2 of Stampa:Harvp
  6. 6,0 6,1 More information and examples can be found in the articles Heavy-tailed distribution, Long-tailed distribution, fat-tailed distribution
  7. Stampa:Cite book
  8. Stampa:Cite book
  9. Stampa:Cite book
  10. Stampa:Cite book
  11. Chapter 3.2 of Stampa:Harvp
  12. Stampa:Cite web