Shpërndarja Pareto
Stampa:Infobox shpërndarja e gjasës
Shpërndarja Pareto, e emërtuar sipas inxhinierit të ndërtimit, ekonomistit dhe sociologut italian Vilfredo Pareto, [1] është një shpërndarje probabiliteti që përdoret në përshkrimin e dukurive të vëzhgueshme sociale, kontrollit të cilësisë, shkencore, gjeofizike, aktuariale dhe shumë llojeve të tjera; parimi i zbatuar fillimisht për të përshkruar shpërndarjen e pasurisë në një shoqëri, duke iu përshtatur prirjes që një pjesë e madhe e pasurisë të mbahet nga një pjesë e vogël e popullsisë. [2] [3] Parimi Pareto ose "rregulli 80-20" që thotë se 80% e rezultateve janë për shkak të 20% të shkaqeve u emërtua për nder të Paretos, por konceptet janë të dallueshme dhe vetëm shpërndarjet Pareto me vlerë të formës ( ) rreth 4 5 ≈ 1.16 pasqyrojnë saktësisht atë. Vëzhgimi empirik ka treguar se kjo shpërndarje 80-20 përshtatet me një gamë të gjerë rastesh, duke përfshirë fenomenet natyrore [4] dhe aktivitetet njerëzore. [5] [6]
Përkufizimet
Nëse është një ndryshore e rastit me një shpërndarje Pareto, [7] atëherë probabiliteti që është më i madh se një numër , pra funksioni i mbijetesës (i quajtur edhe funksioni i bishtit), jepet nga
ku është vlera minimale e mundshme (domosdoshmërisht pozitive) e , dhe është një parametër pozitiv. Shpërndarja Pareto Lloji I karakterizohet nga një parametër i shkallës dhe një parametër i formës , i cili njihet si indeksi i bishtit . Kur kjo shpërndarje përdoret për të modeluar shpërndarjen e pasurisë, atëherë parametri quhet indeksi Pareto .
Funksioni mbledhës i shpërndarjes
Nga përkufizimi, funksioni mbledhës i shpërndarjes së një ndryshoreje të rastit Pareto me parametra dhe është
Funksioni i densitetit të probabilitetit
Nga kjo rrjedh (me diferencim ) se funksioni i dendësisë së probabilitetit është
Vetitë
Momentet dhe funksioni karakteristik
- Pritja matematike e një ndryshoreje rasti që ndjek një shpërndarje Pareto është
- Varianca e një ndryshoreje të rastit që ndjek një shpërndarje Pareto është
- (Nëse , varianca nuk ekziston. )
- Momentet e papërpunuara janë
- Funksioni gjenerues i momentit përcaktohet vetëm për vlerat jo pozitive si
- Funksioni karakteristik jepet nga
- ku është funksioni i paplotë gama .
Mesatarja harmonike
Mesatarja harmonike ( H ) është [8]
Lidhja me shpërndarjen eksponenciale
Shpërndarja Pareto lidhet me shpërndarjen eksponenciale si më poshtë. Nëse X është Pareto-shpërndarë me minimum x m dhe indeks α, atëherë
shpërndahet në mënyrë eksponenciale me parametrin e shakllës α . Në mënyrë ekuivalente, nëse Y shpërndahet në mënyrë eksponenciale me shpejtësi α, atëherë
është Pareto-shpërndarë me minimum x m dhe indeks α .
Më në përgjithësi, nëse (parametizimi i shkallës së formës) dhe , atëherë .
Lidhja me shpërndarjen log-normale
Shpërndarja Pareto dhe shpërndarja log-normale janë shpërndarje alternative për përshkrimin e madhësive të së njëjtit lloj. Një nga lidhjet ndërmjet të dyjave është se ato janë të dyja shpërndarjet e eksponencialit të ndryshoreve të rastit të shpërndara sipas shpërndarjeve të tjera të zakonshme, përkatësisht shpërndarjes eksponenciale dhe shpërndarjes normale . (Shih seksionin e mëparshëm . )
Konkluzioni statistikor
Vlerësimi i parametrave
Funksioni i përgjasisë për parametrat e shpërndarjes Pareto α dhe x m, duke pasur parasysh një mostër të pavarur , është
Prandaj, funksioni logaritmik të përgjasisë është
Mund të shihet se është në rritje monotonike me , pra sa më e madhe të jetë vlera e , aq më e madhe është vlera e funksionit të gjasave. Prandaj, meqenëse , arrijmë në përfundimin se
Për të gjetur vlerësuesin për α, ne llogarisim derivatin e pjesshëm përkatës dhe përcaktojmë se ku është zero:
Kështu, vlerësuesi i përgjasisë maksimale për α është:
Gabimi statistikor i pritur është: [9]
Ndodhia dhe aplikimet
Të përgjithshme
Vilfredo Pareto fillimisht e përdori këtë shpërndarje për të përshkruar ndarjen e pasurisë midis individëve pasi dukej se tregonte mjaft mirë mënyrën se një pjesë më e madhe e pasurisë së çdo shoqërie zotërohet nga një përqindje më e vogël e njerëzve në atë shoqëri. Ai gjithashtu e përdori atë për të përshkruar shpërndarjen e të ardhurave. [3] Kjo ide ndonjëherë shprehet më thjesht si parimi Pareto ose "rregulli 80-20" që thotë se 20% e popullsisë kontrollon 80% të pasurisë. [10] Megjithatë, rregulli 80-20 korrespondon me një vlerë të veçantë të α, dhe në fakt, të dhënat e Paretos mbi tatimet britanike mbi të ardhurat në Cours d'économie politique tregojnë se rreth 30% e popullsisë kishte rreth 70% të të ardhurave.Grafiku i funksionit të dendësisë së probabilitetit (FDP) në fillim të këtij artikulli tregon se "probabiliteti" ose pjesa e popullsisë që zotëron një sasi të vogël pasurie për person është mjaft e lartë dhe më pas zvogëlohet në mënyrë të qëndrueshme me rritjen e pasurisë. (Sidoqoftë, shpërndarja Pareto nuk është realiste për pasurinë për pjesën e poshtme. Në fakt, vlera neto mund të jetë edhe negative. ) Kjo shpërndarje nuk kufizohet në përshkrimin e pasurisë ose të ardhurave, por në shumë situata në të cilat gjendet një baraspeshë në shpërndarjen e "të voglave" tek "të mëdhatë". Shembujt e mëposhtëm shihen ndonjëherë si të shpërndarë përafërsisht Pareto:
- Madhësitë e vendbanimeve njerëzore (pak qytete, shumë fshatra/fshatra) [11] [12]
- Shpërndarja e madhësisë së skedarit të trafikut të internetit që përdor protokollin TCP (shumë skedarë më të vegjël, pak më të mëdhenj) [11]
- Shkalla e gabimit të diskut të ngurtë [13]
- Grupet e kondensatës Bose-Einstein afër zeros absolute [14]
- Vlerat e rezervave të naftës në fushat e naftës (disa fusha të mëdha, shumë fusha të vogla ) [11]
- Shpërndarja e gjatësisë në punët e caktuara për superkompjuterët (disa të mëdhenj, shumë të vegjël) [15]
- Kthimet e standardizuara të çmimeve për aksionet individuale [11]
- Madhësitë e grimcave të rërës [11]
- Madhësia e meteoritëve
- Ashpërsia e humbjeve të mëdha të viktimave për linja të caktuara biznesi si përgjegjësia e përgjithshme, makina tregtare dhe kompensimi i punëtorëve. [16] [17]
- Sasia e kohës që një përdorues në Steam do të kalojë duke luajtur lojëra të ndryshme. (Disa lojëra luhen shumë, por shumica luhen pothuajse kurrë.) [1]
- Në B[ hulumtim origjinal?esueshmërinë e Shpërndarjes së Ndërmarrjeve Elektrike (80% e minutave të ndërprera të klientit ndodhin në afërsisht 20% të ditëve në një vit të caktuar).
- ↑ Stampa:Cite journal
- ↑ Stampa:Cite journal
- ↑ 3,0 3,1 Pareto, Vilfredo, Cours d'Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino, Librairie Droz, Geneva, 1964, pp. 299–345. Original book archived
- ↑ Stampa:Cite journal
- ↑ Stampa:Cite journal
- ↑ Stampa:Cite journal
- ↑ Stampa:Cite book
- ↑ Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1. Wiley Series in Probability and Statistics.
- ↑ Stampa:Cite journal
- ↑ For a two-quantile population, where approximately 18% of the population owns 82% of the wealth, the Theil index takes the value 1.
- ↑ 11,0 11,1 11,2 11,3 11,4 Stampa:Cite journal Gabim citimi: Invalid
<ref>tag; name "Reed" defined multiple times with different content - ↑ Stampa:Cite journal
- ↑ Stampa:Cite journal
- ↑ Stampa:Cite journal
- ↑ Stampa:Cite journal
- ↑ Kleiber and Kotz (2003): p. 94.
- ↑ Stampa:Cite journal