Shpërndarja Pareto

Nga testwiki
Kërceni tek navigimi Kërceni tek kërkimi

Stampa:Infobox shpërndarja e gjasës

Shpërndarja Pareto, e emërtuar sipas inxhinierit të ndërtimit, ekonomistit dhe sociologut italian Vilfredo Pareto, [1] është një shpërndarje probabiliteti që përdoret në përshkrimin e dukurive të vëzhgueshme sociale, kontrollit të cilësisë, shkencore, gjeofizike, aktuariale dhe shumë llojeve të tjera; parimi i zbatuar fillimisht për të përshkruar shpërndarjen e pasurisë në një shoqëri, duke iu përshtatur prirjes që një pjesë e madhe e pasurisë të mbahet nga një pjesë e vogël e popullsisë. [2] [3] Parimi Pareto ose "rregulli 80-20" që thotë se 80% e rezultateve janë për shkak të 20% të shkaqeve u emërtua për nder të Paretos, por konceptet janë të dallueshme dhe vetëm shpërndarjet Pareto me vlerë të formës ( α ) rreth 4 5 ≈ 1.16 pasqyrojnë saktësisht atë. Vëzhgimi empirik ka treguar se kjo shpërndarje 80-20 përshtatet me një gamë të gjerë rastesh, duke përfshirë fenomenet natyrore [4] dhe aktivitetet njerëzore. [5] [6]

Përkufizimet

Nëse X është një ndryshore e rastit me një shpërndarje Pareto, [7] atëherë probabiliteti që X është më i madh se një numër x, pra funksioni i mbijetesës (i quajtur edhe funksioni i bishtit), jepet nga

F(x)=Pr(X>x)={(xmx)αxxm,1x<xm,

ku xm është vlera minimale e mundshme (domosdoshmërisht pozitive) e X, dhe α është një parametër pozitiv. Shpërndarja Pareto Lloji I karakterizohet nga një parametër i shkallës xm dhe një parametër i formës α, i cili njihet si indeksi i bishtit . Kur kjo shpërndarje përdoret për të modeluar shpërndarjen e pasurisë, atëherë parametri α quhet indeksi Pareto .

Funksioni mbledhës i shpërndarjes

Nga përkufizimi, funksioni mbledhës i shpërndarjes së një ndryshoreje të rastit Pareto me parametra α dhe xm është

FX(x)={1(xmx)αxxm,0x<xm.

Funksioni i densitetit të probabilitetit

Nga kjo rrjedh (me diferencim ) se funksioni i dendësisë së probabilitetit është

fX(x)={αxmαxα+1xxm,0x<xm.

Vetitë

Momentet dhe funksioni karakteristik

E(X)={α1,αxmα1α>1.
Var(X)={α(1,2],(xmα1)2αα2α>2.
(Nëse α1, varianca nuk ekziston. )
  • Momentet e papërpunuara janë
μn={αn,αxmnαnα>n.
  • Funksioni gjenerues i momentit përcaktohet vetëm për vlerat jo pozitive t0 si
M(t;α,xm)=E[etX]=α(xmt)αΓ(α,xmt)
M(0,α,xm)=1.
  • Funksioni karakteristik jepet nga
φ(t;α,xm)=α(ixmt)αΓ(α,ixmt),
ku Γ(a,x) është funksioni i paplotë gama .

Mesatarja harmonike

Mesatarja harmonike ( H ) është [8]

H=xm(1+1α).

Lidhja me shpërndarjen eksponenciale

Shpërndarja Pareto lidhet me shpërndarjen eksponenciale si më poshtë. Nëse X është Pareto-shpërndarë me minimum x m dhe indeks α, atëherë

Y=log(Xxm)

shpërndahet në mënyrë eksponenciale me parametrin e shakllës  α . Në mënyrë ekuivalente, nëse Y shpërndahet në mënyrë eksponenciale me shpejtësi α, atëherë

xmeY

është Pareto-shpërndarë me minimum x m dhe indeks α .

Më në përgjithësi, nëse λGamma(α,β) (parametizimi i shkallës së formës) dhe η|λExp(λ), atëherë β+ηPareto(β,α) .

Lidhja me shpërndarjen log-normale

Shpërndarja Pareto dhe shpërndarja log-normale janë shpërndarje alternative për përshkrimin e madhësive të së njëjtit lloj. Një nga lidhjet ndërmjet të dyjave është se ato janë të dyja shpërndarjet e eksponencialit të ndryshoreve të rastit të shpërndara sipas shpërndarjeve të tjera të zakonshme, përkatësisht shpërndarjes eksponenciale dhe shpërndarjes normale . (Shih seksionin e mëparshëm . )

Konkluzioni statistikor

Vlerësimi i parametrave

Funksioni i përgjasisë për parametrat e shpërndarjes Pareto α dhe x m, duke pasur parasysh një mostër të pavarur x=(x1,x2,...,xn), është

L(α,xm)=i=1nαxmαxiα+1=αnxmnαi=1n1xiα+1.

Prandaj, funksioni logaritmik të përgjasisë është

(α,xm)=nlnα+nαlnxm(α+1)i=1nlnxi.

Mund të shihet se (α,xm) është në rritje monotonike me xm, pra sa më e madhe të jetë vlera e xm, aq më e madhe është vlera e funksionit të gjasave. Prandaj, meqenëse xxm, arrijmë në përfundimin se

x^m=minixi.

Për të gjetur vlerësuesin për α, ne llogarisim derivatin e pjesshëm përkatës dhe përcaktojmë se ku është zero:

α=nα+nlnxmi=1nlnxi=0.

Kështu, vlerësuesi i përgjasisë maksimale për α është:

α^=niln(xi/x^m).

Gabimi statistikor i pritur është: [9]

σ=α^n.

Ndodhia dhe aplikimet

Të përgjithshme

Vilfredo Pareto fillimisht e përdori këtë shpërndarje për të përshkruar ndarjen e pasurisë midis individëve pasi dukej se tregonte mjaft mirë mënyrën se një pjesë më e madhe e pasurisë së çdo shoqërie zotërohet nga një përqindje më e vogël e njerëzve në atë shoqëri. Ai gjithashtu e përdori atë për të përshkruar shpërndarjen e të ardhurave. [3] Kjo ide ndonjëherë shprehet më thjesht si parimi Pareto ose "rregulli 80-20" që thotë se 20% e popullsisë kontrollon 80% të pasurisë. [10] Megjithatë, rregulli 80-20 korrespondon me një vlerë të veçantë të α, dhe në fakt, të dhënat e Paretos mbi tatimet britanike mbi të ardhurat në Cours d'économie politique tregojnë se rreth 30% e popullsisë kishte rreth 70% të të ardhurave.Grafiku i funksionit të dendësisë së probabilitetit (FDP) në fillim të këtij artikulli tregon se "probabiliteti" ose pjesa e popullsisë që zotëron një sasi të vogël pasurie për person është mjaft e lartë dhe më pas zvogëlohet në mënyrë të qëndrueshme me rritjen e pasurisë. (Sidoqoftë, shpërndarja Pareto nuk është realiste për pasurinë për pjesën e poshtme. Në fakt, vlera neto mund të jetë edhe negative. ) Kjo shpërndarje nuk kufizohet në përshkrimin e pasurisë ose të ardhurave, por në shumë situata në të cilat gjendet një baraspeshë në shpërndarjen e "të voglave" tek "të mëdhatë". Shembujt e mëposhtëm shihen ndonjëherë si të shpërndarë përafërsisht Pareto:

  • Madhësitë e vendbanimeve njerëzore (pak qytete, shumë fshatra/fshatra) [11] [12]
  • Shpërndarja e madhësisë së skedarit të trafikut të internetit që përdor protokollin TCP (shumë skedarë më të vegjël, pak më të mëdhenj) [11]
  • Shkalla e gabimit të diskut të ngurtë [13]
  • Grupet e kondensatës Bose-Einstein afër zeros absolute [14]
  • Vlerat e rezervave të naftës në fushat e naftës (disa fusha të mëdha, shumë fusha të vogla ) [11]
  • Shpërndarja e gjatësisë në punët e caktuara për superkompjuterët (disa të mëdhenj, shumë të vegjël) [15]
  • Kthimet e standardizuara të çmimeve për aksionet individuale [11]
  • Madhësitë e grimcave të rërës [11]
  • Madhësia e meteoritëve
  • Ashpërsia e humbjeve të mëdha të viktimave për linja të caktuara biznesi si përgjegjësia e përgjithshme, makina tregtare dhe kompensimi i punëtorëve. [16] [17]
  • Sasia e kohës që një përdorues në Steam do të kalojë duke luajtur lojëra të ndryshme. (Disa lojëra luhen shumë, por shumica luhen pothuajse kurrë.) [1] 
  • Në B[ hulumtim origjinal?esueshmërinë e Shpërndarjes së Ndërmarrjeve Elektrike (80% e minutave të ndërprera të klientit ndodhin në afërsisht 20% të ditëve në një vit të caktuar).
  1. Stampa:Cite journal
  2. Stampa:Cite journal
  3. 3,0 3,1 Pareto, Vilfredo, Cours d'Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino, Librairie Droz, Geneva, 1964, pp. 299–345. Original book archived
  4. Stampa:Cite journal
  5. Stampa:Cite journal
  6. Stampa:Cite journal
  7. Stampa:Cite book
  8. Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1. Wiley Series in Probability and Statistics.
  9. Stampa:Cite journal
  10. For a two-quantile population, where approximately 18% of the population owns 82% of the wealth, the Theil index takes the value 1.
  11. 11,0 11,1 11,2 11,3 11,4 Stampa:Cite journal Gabim citimi: Invalid <ref> tag; name "Reed" defined multiple times with different content
  12. Stampa:Cite journal
  13. Stampa:Cite journal
  14. Stampa:Cite journal
  15. Stampa:Cite journal
  16. Kleiber and Kotz (2003): p. 94.
  17. Stampa:Cite journal