Varianca

Nga testwiki
Kërceni tek navigimi Kërceni tek kërkimi
Shembull i zgjedhjeve nga dy popullata me të njëjtën mesatare por varianca të ndryshme. Popullata e kuqe e ka mesataren 100 dhe variancën 100 (D.S=10) ndërsa popullata blu ka mesataren 100 dhe variancën 2500 (D.S=50).

teorinë dhe statistikat e probabilitetit, varianca ose dispersioni është shamngia në katror nga mesatarja e një ndryshoreje rasti . Varianca shpesh përkufizohet gjithashtu si katrori i devijimit standard . Varianca është një matëse e shpërndarjes, që do të thotë se është një matëse se sa larg është shpërndarë një grup numrash nga vlera e tyre mesatare. Është momenti i dytë qendror i një shpërndarjeje, dhe kovarianca e ndryshores së rastësishme me vetveten, dhe shpesh përfaqësohet nga σ2, s2, Var(X), D(X), ose V(X) . [1]

Një avantazh i dispersionit si masë e shpërndarjes është se është më i përshtatshëm për manipulimin algjebrik sesa masat e tjera të shpërndarjes, siç është devijimi absolut i pritur ; për shembull, varianca e një shume ndryshoresh rasti të pakorreluara është e barabartë me shumën e variancave të tyre. Një disavantazh i dispersionit në zbatime praktike është se, ndryshe nga devijimi standard, njësitë e tij ndryshojnë nga ajo e n.r, kjo është arsyeja pse devijimi standard raportohet më shpesh si një masë e shpërndarjes pasi përfundon llogaritja.

Ka dy koncepte të ndryshme që emërtohen të dyja "variancë". Njëra, siç u diskutua më lart, është pjesë e një shpërndarjeje teorike probabiliteti dhe përcaktohet nga një ekuacion. Varianca tjetër është një karakteristikë e një grupi vëzhgimesh. Kur varianca llogaritet nga vëzhgimet, ato vëzhgime zakonisht maten nga një sistem i botës reale. Nëse të gjitha rezultatet e mundshme të sistemit janë të pranishme, atëherë varianca e llogaritur quhet variancë e popullsisë. Normalisht, megjithatë, vetëm një nëngrup është i gatshëm dhe varianca e llogaritur nga kjo mënyrë quhet variancë e mostrës. Varianca e llogaritur nga një kampion konsiderohet si një vlerësim i variancës së plotë të popullsisë. Ka shumë mënyra për të llogaritur një vlerësim të variancës së popullsisë, siç diskutohet në seksionin më poshtë.

Përkufizimi

Varianca e një ndryshoreje rasti X është vlera e pritur e devijimit nga mesatarja në katror e X, μ=E[X] :

Var(X)=E[(Xμ)2].

Ky përkufizim përfshin ndryshore rasti që krijohen nga procese që janë diskrete, të vazhdueshme, as ose të përziera. Varianca mund të konsiderohet gjithashtu si kovarianca e një ndryshoreje të rastësishme me vetveten:

Var(X)=Cov(X,X).

Një tjetër formulë për dispersionin merret si më poshtë:

Var(X)=E[(XE[X])2]=E[X22XE[X]+E[X]2]=E[X2]2E[X]E[X]+E[X]2=E[X2]E[X]2

Me fjalë të tjera, varianca e X është e barabartë me mesataren e n.r X të ngritur në katror minus katrorin e mesatares së X. Ky ekuacion nuk duhet të përdoret për llogaritjet duke përdorur aritmetikën me pikë lundruese, sepse vuan nga anulimi katastrofik nëse dy komponentët e ekuacionit janë të ngjashëm në madhësi. Për alternativa të tjera numerikisht të qëndrueshme, shihni Algoritmet për llogaritjen e variancës .

Ndryshore e rastit diskrete

Nëse ndryshorja e rastit X është diskrete me funksion mase probabiliteti x1p1,x2p2,,xnpn, atëherë

Var(X)=i=1npi(xiμ)2,

ku μ është vlera e pritur. Kjo është,

μ=i=1npixi.

Varianca e një bashkësie të n vlerash njëlloj të mundshme shkruhet edhe si:

Var(X)=1ni=1n(xiμ)2

ku μ është vlera mesatare. Kjo është,

μ=1ni=1nxi.

Ndryshoret e rastit absolutisht të vazhdueshme

Nëse ndryshorja e rastit X ka një funksion të densitetit të probabilitetit f(x), dhe F(x) është funksioni përkatës i shpërndarjes mbledhëse, atëherë

Var(X)=σ2=(xμ)2f(x)dx=x2f(x)dx2μxf(x)dx+μ2f(x)dx=x2dF(x)2μxdF(x)+μ2dF(x)=x2dF(x)2μμ+μ21=x2dF(x)μ2,

ose në mënyrë të njëvlershme,

Var(X)=x2f(x)dxμ2,

Shembuj

Shpërndarja eksponenciale

Shpërndarja eksponenciale me parametërrin λ është një shpërndarje e vazhdueshme, funksioni i densitetit të probabilitetit të së cilës është dhënë nga

f(x)=λeλx

në intervalin [0, ∞ ) . Mesatarja e kësaj shpërndarje mund të tregohet se është

E[X]=0λxeλxdx=1λ.

Duke përdorur integrimin me pjesë dhe duke përdorur pritje matematike tashmë të llogaritur, ne kemi:

E[X2]=0λx2eλxdx=[x2eλx]0+02xeλxdx=0+2λE[X]=2λ2.

Kështu, varianca e X jepet nga

Var(X)=E[X2]E[X]2=2λ2(1λ)2=1λ2.

Zari i drejtë

Hedhja e një zari të drejtë mund të modelohet si n.r diskrete, X, me rezultate nga 1 deri tek 6, secila me probabilitet të njëjtë 1/6. Pritja matematike e X është(1+2+3+4+5+6)/6=7/2. Kështu që, varianca e X është

Var(X)=i=1616(i72)2=16((5/2)2+(3/2)2+(1/2)2+(1/2)2+(3/2)2+(5/2)2)=35122.92.

Shpërndarjet e probabilitetit të përdorura zakonisht

Emri i shpërndarjes së probabilitetit Funksioni i shpërndarjes së probabilitetit Mesatarja Varianca
Shpërndarja binomiale Pr(X=k)=(nk)pk(1p)nk np np(1p)
Shpërndarja gjeometrike Pr(X=k)=(1p)k1p 1p (1p)p2
Shpërndarja normale f(xμ,σ2)=12πσ2e(xμ)22σ2 μ σ2
Shpërndarja uniforme (e vazhdueshme) f(xa,b)={1bafor axb,0for x<a or x>b a+b2 (ba)212
Shpërndarja eksponenciale f(xλ)=λeλx 1λ 1λ2
Shpërndarja Poisson f(kλ)=eλλkk! λ λ

Vetitë

Vetitë themelore

Varianca është jo negative sepse madhësitë e ngritura në katror janë gjithmonë pozitive ose zero:

Var(X)0.

Varianca e një konstante është zero.

Var(a)=0.

Çështja e pafundësisë

Nëse një shpërndarje nuk ka pritje matematike të fundme, siç është rasti për shpërndarjen Cauchy, atëherë edhe varianca nuk mund të jetë e fundme. Megjithatë, disa shpërndarje mund të mos kenë një variancë të fundme, pavarësisht se pritja matematike është e fundme. Një shembull i tillë është një shpërndarje Pareto, indeksi i së cilës k plotëson kushtin 1<k2.

Njësitë matëse

Ndryshe nga devijimi absolut i pritur, varianca e një ndryshore ka njësi që janë katrori i njësive të vetë ndryshores. Për shembull, një ndryshore e matur në metra do të ketë një variancë të matur në metra katrorë. Për këtë arsye, përshkrimi i grupeve të të dhënave nëpërmjet devijimit të tyre standard ose devijimit mesatar katror nën rrënjë shpesh preferohet ndaj përdorimit të variancës. Në shembullin e zareve, devijimi standard është 2,91,7, pak më i madh se devijimi absolut i pritur, 1.5.

Përhapja

Mbledhja dhe shumëzimi me një konstante

Varianca është e pandjeshme ndaj ndryshimeve në një parametër vendndodhjeje . Kjo do të thotë se nëse një konstante u shtohet të gjitha vlerave të ndryshores, varianca mbetet e pandryshuar:

Var(X+a)=Var(X).

Nëse të gjitha vlerat shkallëzohen me një konstante, varianca shkallëzohet me katrorin e asaj konstante:

Var(aX)=a2Var(X).

Varianca e shumës së dy ndryshoreve të rastit jepet nga barazimi

Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y)=(aσX+bσY)2
Var(aXbY)=a2Var(X)+b2Var(Y)2abCov(X,Y)=(aσXbσY)2

ku Cov(X,Y) është kovarianca dhe σX është devijimi standard i X.

Kombinimet lineare

Në përgjithësi, për shumën e N ndryshoreve të rastit {X1,,XN}, varianca gjendet si:

Var(i=1NXi)=i,j=1NCov(Xi,Xj)=i=1NVar(Xi)+ijCov(Xi,Xj),

Këto rezultate çojnë në variancën e një kombinimi linear të gjetur si:

Var(i=1NaiXi)=i,j=1NaiajCov(Xi,Xj)=i=1Nai2Var(Xi)+i=jaiajCov(Xi,Xj)=i=1Nai2Var(Xi)+21i<jNaiajCov(Xi,Xj).

Nëse ndryshoret e rastit X1,,XN janë të tilla që

Cov(Xi,Xj)=0 ,  (ij),

atëherë thuhet se janë të pakorreluara . Kështu që për to mund të shkruhet:

Var(i=1NXi)=i=1NVar(Xi).

Prodhimi ndryshoreve

Prodhimi i ndryshoreve të pavarura

Nëse dy ndryshore X dhe Y janë të pavarura, varianca e prodhimit të tyre jepet nga [2]

Var(XY)=[E(X)]2Var(Y)+[E(Y)]2Var(X)+Var(X)Var(Y).

Në mënyrë të njëvlerëshme, duke përdorur vetitë themelore të pritjes matematike, ajo jepet nga

Var(XY)=E(X2)E(Y2)[E(X)]2[E(Y)]2.

Produkt i ndryshoreve statistikisht të varura

Var(XY)=E[X2Y2][E(XY)]2=Cov(X2,Y2)+E(X2)E(Y2)[E(XY)]2=Cov(X2,Y2)+(Var(X)+[E(X)]2)(Var(Y)+[E(Y)]2)[Cov(X,Y)+E(X)E(Y)]2

Varianca e popullatës dhe varianca e zgjedhjes/kampionimit

Vëzhgimet e botës reale të tilla si matjet e shiut të djeshëm gjatë gjithë ditës zakonisht nuk mund të jenë grupe të plota të të gjitha vëzhgimeve të mundshme. Si e tillë, varianca e llogaritur nga bashkësia e fundme në përgjithësi nuk do të përputhet me variancën që do të ishte llogaritur nga popullata e plotë e vëzhgimeve të mundshme. Kjo do të thotë që vlerësohet mesatarja dhe varianca nga një bashkësi e kufizuar vëzhgimesh duke përdorur një ekuacion vlerësues . Vlerësuesi është një funksion i zgjedhjes së n vëzhgimeve të nxjerra pa paragjykime vëzhguese nga e gjithë popullata e vëzhgimeve të mundshme. Në këtë shembull ajo zgjedhje do të ishte grupi i matjeve të reshjeve të djeshme nga matësat në gatishmëri.

Vlerësuesit më të thjeshtë për mesataren e popullsisë dhe variancën e popullsisë janë thjesht mesatarja dhe varianca e zgjedhjes/kampionit, mesatarja e zgjedhjes dhe varianca (e pakorrigjuar) e zgjedhjes- këta janë vlerësues të qëndrueshëm (ata konvergjojnë në vlerën e saktë teksa numri i zgjedhjeve rritet), por mund të të përmirësohet. Vlerësimi i variancës së popullatës duke marrë variancën e zgjedhjes është afër optimales në përgjithësi, por mund të përmirësohet në dy mënyra. Më thjeshtë, varianca e kampionit llogaritet si një mesatare e devijimeve në katror rreth mesatares (së kampionit), duke e pjesëtuar me n. Megjithatë, përdorimi i vlerave të tjera përveç n përmirëson vlerësuesin në mënyra të ndryshme. Katër vlera për emëruesin janë n, n1, n+1, dhe n1,5: n është më e thjeshta (varianca e popullsisë së kampionit), n1 eliminon paragjykimet, n+1 minimizon gabimin mesatar në katror për shpërndarjen normale, dhe n1,5 më së shumti eliminon zjvendosjet/anësinë në vlerësimin e paanshëm të devijimit standard për shpërndarjen normale.

Varianca e popullsisë

Në përgjithësi, varianca e popullsisë së një popullatefundme me madhësi N me vlera xi jepet nga

σ2=1Ni=1N(xiμ)2=1Ni=1N(xi22μxi+μ2)=(1Ni=1Nxi2)2μ(1Ni=1Nxi)+μ2=(1Ni=1Nxi2)μ2

ku mesatarja e popullësisë është

μ=1Ni=1Nxi.

Varianca e popullsisë gjithashtu mund të llogaritet duke përdorur

σ2=1N2i<j(xixj)2=12N2i,j=1N(xixj)2.

Varianca e kampionit

Varianca e pazhvendosur e kampionit

Në shumë situata praktike, varianca e vërtetë e një popullate nuk dihet apriori dhe duhet të llogaritet sipas ndonjë mënyre. Kur kemi të bëjmë me popullata jashtëzakonisht të mëdha, nuk është e mundur të numërohet çdo objekt i popullatës, kështu që llogaritja duhet të kryhet në një zgjedhje të popullsisë. [3] Kjo zakonisht quhet variancë e zgjedhjes ose variancë empirike . Varianca e zgjedhjes mund të zbatohet gjithashtu për vlerësimin e variancës së një shpërndarjeje të vazhdueshme nga një kampion i asaj shpërndarjeje.

Marrim një kampion me zëvendësim të n vlerave Y1,...,Yn nga popullsia, ku n<N, dhe vlerësojmë variancën në bazë të këtij kampioni. [4] Marrja e drejtpërdrejtë e variancës së të dhënave të mostrës jep mesataren e devijimeve në katror :

S~Y2=1ni=1n(YiY)2=(1ni=1nYi2)Y2=1n2i,j:i<j(YiYj)2.

Këtu, Y tregon mesataren e mostrës :

Y=1ni=1nYi.

Meqenëse Y i zgjidhen rastësisht, të dyja Y dhe S~Y2 janë ndryshore të rastit. Pritjet matematike të tyre mund të vlerësohen duke marrë një mesatare mbi grupin e të gjitha kampioneve të mundshme {Yi} me madhësi n nga popullata. Për S~Y2 kjo jep:

E[S~Y2]=E[1ni=1n(Yi1nj=1nYj)2]=1ni=1nE[Yi22nYij=1nYj+1n2j=1nYjk=1nYk]=1ni=1n(n2nE[Yi2]2njiE[YiYj]+1n2j=1nkjnE[YjYk]+1n2j=1nE[Yj2])=1ni=1n[n2n(σ2+μ2)2n(n1)μ2+1n2n(n1)μ2+1n(σ2+μ2)]=n1nσ2.

Prandaj S~Y2 jep një vlerësim të variancës së popullatës që është e njëanshme/ e zhvendosur me një faktor prej n1n . Per kete arsye, S~Y2 referohet si varianca e mostrës së njëanshme .

Varianca e pazhvendosur e zgjedhjes

Korrigjimi për këtë anësi jep variancën e pazhvendosur të mostrës, të shënuar S2 :

S2=nn1S~Y2=nn1[1ni=1n(YiY)2]=1n1i=1n(YiY)2

Secili vlerësues mund të referohet thjesht si varianca e kampionit kur versioni mund të përcaktohet nga konteksti.

  1. Stampa:Cite book
  2. Stampa:Cite journal
  3. Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, p. 14.
  4. Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York