Kovarianca

Nga testwiki
Kërceni tek navigimi Kërceni tek kërkimi
Shenja e kovariancës së dy ndryshoreve të rastit X dhe Y

teorinë e probabilitetit dhe statistikë, kovarianca është një masë e ndryshueshmërisë së përbashkët të dy ndryshoreve të rastit . [1] Nëse vlerat më të mëdha të njërës ndryshore kryesisht korrespondojnë me vlerat më të mëdha të ndryshores tjetër dhe e njëjta gjë vlen për vlerat më të vogla (d.m.th., ndryshoret priren të shfaqin sjellje të ngjashme), kovarianca është pozitive. Në rastin e kundërt, kur vlerat më të mëdha të njërës ndryshore përkojnë kryesisht me vlerat më të vogla të tjetrës, (d.m.th., ndryshoret priren të shfaqin sjellje të kundërta), kovarianca është negative. Pra, shenja e kovariancës tregon prirjen në marrëdhënien lineare ndërmjet variablave. Madhësia e kovariancës është mesatarja gjeometrike e variancave që janë të përbashkëta për dy ndryshoret e rastit. Koeficienti i korrelacionit normalizon kovariancën duke e pjesëtuar me mesataren gjeometrike të variancave totale për dy ndryshoret e rastit.

Përkufizimi

Për dy ndryshore të rastit me vlera reale të shpërndara së bashku , X dhe Y, me momente të dyta të fundme, kovarianca përkufizohet si pritja matematike (ose mesatarja) e prodhimit të shmangieve të tyre nga pritjet e tyre matematike individuale: [2] [3] Stampa:Rpcov(X,Y)=E[(XE[X])(YE[Y])]ku E[X] është pritja matematike e X, i njohur edhe si mesatarja e X . Kovarianca gjithashtu shënohet ndonjëherë σXY ose σ(X,Y), për analogji me variancën . Duke përdorur vetinë e linearitetit të pritjeve, kjo mund të thjeshtohet në pritjen matematike të prodhimit të tyre minus prodhimin e vlerave të tyre të pritura:

cov(X,Y)=E[(XE[X])(YE[Y])]=E[XYXE[Y]E[X]Y+E[X]E[Y]]=E[XY]E[X]E[Y]E[X]E[Y]+E[X]E[Y]=E[XY]E[X]E[Y],

por ky ekuacion është i ndjeshëm ndaj anulimit katastrofik.

Njësitë matëse të kovariancës cov(X,Y) janë ato të X herë ato të Y . Në të kundërt, koeficientët e korrelacionit, të cilët varen nga kovarianca, janë një masë pa dimensione e varësisë lineare. (Në fakt, koeficientët e korrelacionit mund të kuptohen thjesht si një version i normalizuar i kovariancës. )

Ndryshoret e rastit diskrete

Nëse çifti i ndryshoreve të rastit (reale). (X,Y) mund të marrë vlerat (xi,yi) për i=1,,n, me probabilitete të barabarta pi=1/n, atëherë kovarianca mund të shkruhet në mënyrë të njëvlerëshme për sa i përket mesatares E[X] dhe E[Y] si

cov(X,Y)=1ni=1n(xiE(X))(yiE(Y)).

Mund të shprehet gjithashtu në mënyrë të njëvlershme, pa iu referuar drejtpërdrejt mesatareve, si

cov(X,Y)=1n2i=1nj=1n12(xixj)(yiyj)=1n2ij>i(xixj)(yiyj).

Në përgjithësi, nëse ka n realizime të mundshme të (X,Y), domethënë (xi,yi) por me probabilitete ndoshta të pabarabarta pi për i=1,,n, atëherë kovarianca është

cov(X,Y)=i=1npi(xiE(X))(yiE(Y)).

Shembuj

Konsideroni 3 ndryshore të pavarura të rastit A,B,C dhe dy konstante q,r .

X=qA+BY=rA+Ccov(X,Y)=qrvar(A)

Në rastin e veçantë, q=1 dhe r=1, kovarianca ndërmjet X dhe Y, është vetëm varianca e A .

Supozoni se X dhe Y kanë funksionin e masës së probabilitetit të përbashkët të mëposhtëm, [4] në të cilin gjashtë qelizat qendrore japin probabilitetet e përbashkëta diskrete f(x,y) nga gjashtë realizimet hipotetike (x,y)S={(5,8),(6,8),(7,8),(5,9),(6,9),(7,9)} :

f(x,y) x fY(y)
5 6 7
y 8 0 0.4 0.1 0.5
9 0.3 0 0.2 0.5
fX(x) 0.3 0.4 0.3 1

X mund të marrë tre vlera (5, 6 dhe 7) ndërsa Y mund të marrë dy (8 dhe 9). Mesataret e tyre janë μX=5(0.3)+6(0.4)+7(0.1+0.2)=6 dhe μY=8(0.4+0.1)+9(0.3+0.2)=8.5 . Atëherë,

cov(X,Y)=σXY=(x,y)Sf(x,y)(xμX)(yμY)=(0)(56)(88.5)+(0.4)(66)(88.5)+(0.1)(76)(88.5)+(0.3)(56)(98.5)+(0)(66)(98.5)+(0.2)(76)(98.5)=0.1.

Vetitë

Kovarianca me vetveten

Varianca është një rast i veçantë i kovariancës në të cilën të dy ndryshoret janë identike (d.m.th., në të cilin një ndryshore merr gjithmonë të njëjtën vlerë si tjetra): [3] : 121 

cov(X,X)=var(X)σ2(X)σX2.

Kovarianca e kombinimeve lineare

Nëse X, Y, W, dhe V janë ndryshore të rastit me vlera reale dhe a,b,c,d janë konstante me vlera reale, atëherë faktet e mëposhtme janë pasojë e përkufizimit të kovariancës:

cov(X,a)=0cov(X,X)=var(X)cov(X,Y)=cov(Y,X)cov(aX,bY)=abcov(X,Y)cov(X+a,Y+b)=cov(X,Y)cov(aX+bY,cW+dV)=accov(X,W)+adcov(X,V)+bccov(Y,W)+bdcov(Y,V)

Për një varg X1,,Xn të ndryshoreve të rastit me vlera reale dhe konstante a1,,an, ne kemi

var(i=1naiXi)=i=1nai2σ2(Xi)+2i,j:i<jaiajcov(Xi,Xj)=i,jaiajcov(Xi,Xj)

Pakorrelimi dhe pavarësia

Ndryshoret e rastit, kovarianca e të cilave është zero quhen të pakorreluara . [3] Stampa:RpNë mënyrë të ngjashme, përbërësit e vektorëve të rastit, matrica e kovariancës së të cilëve është zero në çdo hyrje jashtë diagonales kryesore quhen gjithashtu të pakorreluar.

Nëse X dhe Y janë ndryshore rasti të pavarura, atëherë kovarianca e tyre është zero. [3] Stampa:Rp[5] Kjo rrjedh sepse nën pavarësinë,

E[XY]=E[X]E[Y].

E kundërta, megjithatë, në përgjithësi nuk është e vërtetë. Për shembull, X le të shpërndahet në mënyrë uniforme në [1,1] dhe le të jetë Y=X2 . E qarte, X dhe Y nuk janë të pavarur, por

cov(X,Y)=cov(X,X2)=E[XX2]E[X]E[X2]=E[X3]E[X]E[X2]=00E[X2]=0.

Llogaritja e kovariancës së kampionit

Kovarianca e kampionit ndërmjet K ndryshoreve të bazuara në N vëzhgimet të secilës, të nxjerra nga një popullsi e pavëzhguar, jepen nga matrica K×K 𝐪=[qjk] me hyrjet

qjk=1N1i=1N(XijX¯j)(XikX¯k),

që është një vlerësim i kovariancës ndërmjet ndryshores j dhe ndryshores k .

Llogaritja numerike

Kur E[XY]E[X]E[Y], ekuacioni cov(X,Y)=E[XY]E[X]E[Y] është i prirur për anulim katastrofik nëse E[XY] dhe E[X]E[Y] nuk llogariten saktësisht dhe kështu duhet të shmangen në programet kompjuterike kur të dhënat nuk janë qëndërzuar më parë. [6] Në këtë rast duhet të preferohen algoritmet numerikisht të qëndrueshme . [7]

Zbatimet

Në gjenetikë dhe biologji molekulare

Kovarianca është një matëse e rëndësishme në biologji . Vargje të caktuara të ADN-së ruhen më shumë se të tjerat midis specieve, dhe kështu për të studiuar strukturat dytësore dhe tretësore të proteinave, ose të strukturave të ARN-së, vargjet krahasohen në specie të lidhura ngushtë. Nëse gjenden ndryshime në vargje ose nuk gjenden fare ndryshime në ARN jokoduese (si p.sh. microARN ), vargjet janë gjetur të nevojshme për motive të zakonshme strukturore, të tilla si një lak ARN. Në gjenetikë, kovarianca shërben një bazë për llogaritjen e Matricës së Marrëdhënieve Gjenetike (GRM) (ndryshe thirret matrica e farefisnisë), duke mundësuar konkluzionet mbi strukturën e popullsisë nga kampioni pa të afërm të njohur, si dhe konkluzionet mbi vlerësimin e trashëgimisë së tipareve komplekse.

Në ekonominë financiare

Kovarianca luan një rol kyç në ekonominë financiare, veçanërisht në teorinë moderne të portofolit dhe në modelin e çmimit të aseteve kapitale . Kovarianca midis kthimeve të aseteve të ndryshme përdoren për të përcaktuar, sipas supozimeve të caktuara, shumat relative të aseteve të ndryshme që investitorët (në një analizë normative ) ose parashikohet të zgjedhin (në një analizë pozitive ) të zgjedhin të mbajnë në një kontekst diversifikimi .

Në përpunimin e sinjalit

Matrica e kovariancës përdoret për të kapur ndryshueshmërinë spektrale të një sinjali. [8]

Në statistikë dhe përpunimin e imazhit

Matrica e kovariancës përdoret në analizën e përbërësit kryesor për të reduktuar dimensionalitetin e veçorive në parapërpunimin e të dhënave .

  1. Stampa:Cite book
  2. Oxford Dictionary of Statistics, Oxford University Press, 2002, p. 104.
  3. 3,0 3,1 3,2 3,3 Stampa:Cite book Gabim citimi: Invalid <ref> tag; name "KunIlPark" defined multiple times with different content
  4. Stampa:Cite web
  5. Stampa:Cite web
  6. Donald E. Knuth (1998). The Art of Computer Programming, volume 2: Seminumerical Algorithms, 3rd edn., p. 232. Boston: Addison-Wesley.
  7. Stampa:Cite book
  8. Stampa:Cite journal