Definizione covarianza

Il termine covarianza non fa parte del dizionario sviluppato dalla Royal Spanish Academy ( RAE ). Il concetto, tuttavia, viene utilizzato nel campo della statistica e nel campo della probabilità per denominare il valore che riflette il grado di variazione articolare che viene registrato in due variabili casuali prendendo i loro mezzi come misura.

covarianza

La covarianza, quindi, ci consente di scoprire se le variabili mantengono un collegamento di dipendenza . I dati aiutano anche a conoscere altri parametri.

È noto con il nome di variabile casuale a una funzione che al risultato di un esperimento casuale assegna a lui un valore, solitamente di tipo numerico. Un esperimento casuale, d'altra parte, è uno che può dare risultati diversi anche se viene eseguito più volte nelle stesse condizioni, così che ogni esperienza diventa impossibile da prevedere e, quindi, da riprodurre.

Un esempio molto comune di esperimento casuale, che possiamo provare nella nostra vita quotidiana, è il lancio di un dado: anche se viene lanciato sulla stessa superficie, con la stessa mano o tazza, e applicando più o meno la stessa forza e direzione, non lo fa è possibile prevedere quale dei tuoi volti sarà rivolto verso l'alto.

Se i valori bassi di una variabile corrispondono ai valori bassi di un'altra variabile, o se lo stesso accade con i valori alti di entrambi, la covarianza ha un valore positivo ed è qualificata come diretta . D'altra parte, se i valori bassi di una variabile corrispondono ai valori più alti di un'altra variabile e viceversa, la covarianza è negativa ed è definita come inversa . La tendenza esistente nella relazione lineare stabilita tra le variabili, in questo modo, è espressa dal segno della covarianza .

Esistono diverse formule per calcolare la covarianza. Si può affermare che la covarianza è il mezzo aritmetico che deriva dal prodotto delle deviazioni delle variabili rispetto ai propri mezzi.

Supponiamo che le variabili siano i risultati delle valutazioni di storia e geografia di cinque studenti:

Grades History (P) dei cinque studenti: 6, 5, 7, 7, 4 (totale = 29)
Punteggi di Geografia (S) dei cinque studenti: 7, 3, 4, 3, 5 (totale = 22)

Quindi devi tabulare, moltiplicando i risultati delle valutazioni di ogni studente:

P x S: 42 (da 6 x 7 = 42), 15 (5 x 3), 28 (7 x 4), 21 (7 x 3), 20 (4 x 5). Totale della somma dei risultati = 126)

La media di P: 29/5 = 5, 8
La media di S: 22/5 = 4.4

infine:

Covarianza PS: (126/5) - 5, 8 x 4, 4
Covarianza PS: 25, 2 - 5, 8 x 4, 4
Covariance PS: 25, 2 - 25, 52
Covarianza PS: -0, 32

Oltre a sapere se due variabili casuali date hanno un legame di dipendenza reciproca, la covarianza viene utilizzata per stimare parametri come la linea di regressione e il coefficiente di correlazione lineare .

La linea di regressione è anche nota come regolazione lineare o regressione lineare ed è un concetto appartenente al campo della statistica che include un modello matematico utilizzato per approssimare la dipendenza esistente tra un gruppo di variabili e un termine casuale.

Il coefficiente di correlazione lineare, d'altra parte, è un indicatore della direzione e della forza di una relazione lineare (in matematica, ciò che viene dato se il valore di una grandezza dipende da ciò che un'altra ha) e una proporzionalità (un rapporto o relazione costante che si verifica tra le grandezze che possono essere misurate) tra due variabili statistiche (sono caratteristiche che possono fluttuare, con valori che possono essere osservati e misurati).

È importante differenziare i seguenti due tipi di covarianza: quella che si verifica tra due variabili casuali, che è considerata una proprietà della distribuzione congiunta, cioè degli eventi di entrambi che si verificano simultaneamente; il campione, che viene utilizzato come stima statistica del parametro .

Raccomandato