Glossario statistico

Descrizione

Cerca termini di glossario (le espressioni regolari sono consentite)
Inizia con Contiene Termine esatto

Glossari

Termine Definizione
t-test di Student

Vedi Student (test t di).

t-test per dati appaiati

Test di Student adottato per saggiare l’uguaglianza delle medie di due popolazioni applicato a coppie di osservazioni quando cioè si dispone di dati che provengono da campioni appaiati.

Tabella di contingenza due per due (2 x 2)

Tabella con due righe e due colonne usata per rappresentare la distribuzione congiunta di due variabili dicotomiche. La formula classica è la seguente:

tabella-contingenza 

Tasso

Misura di velocità di occorrenza di un fenomeno che si presenta nel tempo ed è dato dal seguente rapporto:
(numero eventi osservati in un periodo stabilito)/(popolazione media presente * durata del periodo)

Tavola di sopravvivenza (analisi della)
Tendenza centrale

Proprietà della distribuzione di una variabile in genere espressa da media mediana o moda della distribuzione stessa.

Teorema centrale limite

Se una variabile casuale y ha una media μ ed una varianza σ2 allora la media campionaria calcolata su n osservazioni segue approssimativamente una distribuzione gaussiana con media μ e varianza σ2/n per valori di n sufficientemente grandi.

Teorema di Bayes

Procedura per aggiornare la probabilità di un evento alla luce di nuove evidenze. La formula più semplice è la seguente:
P (A/B)= P(B/A) P(A)/P(B)
Dove P (A/B) sta ad indicare la probabilità di A condizionata da B. Tale probabilità che si può interpretare come un aggiornamento della probabilità semplice P(A) alla luce dell’occorrenza dell’evento è detta probabilità a posteriori. Il teorema è stato pubblicato dal reverendo Bayes nel 1763. L’applicazione del teorema può essere così riassunta: ammettiamo che l’evento di interesse (A) sia che un paziente è affetto da una particolare malattia e che l’evento condizionante (B) sia il risultato positivo ad un test diagnostico. La prevalenza di A è allora la probabilità non condizionata di malattia P(A). La sensibilità del test è invece la probabilità condizionata di avere un test positivo tra i pazienti affetti da malattia P(B/A). La specificità del test è invece la probabilità condizionata di un risultato negativo in un soggetto esente dalla malattia.
Il test può essere applicato in modo intuitivo conoscendo la sensibilità la specificità e la prevalenza di una malattia e potrà essere stabilito il valore predittivo positivo e negativo di un soggetto risultato positivo e negativo al test rispettivamente. L’esempio comune è quello del dosaggio degli Ab anti-HIV con la tecnica Western Blot la cui sensibilità è del 100% e la specificità è del 99.7%. Se il test viene applicato indiscriminatamente alla popolazione generale per effetto della bassa prevalenza di soggetti che hanno contratto l’infezione (3/1000) il Valore Predittivo Positivo del test (paziente positivo realmente portatore degli Ab anti-HIV) è solo del 50%. Accade infatti che in ogni mille soggetti esaminati 3 risulteranno positivi al test perché hanno contratto il virus e 3 positivi in virtù della specificità del test. A ribadire l’importanza della prevalenza è sufficiente ricordare come se il test viene applicato su sottogruppi a rischio di aver contratto l’infezione come gli omosessuali (dove la prevalenza dell’infezione è di circa il 10%) il Valore Predittivo Positivo sale al 97%. Infatti applicando il test a 1000 omosessuali avremo 100 soggetti realmente positivi e 3 falsamente positivi.

Test chi-quadro

E' la processazione statistica più comune per saggiare l’indipendenza fra variabili categoriche la cui distribuzione congiunta si presenta con una tabella di contingenza.

Test conservativi e non conservativi

Nell’uso di test per confronti multipli esistono test non conservativi che comportano un aumento del tasso di errore per esperimento maggiore del livello nominale α. I test conservativi possono portare ad un tasso di errore per confronto inferiore al livello nominale. In questo caso si riduce la potenza nonostante un campione molto ampio di soggetti studiati.

Test di Anderson-Darling

Test che serve a saggiare l’ipotesi che un campione derivi da una popolazione che segue una determinata distribuzione di probabilità. Ad esempio può essere saggiata la gaussianità.

Test di Bartlett

Test per saggiare l’uguaglianza delle varianze di k popolazioni (vedi Test di Harley).

Test-F

Test per saggiare che l’ipotesi che due varianze campionarie siano stima di un’identica varianza di popolazione. Esso si fonda sul fatto che le popolazioni studiate abbiano distribuzione gaussiana.

Tracking

Termine usato nell’analisi dei dati longitudinali per indicare la capacità di prevedere i valori successivi a partire da una serie di valori precedenti.

Trasformazione

Cambiamento di scala dei valori di una variabile osservata.