paisy: quanto odio la statistica

venerdì, agosto 31, 2007

quanto odio la statistica

ecco a voi la regressione lineare.
x la cronaca il paisy sta studiando queste cose ( che sono solo una parte ) in vista del penultimo esame prima della laurea ;).

Stime dei parametri nel caso bivariato [modifica]

Generalizzando il problema a due variabili \ x e \ y, scriveremo:

\ y_{i}=a+bh(x_{i})+\varepsilon_{i}

\ h(x) è una generica funzione di \ x e comunemente si assume \ h(x)=x. Ponendo, senza perdita di generalità, tale condizione la formula diviene:

\ y_{i}=a+bx_{i}+\varepsilon_{i}

Quindi la variabile dipendente \ y viene "spiegata" attraverso una relazione lineare della variabile indipendente \ x (cioè: \ a + bx) e da una quantità casuale \ \varepsilon_i.

Il problema della regressione si traduce nella determinazione di \ a e \ b in modo da esprimere al ‘meglio’ la relazione funzionale tra \ y e \ x. Per avvalorare di un significato statistico la scelta dei coefficienti occorre realizzare alcune ipotesi sul modello lineare di regressione.

\ x è una variabile deterministica
\ \textrm{E}(\varepsilon_{i})=0
\ \textrm{var}(\varepsilon_{i}) costante per ogni \ i
\ \textrm{cov}(\varepsilon_{i};\varepsilon_{j})=0\ \forall j\neq i

Date queste ipotesi si calcolano i coefficienti \ a e \ b secondo il metodo dei minimi quadrati (in inglese Ordinary Least Squares, o OLS, da cui il riferimento agli stimatori di seguito ottenuti come agli stimatori OLS) proposto da Gauss; detta:

\ S = S(a,b)= \sum_{i=1}^{N} \varepsilon_{i}^{2} = \sum_{i=1}^{N} (y_{i} - a - bx_{i})^{2}

le stime si ottengono risolvendo:

\ \{a,b\}=\arg\min_{a,b}S(a,b)

Le soluzioni si ricavano uguagliando a zero le derivate parziali di \ S rispetto ad \ a e \ b:

\ \frac{\partial S}{\partial a} = -2 \sum_{i=1}^{N} (y_{i} - a - bx_{i}) = 0
\ \frac{\partial S}{\partial b} = -2 \sum_{i=1}^{N} (y_{i} - a - bx_{i})x_{i} = 0

Dove \ N denota il numero delle osservazioni; segue:

aN+b\sum_{i=1}^{N}x_i=\sum_{i=1}^{N}y_i

a\sum_{i=1}^{N}x_i+b\sum_{i=1}^{N}x_i^2=\sum_{i=1}^{N}x_iy_i

da cui si ricavano le soluzioni:

b=\frac{N\sum_ix_iy_i-\sum_ix_i\sum_iy_i}{N\sum_ix_i^2-(\sum_ix_i)^2}=\frac{S_{xy}}{S_{xx}}=\frac{\textrm{cov}(x,y)}{\textrm{var}(x)}

a=\frac{\sum_iy_i\sum_ix_i^2-\sum_ix_i\sum_ix_iy_i}{N\sum_ix_i^2-(\sum_ix_i)^2}=\bar{y}-b\bar{x}

Essendo la varianza osservata data da:

S_{xx}=\textrm{var}(x)=\frac{1}{N}\sum_{i=1}^{N}(x_i-\bar{x})^2

e la covarianza osservata da:

S_{xy}=\textrm{cov}(x,y)=\frac{1}{N}\sum_{i=1}^{N}(x_i-\bar{x})(y_i-\bar{y})

dove \ \bar{x},\ \bar{y} denotano le medie osservate, si possono scrivere i parametri nella forma:

\ b=S_{xy}/S_{xx}
\ a = \bar{y} -b\bar{x}

Giustificazione probabilistica del metodo di regressione con i minimi quadrati [modifica]

Si consideri il seguente problema teorico: date due variabili casuali \ X e \ Y, quale è il migliore stimatore per il valore atteso di \ Y, ossia quale stimatore presenta lo scarto quadratico medio (o MSE, dall'inglese Mean Squared Error) minimo?

Se si utilizza uno stimatore affine che sfrutta l'informazione relativa alla variabile casuale \ X, \ Y=a+bX, è possibile dimostrare che lo scarto quadratico medio \ \mbox{E}\left[\left(Y-a-bX\right)^{2}\right] è minimizzato se:

\ b = \frac{\mbox{cov}(X,Y)}{\mbox{var}(X)};\quad a = \mbox{E}[Y]-b\mbox{E}[X]= \mbox{E}[Y]-\frac{\mbox{cov}(X,Y)}{\mbox{var}(X)}\mbox{E}[X]

Tale osservazione fornisce una giustificazione di tipo probabilistico alle espressioni proposte sopra; si veda oltre per un'analisi formale, nel caso multivar

in canna

Nessun commento:

Posta un commento

tocca qui!!!!

Ah bene! Art.31 racconta la storia della toccata e fuga, rima confusa, alcolica! Vai J! Quella sera mi si era avvicinata e mi fissava mentre io bevevo una birra chiara, e si era seduta lì vicino a me, ma non me n’ero accorto perché ero un po' storto, allora stufa d’aspettare lei mi dice:" ...J Ax, approvo come interpreti la globalità multimediale della massa attuale, il tuo modo di operare é al di fuori dal commerciale !...". La guardo con sospetto, ero fuori di brutto:" Che cazzo hai detto?", le rispondo con un rutto, prende s’alza e s’allontana, non era mica male questa pu-pulzella: era bella con un cu-curioso taglio di capelli e delle te-te-te-te-tenere espressioni, non si possono sprecare certe occasioni, per non passare da coglione la inseguo, la fermo, mi scuso e dico:" Senti, vorrei approfondire i tuoi accorgimenti, io e te si potrebbe scoprire dei punti in comune e se vuoi aprire le ga- le ga- le gabbie in cui rinchiudi i tuoi pensieri più astrusi, i desideri più impuri potremo chia-chia-chiacchierare e scoprire tutti i punti biologici che devi toccare!". Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Su toccami, toccami qui ! ! Tocca qui ! ! Su toccami, toccami qui ! ! Tocca qui ! ! Su toccami, toccami qui ! ! Tocca qui ! ! Su toccami, toccami qui ! ! Tocca qui ! Questa tipa attacca a parlare, io continuavo a bere, facevo finta di ascoltare, dopo circa una mezz’ora di stronzate e paroloni mi mette una mano sopra i pantaloni e dice: "...Ho voglia di pene-pene-pene-penetrare all’interno del tuo ego per poterne ricavare l’essenza, la dissidenza, e quel tuo sentimento di reazione violenta...". Le dico:" Senti bella, adesso ti spiego, ho voglia anch’io di penetrare, ma non certo il tuo ego, ma la tua fig-fig-figura di donna inserita nella società moderna. Quali sono i tuoi interessi? Cosa ti piace fare? Quali sono i tuoi progetti per stasera?", "Per essere sincera avrei un appuntamento, un corso di pittura, non posso mancare, stasera ho proprio voglia di usare un pennello, con un pennello in mano mi posso realizzare!" "Senti bella, potevi anche dirlo che avevi solo voglia di prendere il pennello, il corso di pittura puoi anche lasciarlo a casa io ho un pennello, é lungo, largo, forte e bello, lo uso proprio come fossi un vero artista, e con il mio pennello sono un gran professionista!". Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Su toccami, toccami qui ! ! Tocca qui ! ! Su toccami, toccami qui ! ! Tocca qui ! ! Su toccami, toccami qui ! ! Tocca qui ! ! Su toccami, toccami qui ! ! Tocca qui ! Cosi la porto a casa mia lei si siede sul divano e io mi metto in libertà, apre la borsetta, si accende una sigaretta, mi guarda intensamente con la faccia sospetta e dice: "...Guarda, non so cosa tu voglia fare, sono una tipa intellettuale e certe cose non le faccio, un uomo per potermi conquistare deve avere un grande ca-carisma, cerco un maschio con una grande personalità, che sappia sco-vare le mie particolarità, deve essere istruito, intelligente, acuto, a un uomo così darei persino il cu-cuore!...". "Veramente" -le dico- "cio che di te meno mi interessa é il tuo cu-cu-cuore, non é per offendere il tuo cervello ma siamo venuti qui perchè volevi il mio pennello!". Lei mi dice: "...Giusto! Prepara il colore: ho voglia di scoprire qualche nuova posizione ortogonale, mica male però il tuo pennello! Posso toccare?...", "Tocca, tocca pure ma fai piano é delicato, non esagerare é appena appena bagnato...". Ma lei non mi sentiva più e pensava solo a quello, e non ha lasciato tutta la notte il mio pennello! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Dai tocca qui!! Su toccami, toccami qui ! ! Tocca qui ! ! Su toccami, toccami qui ! ! Tocca qui ! ! Su toccami, toccami qui ! ! Tocca qui ! ! Su toccami, toccami qui ! ! Tocca qui !

paisy

venerdì, agosto 31, 2007

quanto odio la statistica

Nessun commento:

chi commenta

Etichette

volanovolley

la gattona nera

cameron

il paisy

Archivio blog

Links

Informazioni personali

tocca qui!!!!