Portal educativo IGE

ver o mapa do portal

Matemáticas. Regresión
Actividade 3: Información climatolóxica


FICHA DA ACTIVIDADE

Obxectivos

  • Coñecer e representar variables aleatorias bidimensionais
  • Construír táboas de dobre entrada e táboas simples
  • Cálculo de distribucións marxinais a partir da distribución conxunta dunha variable aleatoria bidimensional
  • Estudo da dependencia de variables aleatorias a partir da distribución conxunta

Coñecementos previos necesarios

  • Coñecementos básicos de estatística
  • Saber confeccionar e interpretar táboas e gráficos

Cuestións a resolver:

Mediante cálculos sinxelos que se desenvolven nesta actividade, poderás responder ás seguintes preguntas:

  1. ¿Como se chama a distribución conxunta das variables temperatura e humidade? .......................... ¿Por que?....................
  2. ¿Como se representa graficamente unha variable aleatoria bidimensional? ...................................
  3. Constrúe unha táboa de dobre entrada asociada ás variables temperatura e humidade ......................... ¿é a única táboa que se pode empregar cando se traballa con variables aletorias bidimensionais?................
  4. Calcula as distribucións marxinais das variables humidade estándar e temperatura media ................
  5. Calcula a covarianza e o coeficiente de correlación de Pearson e decide se hai dependencia e de que tipo ........................... ...................................

Descarga de datos

Descarga da ficha en pdf

Distribución conxunta das variables temperatura media e humidade estándar


Nesta actividade imos estudar a distribución conxunta das variables climatolóxicas temperatura media e humidade estándar.

Na Táboa 1 móstranse os datos de temperatura media e humidade estándar para todas as estacións meteorolóxicas de Galicia no ano 2020.

Táboa 1: Temperatura media e humidade estándar no ano 2020 nas estacións meteorolóxicas galegas

Nesta distribución a cada estación meteorolóxica correspóndenlle dous valores, un valor da temperatura media e outro da humidade estándar. Este tipo de distribucións chámanse distribucións bidimensionais.

A forma de representar unha variable bidimensional é a través da "nube de puntos", que se constrúe considerando os eixos cartesianos e colocando sobre o eixo X unha das variables (neste caso a humidade estándar) e no eixo Y a outra (neste caso a temperatura media):

¿Que táboas se poden facer para representar unha variable bidimensional?

O primeiro que imos facer para agrupar os valores é recodificar a variable temperatura nos seguintes intervalos ou clases: entre 13 e 13,9ºC, entre 14 e 14,9ºC e entre 15 e 15,9ºC. Isto farase cando teñamos variables que poden tomar moitos valores diferentes para agrupalos e traballar con menos valores.

Temperatura media (ºC) Humidade estándar (%)
CIS Ferrol (Ferrol) entre 15 e 15,9ºC 79
Mabegondo (Abegondo) entre 14 e 14,9ºC 87
Santiago- EOAS (Santiago de Compostela) entre 14 e 14,9ºC 82
Campus Lugo (Lugo) entre 13 e 13,9ºC 83
Ourense-Ciencias (Ourense) entre 15 e 15,9ºC 72
Illas Cíes - (Vigo) entre 15 e 15,9ºC 86
Lourizán - (Pontevedra) entre 15 e 15,9ºC 85

Coa variable Y recodificada imos construír unha táboa de dobre entrada na que a primeira fila está formada polos intervalos ou clases nos que toma valores a variable X (temperatura) e a primeira columna por todos os valores da variable Y, e nos recadros interiores as frecuencias absolutas do par (X,Y):

Y\X 72 79 82 83 85 86 87
entre 13 e 13,9ºC - - - 1 - - -
entre 14 e 14,9ºC - - 1 - - - 1
entre 15 e 15,9ºC 1 1 - - 1 1 -

A outra forma que temos de construír unha táboa para unha variable bidimensional é empregar unha táboa simple. Para construila colócanse na primeira columna os intervalos ou clases nos que toma valores a variable X, na segunda columna os valores que toma a variable Y e na terceira a frecuencia absoluta do par (X,Y):

Xi Yj fij
72 entre 15 e 15,9ºC 1
79 entre 15 e 15,9ºC 1
82 Entre 14 e 14,9ºC 1
83 entre 13 e 13,9ºC 1
85 entre 15 e 15,9ºC 1
86 entre 15 e 15,9ºC 1
87 entre 14 e 14,9ºC 1

¿Como se calcula a distribución marxinal das variables temperatura e humidade?


Se o que nos interesa é estudar por un lado a variable humidade (X) e por outro a temperatura (Y) de manera independente, temos que calcular as distribucións marxinais, que non son máis que as distribucións das variables unidimensionais temperatura e humidade.

Temos a variable bidimensional (X,Y)=(humidade, temperatura), e imos calcular as distribucións marxinais das variables humidade estándar e temperatura media a partir da táboa de dobre entrada.

O primeiro que faremos será sumar cada fila e poñer o resultado na última columna, e sumar cada columna e poñer o resultado na última fila:

Y\X 72 79 82 83 85 86 87
entre 13 e 13,9ºC - - - 1 - - - 1
entre 14 e 14,9ºC - - 1 - - - 1 2
entre 15 e 15,9ºC 1 1 - - 1 1 - 4
1 1 1 1 1 1 1

Para calcular a distribución marxinal de cada variable só temos que construír unha táboa simple con dúas columnas; na primeira colocamos os valores que toma a variable e na segunda as súas frecuencias absolutas, que coinciden coa suma das columnas que acabamos de calcular no caso da variable X, humidade, e coa suma das filas para a variable Y, temperatura media:

Xi fi
72 1
79 1
82 1
83 1
85 1
86 1
87 1
Yj fj
entre 13 e 13,9ºC 1
entre 14 e 14,9ºC 2
entre 15 e 15,9ºC 4

A partir das distribucións marxinais podemos calcular a media da variable X e a media da variable Y, e tamén as varianzas e desviacións típicas.

Neste caso, como a variable Y, temperatura media, está definida en intervalos, empregaremos as marcas de clase (a metade do intervalo) para calcular a media e a desviación típica:


¿Existe dependencia entre a temperatura e a humidade?


¿Podemos saber se existe dependencia entre a temperatura e a humidade a partir da distribución bidimensional? Claro que si!!!.

O primeiro que faremos será calcular a covarianza mediante a seguinte expresión:

Como o valor da covarianza entre as dúas variables é menor que 0 podemos dicir que existe certa dependencia lineal e que esta dependencia é negativa.

Calculamos a valor do coeficiente de correlación lineal de Pearson para facernos unha idea do grao de dependencia entre as variables humidade estándar e temperatura relativa:

Como -1 < r < 0 a correlación entre as dúas varibles é negativa pero non poderíamos dicir que é forte posto que está bastante alonxado de -1