Portal educativo IGE

ver o mapa do portal

Matemáticas. Series de tempo
Definicións e conceptos teóricos


Introdución ás series de tempo

Unha serie de tempo é unha sucesión de observacións dun fenómeno ordenadas no tempo.

Exemplo: o número de inmigrantes que chegaron a Galicia procedentes do estranxeiro nos últimos quince anos.

En realidade, unha serie de tempo é un caso particular dunha variable bidimensional, na que a variable independente é o tempo (t) e a dependente a variable que estamos estudando (X). As observacións da serie temporal representarémolas por x1, x2, ..., xn

A forma máis habitual de presentar unha serie de tempo é nunha táboa con dúas columnas. Na primeira columna ponse o tempo (t) e na segunda a observación da variable nese instante de tempo (xt).

A repersentación gráfica das series temporais faise do mesmo xeito que na regresión, no eixe de abscisas representase o tempo (t) e no de ordenadas os valores da variable (xt). Unindo os puntos resultantes obtemos unha visión de como evolucionou a variable que estamos estudando ao largo do tempo.

A análise de series temporais ten dous obxectivos fundamentais. Por unha banda, permítenos analizar a evolución dun fenómeno no tempo, e por outra, podemos facer prediccións dos valores futuros da variable. Así, por exemplo, se se pretende predicir o número de inmigrantes procedentes do estranxeiro que chegarán a Galicia nos próximos anos, unha posibilidade é recompilar o número de inmigrantes que chegaron nos últimos anos a Galicia e construír un modelo descritivo que permita extrapolar o comportamento pasado desta variable cara o futuro.

O estudo das series temporais pode abordarse desde dúas perspectivas distintas:

  • A determinística: supón que se poden analizar as series temporais sen ter en conta ningunha compoñente aleatoria. Como veremos a continuación, este análisis supón de os valores que toma a variable ob xecto de estudo ven dado pola combinación de catro compoñentes: tendencia, variacións cíclicas, variacións estacionais e variacións residuais.
  • A aleatoria: supón que a serie temporal é unha observación dun proceso estocástico. Un proceso estocástico é unha colección de variables aleatorias. Entón, a concepción aleatoria dunha serie temporal consiste en considerala como a observación dunha sucesión de variables aleatorias.
Nesta páxina introducirase únicamente o estudo determinístco das series temporais.

Compoñentes dunha serie de tempo

A teoría clásica das series de tempo basease en que toda serie xt está formada polas seguintes compoñentes:
  • Tendencia (ut): é o movemento da serie a longo prazo. Trata de describir o comportamento ou evolución xeral da serie en función do tempo.
  • Variacións cíclicas (ct): son oscilacións que se producen con un período superior ao ano. Normalmente son debidas á alternancia de etapas de prosperidade e depresión económica. Na práctica esta compoñente é moi difícil de determinar xa que resulta moi difícil diferenciar entre a tendencia e o ciclo dunha serie. Por este motivo, en moitos casos estas dúas compoñentes trátanse de maneira conxunta e fálase de compoñente extraestacional.
  • Variacións estacionais (st): son oscilacións que se producen cun período de tempo igual ou inferior ao ano (estacionalidade anual, trimestral, mensual,...). Estas variacións teñen que ser recoñecibles ao longo dos anos. Un exemplo de variacións estacionais son as debidas a causas climatolóxicas.
  • Variacións residuais (rt): tamén se coñecen por residuos, variacións irregulares ou erros. Son movementos que non mostran un carácter periódico recoñecible e que recollen unha morea de causas de variación de pouca importancia individual. Poden considerarse como variables independentes coa mesma distribución. Nunha serie de tempo esta compoñente é practicamente impredicible.

Maneiras de combinar as compoñentes dunha serie de tempo

Dentro dos modelos existentes á hora de combinar as catro compoñentes dunha serie temporal, os máis destacables son:

  • Modelo aditivo: xt=ut+ct+st+rt
  • Modelo multiplicativo: xt=ut·ct·st·rt
    O modelo multiplicativo pódese transformar nun modelo adtitivo sen máis que tomar logaritmos log(xt) = log(ut·ct·st·rt) = log(ut)+log(ct)+log(st)+ log (rt)
  • Modelo multiplicativo mixto: xt=ut·ct·st+rt

Exemplo : no seguinte gráfico móstrase o número de pasaxeiros que utilizaron os aeroportos galegos nos meses dos últimos vinte anos.

Esta serie presenta unha tendencia lixeiramente crecente en todo o período 1999-2019, cuns valores máis altos para os meses de xullo e agosto e uns mínimos para os meses de xaneiro e febreiro.

Análise da tendencia

O obxectivo da análise de series temporais é separar os seus movementos sistemáticos dos residuos. Neste apartado estudarase como illar a tendencia que, como xa se dixo, é a compoñente que marca as pautas evolutivas da variable. Hai que ter en conta que cando se describiron as compoñentes dunha serie definiuse a tendencia como o movemento da serie a longo prazo, pero o concepto de "longo prazo" depende da lonxitude da serie. De feito, pode ocorrer que as observacións das que se dispoña formen parte dun ciclo dunha serie máis longa.
Entre os métodos máis empregados para a determinación da tendencia atópanse: o método de axuste analítico e o método das medias móbiles.

Análise da tendencia. Método do axuste analítico

Este método trata de axustar unha función que relacione a variable estudada (neste caso a tendencia) en función do tempo (ut=f(t)). Esta función debe recoller a evolución xeral da serie.

Entre os modelos máis utilizados atópanse o axuste linear (f(t)=a0+b0·t) e o axuste parabólico (f(t)=a0+b0·t+c0·t2), onde os parámetros determinaranse polo método dos mínimos cadrados.

Determinación dos parámetros para o axuste linear da tendencia

Para axustar a tendencia (ut) a unha recta (a+b·t) polo método dos mínimos cadrados, hai que calcular os parámetros a0 e b0 de tal xeito que a suma dos cadrados das diferenzas entre os valores observados (ut) e os valores estimados (a0+b0·t) sexa mínima. É dicir, hai que atopar uns valores para a e b que minimicen f(a,b) = St (ut - (a+b·t))2. Para isto, calcúlanse as derivadas parciais de f(a,b) con respecto a a e a b e iguálanse a cero. Deste xeito obtéñense os seguintes coeficientes:

Se queres ver todos os pasos de como obter os coeficientes do axuste lineal podes pinchar na seguinte ligazón

Exemplo : neste exemplo calcularase o axuste lineal da tendencia da serie do número de inmigrantes que recibiu Galicia procedentes do estranxeiro no período 2007-2019.

INE. Estatística de variacións residenciais. Elaboración IGE a partir dos ficheiros proporcionados polo INE

Os cálculos para obter os coeficientes do axuste lineal veñen dados na seguinte táboa:

Ano t t2 Inmigrantes (ut) t*ut
2007 1 1 26.386 26.386
2008 2 4 22.165 44.330
2009 3 9 15.135 45.405
2010 4 16 13.878 55.512
2011 5 25 13.847 69.235
2012 6 36 10.322 61.932
2013 7 49 9.268 64.876
2014 8 64 10.377 83.016
2015 9 81 12.094 108.846
2016 10 100 15.736 157.360
2017 11 121 19.078 209.858
2018 12 144 24.183 290.196
2019 13 169 26.932 350.116
n=13 (anos) St=91 St2=819 Sut=219.401 St*ut=1.567.068

Polo tanto:

O axuste linear da tendencia ven dado por: f(t) = 15.674,7 + 171,8t

Determinación dos parámetros para o axuste parabólico da tendencia

A fórmula do axuste lineal da tendencia polo método dos mínimos cadrados pode xeneralizarse para os modelos polinómicos de calquera grado. En particular para os polinomios de segundo grado os coeficientes veñen dados por:

Se queres ver todos os pasos de como obter os coeficientes do axuste parabólico podes pinchar na seguinte ligazón

Exemplo : No exemplo do número de inmigrantes que chegaron a Galicia procedentes do estranxeiro o axuste parabólico da serie calcúlase do seguinte xeito:

Ano t t2 t3 t4 Inmigrantes (ut) t*ut t2*ut
2007 1 1 1 1 26.386 26.386 26.386
2008 2 4 8 16 22.165 44.330 88.660
2009 3 9 27 81 15.135 45.405 136.215
2010 4 16 64 256 13.878 55.512 222.048
2011 5 25 125 625 13.847 69.235 346.175
2012 6 36 216 1.296 10.322 61.932 371.592
2013 7 49 343 2.401 9.268 64.876 454.132
2014 8 64 512 4.096 10.377 83.016 664.128
2015 9 81 729 6.561 12.094 108.846 979.614
2016 10 100 1.000 10.000 15.736 157.360 1.573.600
2017 11 121 1.331 14.641 19.078 209.858 2.308.438
2018 12 144 1.728 20.736 24.183 290.196 3.482.352
2019 13 169 2.197 28.561 26.932 350.116 4.551.508
n=13 (anos) St=91 St2=819 St3=8.281 St4=89.271 Sut=219.401 St*ut=1.567.068 St2*ut=15.204.848

Entón o axuste parabólico da tendencia da serie é: f(t) = 32.194,4 - 6436,1t + 472 t2

Nas seguintes gráficas pódese observar como ao aumentar o grado do polinomio o axuste parece aproximarse mellor aos datos da serie.

Análise da tendencia. Método das medias móbiles

O método das medias móbiles consiste en promediar cada valor da serie temporal cos valores contiguos mediante unha media aritmética. O número de datos a promediar determínase en función do período (p) de oscilacións máis importante que mostra a serie. A serie dos datos así obtida proporciona a tendencia da serie e ten unha distribución con menor dispersión ca serie orixinal.

¿Cómo se calculan as médias móbiles de orden p?
  • Se p é impar. Para cada instante temporal t promédianse os p valores que se sitúan o redor de ut, é dicir, promédianse os datos:

  • .
  • Se p é par. Neste caso, o primeiro paso é calcular as medias móbiles de orden p-1 e p+1 e logo calcular a súa correspondente media aritmética.

Exemplo: cálculo das medias móbiles de orden 4 para a produción de vehículos automóbiles na comunidade galega.

2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
I Trimestre 116.061 102.259 85.750 105.949 110.238 110.069 116.617 112.393 109.397 101.371
II Trimestre 95.813 103.022 63.030 119.118 99.463 118.856 124.374 123.955 127.267 99.443
III Trimestre 89.690 65.231 72.637 94.455 85.053 89.765 94.885 97.829 71.178 87.952
IV Trimestre 95.648 85.283 75.971 87.642 84.360 88.403 88.097 102.853 90.235 117.912

Esta serie ten estacionalidade trimestral, polo que se considera p=4. Como p é par, primeiro calcúlanse as medias móbiles de orden p-1=3 e p+1=5.

Por exemplo, para o segundo trimestre de 2010 a media móbil de orden 3 calcúlase como a media aritmética do primeiro, segundo e terceiro trimestre de 2010, é dicir como (116.061 + 95.813 + 89.690)/3 = 100.521. Analogamente para o terceiro trimestre de 2010 a media móbil de orden tres viría dada por (95.813 + 89.690 + 95.648)/3 = 93.717. Operando de maneira similar para todo o período considerado, obtéñense as seguintes medias móbiles de orden 3:

Medias móbiles de orden 3

2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
I Trimestre - 100.310 78.021 100.346 99.114 104.428 109.798 108.148 113.172 97.016
II Trimestre 100.521 90.171 73.806 106.507 98.251 106.230 111.959 111.392 102.614 96.255
III Trimestre 93.717 84.512 70.546 100.405 89.625 99.008 102.452 108.212 96.227 101.769
IV Trimestre 95.866 78.755 84.852 97.445 93.161 98.262 98.458 103.360 87.595 -

De xeito análogo a como se calcularon as medias móbiles de orden 3 calcúlanse as de orden 5. Por exemplo, para o terceiro trimestre de 2010 esta calcularíase como: (116.061 + 95.813 + 89.690 + 95.648 + 102.259)/5 = 99.894

Medias móbiles de orden 5

2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
I Trimestre - 91.170 74.386 93.626 95.370 97.621 102.809 103.432 101.705 90.036
II Trimestre - 90.289 76.534 96.627 93.351 98.291 102.475 105.025 100.186 99.383
III Trimestre 99.894 88.309 80.667 103.480 97.837 104.742 107.273 109.285 99.890 -
IV Trimestre 97.286 80.463 87.341 102.183 99.560 107.603 108.741 112.260 97.899 -

Finalmente, para calcular as medias móbiles de orden 4 promédianse, para cada trimestre, as correspondentes medias móbiles de orden 3 e de orden 5. Por exemplo, para o terceiro trimestre de 2010 a media móbil de orden 4 é: (93.717 + 99.894)/2 = 96.806.

Medias móbiles de orden 4

2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
I Trimestre - 95.740 76.204 96.986 97.242 101.024 106.303 105.790 107.439 93.526
II Trimestre - 90.230 75.170 101.567 95.801 102.260 107.217 108.209 101.400 97.819
III Trimestre 96.806 86.411 75.607 101.943 93.731 101.875 104.863 107.749 98.058 -
IV Trimestre 96.576 79.609 86.097 99.814 96.360 102.932 103.600 107.810 92.747 -

Na representación gráfica da serie resultante pódese observar como a serie das medias móbiles é máis suave que a serie orixinal.

Análise da compoñente estacional

As variacións estacionais son oscilacións que normalmente se producen cun período igual ou inferior ao ano e que son recoñecibles nos diferentes anos. Para estudar o movemento real ou tendencia dunha serie, é necesario eliminar previamente as flutuacións, ou variacións estacionais, presentes na serie e que encobren a evolución real do fenómeno.

Por simplicidade suporemos que a serie de datos é mensual. Denotarase por xij o dato da serie correspondente ao mes j (j=1,2,..., 12) do ano i (i=1,2, ..., n)

Análise da compoñente estacional. Método das relacións de medias mensuais respecto á tendencia

Os pasos a seguir son os seguintes:

  1. Calcular as medias anuais dos datos observados:

  2. Axustar as medias anuais dos datos (x ) a unha recta a+bi polo método dos mínimos cadrados. A pendente desta recta (b) representa o incremento dos valores medios anuais no transcurso dun ano. Polo tanto, supoñendo que o incremento anual se produce uniformemente ao longo de cada ano, b/12 é o incremento debido ao transcurso dun mes.

  3. Calcular as medias mensuais dos datos:

  4. Corrixir as medias mensuais restando a cada unha delas a proporción do incremento anual:

    Como en xaneiro aínda non transcorreu ningún mes, a media mensual corrixida coincide coa media mensual. Porén, en Febreiro hai que descontarlle á media mensual a parte do efecto total do transcurso dun ano correspondente ao mes de xaneiro. É dicir, hai que restarlle á media orixinal a doceava parte do incremento anual (b/12). En marzo habería que restarlle dúas doceavas partes do incremento anual (2b/12) e así sucesivamente.

  5. Calcular a media global corrixida (x'·· ) como a media aritmética das medias mensuais corrixidas.

  6. Obter a compoñente estacional. Neste caso hai que distinguir entre se o modelo aditivo ou multiplicativo
    • Modelo aditivo: neste caso a compoñente estacional calcúlase como sij = x'·j - x'··
    • Modelo multiplicativo: o índice de variación estacional obtense como o cociente entre a media mensual corrixida e a media global corrixida, é dicir:

Exemplo: na seguinte táboa móstranse os matrimonios que tiñan pensado fixar a súa residencia en Galicia nos últimos 8 anos con datos definitivos.

2011 2012 2013 2014 2015 2016 2017 2018
Xaneiro 288 241 279 294 289 334 286 314
Febreiro 314 306 317 375 331 349 327 313
Marzo 436 525 448 406 375 430 464 337
Abril 590 563 473 467 490 621 625 371
Maio 843 832 840 870 958 745 777 647
Xuño 952 1.209 1.008 937 1.040 1.044 1.042 1.040
Xullo 1.557 1.211 1.111 1.133 1.268 1.463 1.316 1.069
Agosto 1.372 1.371 1.404 1.552 1.475 1.273 1.198 1.230
Setembro 1.335 1.471 1.237 1.222 1.302 1.343 1.463 1.307
Outubro 755 808 676 705 840 845 823 898
Novembro 406 472 374 411 417 434 455 581
Decembro 408 496 406 433 457 498 511 530
Medias anuais 771 792 714 734 770 782 774 720

A continuación obterase a compoñente estacional polo método das relacións medias mensuais con respecto á tendencia.

Unha vez calculadas as medias anuais dos datos, o seguinte paso é axustalas a unha recta polo método dos mínimos cadrados.

i i2 Medias anuais
(x)
i*x
2011 1 1 771 771
2012 2 4 792 1.584
2013 3 9 714 2.143
2014 4 16 734 2.935
2015 5 25 770 3.851
2016 6 36 782 4.690
2017 7 49 774 5.417
2018 8 64 720 5.758
n=8 (anos) Si=36 Si2=204 Sx=6.057 Six=27.150

Entón a recta de axuste é: 769 -3i

A continuación calcúlanse as medias mensuais dos datos e as correspondentes medias mensuais corrixidas:

Mes j media mensual
(x·j )
media mensual
corrixida (x'·j )
Compoñente estacional 
(modelo aditivo)
Xaneiro 1 291 291 -468
Febreiro 2 329 329 -429
Marzo 3 428 428 -330
Abril 4 525 526 -233
Maio 5 814 815 57
Xuño 6 1.034 1.035 277
Xullo 7 1.266 1.267 509
Agosto 8 1.359 1.361 603
Setembro 9 1.335 1.337 578
Outubro 10 794 796 37
Novembro 11 444 446 -312
Decembro 12 467 470 -289
x'··= 758

Por exemplo, a media mensual para novembro calcúlase como: x·2 = 1/8(406 + 472 + 374 + 411 + 417 + 434 + 455 +581) = 444 e a media mensual corrixida como x'·2 = x·2 - (10/12)*b = 328 - (10/12)*(-3) = 446

Unha vez calculadas as medias mensuais corrixidas, a media global corrixida obtense como promedio das anteriores, é dicir: x'·· = 1/12 (291 + 329 + 428 + 526 + 815 + 1.035 + 1.267 + 1.361 + 1.337 + 796 + 446 + 470) = 758

Finalmente para cada mes, e supoñendo que o modelo é aditivo, calcúlase a compoñente estacional como a diferenza entre a correspondente media mensual corrixida e a media global corrixida. Por exemplo, para o mes de novembro a compoñente estacional ven dada por: si2= x·2 - x'·· = 446 - 758 = -312

A compoñente estacional que se mostra na gráfica anterior ten un marcado balance positivo nos meses de verán, sobre todo en agosto. Porén, os meses de inverno presentan unha compoñente estacional negativa moi forte, é dicir, son os meses nos que se celebra un menor número de matrimonios.

Análise da compoñente estacional. Método das medias móbiles

O método das medias móbiles para a análise da compoñente estacional consiste en:

  1. Obter a compoñente extraestacional da serie (Eij) facendo un axuste da serie orixinal empregando medias móbiles con p=12, sempre e cando a serie dos datos sexa mensual. ¿Cómo calcular as medias móbiles de orden p?
  2. Calcular a compoñente estacional estimada s·j:
    • Se o modelo é aditivo: s·j = x·j - E·j
    • Se o modelo é multiplicativo:

Exemplo: neste exemplo calcularase a compoñente estacional da serie de matrimonios mediante o método das medias móbiles.

Como p=12 é un número par, primeiro hai que calcular as medias móbiles de orden p-1=11 e p+1=13.

Medias móbiles de orden 11

2011 2012 2013 2014 2015 2016 2017 2018
Xaneiro - 723 726 677 710 729 719 679
Febreiro - 708 702 652 684 727 723 668
Marzo - 712 696 681 707 725 710 646
Abril - 777 735 731 761 771 766 690
Maio - 813 754 761 800 809 802 731
Xuño 804 819 742 761 799 807 798 737
Xullo 815 842 754 774 814 822 818 757
Agosto 809 840 752 766 814 822 817 -
Setembro 797 821 745 759 812 807 803 -
Outubro 791 810 739 751 806 793 777 -
Novembro 765 778 705 716 776 782 740 -
Decembro 755 744 693 718 749 758 704 -

Medias móbiles de orden 13

2011 2012 2013 2014 2015 2016 2017 2018
Xaneiro - 825 793 745 785 827 823 758
Febreiro - 810 808 779 811 827 802 752
Marzo - 818 797 765 792 817 817 760
Abril - 777 736 724 763 782 777 717
Maio - 756 703 704 741 750 747 698
Xuño - 763 698 709 744 757 753 704
Xullo 731 753 682 700 737 743 739 -
Agosto 732 758 689 702 741 743 741 -
Setembro 748 769 696 702 749 752 741 -
Outubro 758 765 698 709 768 767 734 -
Novembro 777 787 728 747 787 779 736 -
Decembro 805 800 736 760 794 802 756 -

Medias móbiles de orden 12

2011 2012 2013 2014 2015 2016 2017 2018
Xaneiro - 774 759 711 747 778 771 719
Febreiro - 759 755 716 748 777 763 710
Marzo - 765 747 723 750 771 763 703
Abril - 777 736 727 762 776 772 703
Maio - 784 728 732 770 780 774 714
Xuño - 791 720 735 771 782 775 720
Xullo 773 797 718 737 775 783 778 -
Agosto 770 799 721 734 778 780 779 -
Setembro 972 795 721 731 780 779 772 -
Outubro 774 788 718 730 787 780 756 -
Novembro 771 782 717 731 782 780 738 -
Decembro 780 772 714 739 771 780 730 -

Unha vez calculadas as medias móbiles de orden p=12 e supoñendo que o modelo é aditivo, calcúlanse a estimación da compoñente estacional como: s·j = x·j - E·j

Por exemplo, para o mes de xaneiro x·1 = 1/8(288 + 241 + 279 + 294 + 289 + 334 + 286 + 314) = 291 e E·1 = 1/7(774 + 759 + 711 + 747 + 778 + 771 + 719) = 751, polo que s·1 = 291 - 751 = -461

Media mensual
x·j
E·j s·j
Xaneiro 291 751 -461
Febreiro 329 747 -418
Marzo 428 746 -318
Abril 525 750 -225
Maio 814 755 59
Xuño 1.034 756 278
Xullo 1.266 766 500
Agosto 1.359 766 594
Setembro 1.335 764 571
Outubro 794 762 32
Novembro 444 757 -314
Decembro 467 755 -288