Emprégase para distribucións de variables estatísticas continuas ou para distribucións de variables discretas, pero que teñen os datos agrupados en clases. É similar ao diagrama de barras, pero neste caso cada barra terá a anchura do intervalo e a superficie da barra debe ser a frecuencia. A altura correspondente denomínase densidade de frecuencia.
Para construír o histograma represéntanse no eixo de abscisas os extremos das clases. Constrúense uns rectángulos de base a amplitude do intervalo e de altura, a frecuencia absoluta se os intervalos teñen a mesma amplitude. No caso contrario, as alturas dos rectángulos calcúlanse de modo que a súas áreas sexan proporcionais ás frecuencias de cada intervalo.
Os rectángulos do histograma aparecen pegados uns a outros para representar a continuidade da variable e a suma das áreas de todos eles será igual ao total da frecuencia representada.
DATOS AGRUPADOS
Exemplo
No seguinte histograma preséntanse os fogares segundo o intervalo de ingresos mensuais para o ano 2009:
Carácter estatístico: ingresos.
Variable estatística continua.
Datos
Frecuencia absoluta
xi
Ni
Ata 400,00 euros
20.836
400,01-600,00 €
45.216
600,01-1.000,00 €
164.893
1.000,01-1.500,00 €
207.888
1.500,01-2.000,00 €
170.378
2.000,01-2.500,00 €
150.317
2.500,01-3.000,00 €
96.461
3.000,01-4.000,00 €
104.444
Máis de 4.000,00 €
76.498
Se se quere empregar Excel para representar o histograma é necesario ter os intervalos da mesma amplitude. Imos, polo tanto, converter os intervalos en intervalos de amplitude 1.000 euros, supoñendo que o máximo son 5.000 euros mensuais:
Datos
Frecuencia absoluta
xi
Ni
(0,1.000]
230.945
(1.000,2.000]
378.266
(2.000,3.000]
246.778
(3.000,4.000]
104.444
(4.000,5.000]
76.498
Fogares segundo o intervalo de ingresos mensuais Galicia. Ano 2009
Abrimos un libro de Excel onde teñamos os datos que queremos representar no diagrama de barras, por exemplo o libro ExemploGraficos5.xls que contén o número de fogares segundo o intervalo de ingresos mensuais.
Fixádevos que neste libro xa temos unha táboa cos datos agrupados de tal xeito que os intervalos de ingresos teñen todos a mesma lonxitude.
Situámonos na folla "Ingresos" e seleccionamos o rango de datos que queremos representar na gráfica de barras. Neste caso como o que nos interesa é mostrar o número de fogares segundo o intervalo de ingresos mensuais seleccionaríamos o rango de celas A17:B22 (collemos a táboa que ten os intervalos da mesma lonxitude). ¡Ademais dos datos que queremos representar tamén seleccionamos o nome das categorías, neste caso o intervalo de ingresos fogar!.
Para que a aparencia sexa dun histograma debemos xuntar as barras. Para iso, prememos riba da gráfica e pinchamos no botón dereito do rato. No menú emerxente escollemos a opción "Formato de serie de datos...".
Para rematar prememos o botón "Finalizar" e obteriamos o histograma co número de fogares galegos segundo o intervalo de ingresos mensuais para o ano 2009.
(Se queres ver o vídeo a pantalla completa pincha neste enlace)
Abrimos unha folla de cálculo de OpenOffice ou de LibreOffice onde teñamos os datos que queremos representar no polígono de frecuencias. Imos utilizar a táboa de datos da explicación anterior, con información para o ano 2011. Abrimos o arquivo ExemploGraficos5.ods, que contén o número de fogares segundo o intervalo de ingresos mensuais para o dito ano.
Neste libro xa temos unha táboa cos datos agrupados, de tal xeito que todos os intervalos de ingresos teñan a mesma lonxitude (1.000 euros).
Situámonos na folla "Datos" e seleccionamos o rango que queremos representar, con inclusión da columna coas etiquetas da categoría intervalo de ingresos do fogar. Seleccionamos tamén a cela co nome do espazo que imos representar (Galicia).
A continuación, na barra de menús seleccionamos "Inserir", submenú "Gráfico".
No asistente para gráficos, en tipo de gráfico, deixamos o que amosa por defecto: “Columna normal”. Prememos o botón "Seguinte >>".
Comprobamos que o rango de datos é o que efectivamente queremos que se amose. Os recadros “Primeira fila como etiqueta” e “Primeira columna como etiqueta” deben estar seleccionadas.
Na seguinte pestana do asistente ofrécesenos a posibilidade de engadir novas series na representación, ou eliminar algunha das existentes. É útil cando se queren representar series de datos procedentes de dúas táboas distintas. Prememos no botón "Seguinte >>".
Nesta pestana podemos engadir un título e un subtítulo ao gráfico, o nome ou unidade dos eixos x e y, e cambiar a posición da lenda (ou mesmo eliminala, se non desexamos que se amose no gráfico).
Se en calquera momento da configuración das características do gráfico nos equivocamos, o asistente para gráficos permítenos retroceder premendo o botón "<< Regresar".
Para rematar, pinchamos no botón "Finalizar" e obtemos un diagrama de barras co número de fogares de Galicia clasificados segundo o intervalo de ingresos.
Para que a aparencia sexa a dun histograma, debemos xuntar as barras. Para iso, prememos riba das barras e pinchamos no botón dereito do rato. No menú emerxente escollemos a opción “Formato de serie de datos...”.
Na ventá de formato de serie de datos situámonos na pestana “Opcións”.
No apartado de configuración, o recadro “Espazo” indica a separación entre as barras. Por defecto, o espazo é 100.
Como non queremos que exista ningún espazo entre as barras, no recadro “Espazo” cambiamos 100 por 0.
Para rematar prememos o botón “Aceptar”; obtemos o histograma co número de fogares galegos segundo o intervalo de ingresos mensuais para o ano 2011.
Máis exemplos
A partir dos datos dispoñibles no libro de Excel ExemploGraficos5.xls elabora histograma cos fogares segundo o intervalo de ingresos mensuais para cada unha das provincias galegas.
DATOS NON AGRUPADOS
Exemplo
Na seguinte ligazón podes consultar a renda dispoñible bruta per cápita para os concellos galegos no ano 2008.
A partir destes datos podemos elaborar o correspondente histograma pero hai que ter en conta que non temos os datos agrupados.
O primeiro paso para elaborar o histograma é agrupar os datos en intervalos, de xeito similar ao seguinte:
Datos
Frecuencia absoluta
xi
Ni
(0,8.626]
9
(8.626,9.821]
23
(9.821,11.016]
43
(11.016,12.211]
62
(12.211,13.407]
77
(13.407,14.602]
56
(14.602,15.797]
24
(15.797,16.992]
15
(16.992,18.187]
3
(18.187,19.382]
3
Unha vez que temos os datos agrupados elaboramos o histograma
Concellos segundo a renda dispoñible bruta por habitante Ano 2008 (datos provisionais)
¿Como elaborar un histograma con datos non agrupados?
Neste exemplo vamos a construír un histograma coa renda dispoñible bruta por habitante dos concellos galegos. No libro de excel ExemploGraficos6.xls están dispoñibles os datos necesarios para elaborar este histograma.
En primeiro lugar vamos a comprobar se dispoñemos en Excel da ferramenta "Análise de datos".
Na barra de menús pinchamos en "Ferramentas" e comprobamos se contamos co comando "Análise de datos".
A continuación temos que calcular os parámetros necesarios para poder elaborar o histograma. Comezaríamos atopando o máximo do rango de datos, é dicir, a renda dispoñible bruta por habitante máis alta dos 315 municipios. Para iso podemos usar a función MAX. Recordade que para escribir unha función en Excel sempre debemos comezar poñendo o símbolo =. É dicir, neste caso tecleariamos a seguinte sentencia: =MAX(C4:C318) (C4:C318 é o rango de datos onde aparecen os valores da renda por municipios).
Á hora de elaborar o histograma temos que ter claro o número de intervalos que nos interesa. Neste caso faremos un histograma con 10 intervalos.
Calculamos a amplitude dos intervalos amplitude=(máximo-mínimo)/número de intervalos =(F4-F5)/F6, onde F4 é a cela que contén o máximo, F5 o mínimo e F6 o número de intervalos.
O seguinte paso é obter os extremos superiores dos intervalos do histograma.
O primeiro extremo calculámolo sumándolle ao mínimo a amplitude dos intervalos: =F5+F7 (F5: cela onde figura o mínimo e F7 cela onde figura a amplitude).
O seguinte extremo é o resultado de sumarlle ao primeiro extremo a amplitude dos intervalos: =E12+F7 (E12: cela co primeiro extremo e F7: cela coa amplitude) e así sucesivamente.
Para poder arrastrar a fórmula sen ter que escribila cada vez que queiramos calcular o extremo dun dos intervalos, en vez de escribir =E12+F7 poñemos =E12+$F$7. Co símbolo $ conseguimos fixar esta cela. Deste xeito, se arrastramos a fórmula unha casilla para abaixo automaticamente completaríase coa fórmula =E13+$F$7. Arrastrando a fórmula ata a cela E21 obteríamos todos os extremos superiores dos 10 intervalos.
No rango de saída debemos elixir se queremos que o histograma nos saia na mesma folla na que estamos traballando ou noutra folla nova do libro de Excel.
Ao igual que fixemos cando elaboramos o histograma con datos agrupados podemos xuntar as barras do histograma. Para iso, prememos riba da gráfica e pinchamos no botón dereito do rato. No menú emerxente escollemos a opción "Formato de serie de datos...".
(Se queres ver o vídeo a pantalla completa pincha neste enlace)
O procedemento para elaborar este tipo de gráficos con OpenOffice/LibreOffice Calc é distinto ao descrito arriba para Excel, xa que OpenOffice e LibreOffice non dispoñen da ferramenta de análise de datos que ofrece Excel. En primeiro lugar, imos abrir unha folla de cálculo onde teñamos os datos que queremos representar no polígono de frecuencias. Imos utilizar a táboa de datos da explicación anterior (ExemploGraficos6.ods), renda dispoñible bruta por habitante dos concellos galegos, con datos do ano 2009:
Situámonos na folla “Datos”, onde se ofrece a táboa cos datos a representar. O primeiro que teríamos que facer é agrupar a información nunha táboa de frecuencias. Para elo, necesitamos calcular os valores máximo e mínimo do rango de datos:
O valor máximo calcúlase empregando a fórmula MAX (en OpenOffice) ou MÁX (en LibreOffice). Recordade que para escribir unha función en Calc sempre debemos comezar poñendo o símbolo =. Neste exemplo, teclearíamos a seguinte sentencia: =MAX(C6:C320) (C6:C320 é o rango de datos onde aparecen os valores da renda por municipios).
O valor mínimo calcúlase empregando a fórmula MIN (en OpenOffice) ou MÍN (en LibreOffice): =MIN(C6:C320).
A continuación, debemos definir cantos intervalos imos empregar para representar os datos. No noso exemplo, empregaremos catro intervalos.
Unha vez delimitado o número de intervalos, teríamos que calcular a amplitude de cada intervalo (vai ser a mesma para cada un dos intervalos). Para elo, empregamos a fórmula seguinte: Amplitude=(Máximo-Mínimo)/Número de intervalos. No noso exemplo, escribiríamos =(F8-F7)/4 (F8 é a cela que contén o valor máximo; F7 é a cela co valor mínimo; e 4 é o número de intervalos).
O seguinte paso consiste en obter os extremos superiores dos intervalos:
O primeiro extremo obtémolo sumándolle ao valor mínimo a amplitude dos intervalos, é dicir, escribimos =(F7+F9) (F9 é a cela que contén a amplitude dos intervalos).
O seguinte extremo calculámolo sumándolle ao extremo anterior a amplitude dos intervalos; no noso exemplo, escribiríamos =E12+F9 (E12 é a cela que contén o valor do primeiro extremo). Calcularíamos os seguintes extremos aplicando a fórmula anterior.
Para non ter que escribir a fórmula unha e outra vez para cada extremo, podemos fixar a cela de amplitude co símbolo do dólar, e arrastrar a fórmula para as restantes celas. É dicir, na cela do segundo extremo escribiríamos =E12+$F$9; arrastraríamos esta fórmula ás celas de abaixo e automaticamente completaríase a fórmula en cada unha delas.
Unha vez definidos os extremos superiores dos intervalos, imos empregar a fórmula FRECUENCIA para calcular cantas observacións corresponden a cada un dos intervalos definidos:
Situámonos na cela da dereita do primeiro extremo (F12) e pinchamos no símbolo de función (botón á dereita da barra de texto); ábrese o asistente para a creación de funcións.
Buscamos a función FRECUENCIA que, no OpenOffice/LibreOffice se atopa na categoría “Matriz”.
Prememos derriba de “FRECUENCIA” e ábrese un cadro de diágolo á dereita. Logo do símbolo = escribimos FRECUENCIA(.
Despréganse os argumentos da función, que teremos que ir completando:
En “datos” escribimos $C$6:$C$320, é dicir, o rango de datos da táboa (hai que fixar as celas para que poidamos arrastrar a fórmula FRECUENCIA ás celas de abaixo).
En “grupos” escribimos $F$12:$F$15, é dicir, os extremos superiores dos intervalos que acabamos de definir (igual que antes hai que fixar as celas).
Prememos o botón “Aceptar” e automaticamente aparecen na folla de cálculo as frecuencias correspondentes aos intervalos definidos.
Unha vez construída a táboa de frecuencias, só resta etiquetar cada unha das categorías (intervalos) que imos representar no histograma. Para elo, inserimos unha columna entre a columna cos extremos superiores dos intervalos e a columna coas frecuencias, e escribimos entre parénteses e corchetes os límites de cada intervalo. O primeiro vai de 0 a 10.738,595; logo escribimos (0;10738,595] (a primeira cifra precedida dun paréntese para indicar que o extremo inferior non está contido no intervalo; a segunda cifra seguida dun corchete para indicar que esta si está contida no intervalo).
Agora xa podemos representar a táboa de frecuencias por medio dun histograma. Repetimos os pasos mencionados no apartado de datos agrupados:
Seleccionamos o rango de datos, con inclusión das categorías (F12:F15).
Na barra de menús seleccionamos "Inserir", submenú "Gráfico".
No asistente para gráficos, en tipo de gráfico, deixamos o que amosa por defecto: “Columna normal”. Prememos o botón "Seguinte >>".
Comprobamos que o rango de datos é o que efectivamente queremos que se amose. O recadro “Primeira columna como etiqueta” debe estar seleccionado.
Na seguinte pestana do asistente ofrécesenos a posibilidade de engadir novas series na representación, ou eliminar algunha das existentes. É útil cando se queren representar series de datos procedentes de dúas táboas distintas. Tamén podemos engadirlle a etiqueta á lenda, para o cal prememos no recadro “Rango para Nome” e situámonos na cela “2009”. Prememos no botón "Seguinte >>".
Nesta pestana podemos engadir un título e un subtítulo ao gráfico, o nome ou unidade dos eixos x e y, e cambiar a posición da lenda (ou mesmo eliminala, se non desexamos que se amose no gráfico).
Se en calquera momento da configuración das características do gráfico nos equivocamos, o asistente para gráficos permítenos retroceder premendo o botón "<< Regresar".
Para rematar, pinchamos no botón "Finalizar" e obtemos un diagrama de barras co número de fogares de Galicia clasificados segundo o intervalo de ingresos.
Para que a aparencia sexa a dun histograma, debemos xuntar as barras. Para iso, prememos riba das barras e pinchamos no botón dereito do rato. No menú emerxente escollemos a opción “Formato de serie de datos...”.
Na ventá de formato de serie de datos situámonos na pestana “Opcións”.
No apartado de configuración, o recadro “Espazo” indica a separación entre as barras. Por defecto, o espazo é 100.
Como non queremos que exista ningún espazo entre as barras, no recadro “Espazo” cambiamos 100 por 0.
Para rematar prememos o botón “Aceptar”; obtemos o histograma co número de concellos de Galicia agrupados segundo os tramos da renda dispoñible bruta por habitante.