Un histograma es la representación gráfica en forma de barras, que simboliza la distribución de un conjunto de datos. Sirven para obtener una "primera vista" general, o panorama general, de la distribución de algunos puntos de datos de una variable, de la población, o de la muestra, respecto a una característica, cuantitativa y continua.

Karl Pearson fue un prominente científico, matemático y pensador socialista británico, que estableció la disciplina de la estadística matemática creador del histograma en 1895. El histograma es una técnica gráfica utilizada para presentar gran cantidad de datos
El siguiente ejemplo de histograma representa los resultados de las pruebas de los estudiantes. Los resultados se clasifican en varios rangos. La altura de cada barra representa la cantidad de estudiantes que lograron una calificación en ese rango.
¿Cuándo usar un histograma?
a) Cuando los datos tienen una sola variable independiente
Se puede usar un histograma cuando los datos dependen de una sola variable, como la edad de un cliente. Esto ayuda a los a comprender la distribución de la variable dependiente. Por ejemplo, el saldo bancario de los clientes en función de su edad.
b) Cuando los datos tienen un rango continuo
Un histograma resultará útil cuando los datos de la muestra representan un rango continuo, como los resultados de las pruebas de los estudiantes. Cuando los datos tienen brechas significativas en su rango, entonces un histograma podría no ser el adecuado.
c) Cuando es necesario comparar dos conjuntos de datos
Los histogramas son una herramienta excelente para comparar la distribución de frecuencias de dos conjuntos de datos.
Por ejemplo, considere la cantidad de compras realizadas por clientes de diferentes grupos de edad. Se puede usar un histograma para comparar estos datos en varias tiendas.
¿Cuáles son los principales usos de los histogramas?
a) Análisis de distribución de frecuencias
Los histogramas son especialmente útiles para analizar la distribución de frecuencias de datos de muestra. En un experimento estadístico, la distribución de frecuencias es la cantidad de observaciones que pertenecen a una categoría particular (o "contenedor" en la terminología de histogramas).
En el siguiente ejemplo, el histograma muestra las compras realizadas por clientes de diferentes grupos de edad. El histograma muestra claramente el rango de grupos de edad en comparación con las compras. Según el histograma, los clientes del grupo de edad de entre 50 a 70 años realizaron el mayor número de compras.

b) Análisis de la simetría de datos
Con los histogramas, los espectadores pueden analizar la naturaleza de las distribuciones de frecuencias. Algunas de las distribuciones pueden ser simétricas, lo que significa que la media de la distribución está precisamente alrededor del valor medio del conjunto de datos. Algunas otras distribuciones podrían no ser simétricas sino sesgadas hacia la izquierda o hacia la derecha, lo cual demuestra que el valor medio de los datos está alrededor del principio o al final del rango de datos. Algunos de los datos tendrán una distribución uniforme donde cada contenedor tiene casi la misma cantidad de puntos de datos. La siguiente figura muestra algunas distribuciones de histogramas de muestra.

c) Análisis del cambio durante un periodo de tiempo
Los histogramas analizan cómo cambian los resultados del proceso con el tiempo. Por ejemplo, la cantidad de artículos defectuosos fabricados durante un turno en una fábrica podría cambiar con el tiempo. Una organización puede usar estos datos para determinar las horas en las que los defectos son altos y buscar medidas preventivas.
======================================================================

