Modifying the histogram using deciles
Palabras clave:
Histograma, Diagrama de barras, Expansiones asintóticas, Convergencia, Decilas, Asíntotas, Boxplot, Percentiles, Convergencia Asintótica, Convergencia Asintótica ConjuntaResumen
Presentamos algunas modificaciones que producen un histograma basado en los deciles, el cual es visualmente más informativo que el histograma de igual longitud de clases y el boxplot de cuartiles, más comúnmente utilizados para representar un conjunto de datos. Se muestra también la convergencia asintótica de los deciles lo mismo que su convergencia conjunta para llegar a la conclusión de que los límites de clase de las barras son realmente estimaciones puntuales y que consecuentemente pueden estimarse por intervalos de confianza. El investigador adquiere cierto dominio de la información en el sentido de que conoce el porcentaje de datos que cae dentro de cada barra; además, en la medida que aumente el tamaño poblacional, podrá extender el histograma al número de clases que desee, teniendo dominio siempre sobre el número de datos que cae en cada una de estas clases. Discutimos algunos problemas del boxplot e ilustramos ambas gráficas utilizando los datos de la media maratón de Medellín 2009.
ABSTRACT
We present some modifications that produce a histogram based on deciles which is visually more informative than the equal-width histogram and the quartile boxplot currently used to represent a dataset. We also present the asymptotic convergence of the deciles and their joint asymptotic convergence to conclude that the class limits actually are point estimations and, consequently, can be estimated through confidence intervals. The researcher has certain control of the information, since he or she knows the part of the dataset pertaining to each class; besides, the larger the sample size is the larger the number of classes can ever he or she choose knowing the amount of data included into each class. We also discuss some problems of the boxplot , and illustrate both the histogram and the boxplot using the Medellín 2009 half-marathon data.