<meta http-equiv="refresh" content="1; url=/nojavascript/"> Diagramas de Tallo-Hoja e Histogramas | CK-12 Foundation
Dismiss
Skip Navigation
You are reading an older version of this FlexBook® textbook: Álgebra I - Edición Española Go to the latest version.

Objetivos de Aprendizaje

  • Construir e interpretar diagramas de tallo-hoja.
  • Construir e interpretar histogramas.
  • Construir histogramas haciendo uso de una calculadora graficadora.

Introducción – Agrupación y Visualización de Datos

Imagina que preguntas a una clase de Álgebra, que consta de 20 estudiantes, cuántos hermanos y hermanas tiene cada uno. Probablemente obtengas un rango de respuestas que va desde cero hacia valores mayores. Esto es así porque probablemente algunos estudiantes no tengan hermanos ni hermanas, pero la mayoría tendría al menos uno o una. Los resultados pueden lucir tal como en la siguiente lista.

1, 4, 2, 1, 0, 2, 1, 0, 1, 2, 1, 0, 0, 2, 2, 3, 1, 1, 3, 6

Podríamos organizar estos datos de muchas maneras. La primera podría ser, simplemente, crear una lista ordenada, en orden ascendente por ejemplo, para lo cual tendríamos que reordenar los datos, comenzando con el de menor valor.

0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 6

Otra forma de organizar los resultados es haciendo uso de una tabla, como se muestra a continuación.

Número de hermanos y/o hermanas Número de estudiantes coincidentes
0 4
1 7
2 5
3 2
4 1
5 0
6 1

Adicionalmente, podríamos también hacer una representación visual de los datos; para ello, hacemos categorías para el número de hermanos (y/o hermanas) sobre el eje x y, luego, apilando representaciones gráficas de cada estudiante sobre el marcador de cada categoría. Para dichas representaciones bien podríamos utilizar cruces, columnas hechas de figuras humanas o, inclusive, fotografías de los estudiantes; todo ello con el fin de mostrar cuántos estudiantes corresponden a cada categoría del eje x.

Construcción e interpretación de diagramas de Tallo-Hoja

Otra alternativa muy útil de desplegar datos la constituyen los diagramas de tallo-hoja. Los diagrmas de tallo-hoja son especialmente útiles porque ellos proveen una representación visual sobre cómo se forman diversas agrupaciones (clusters, en Inglés) de datos, relativamente cercanos entre sí; además, éste tipo de diagramas preserva toda la información numérica contenida en los datos.

En su forma más básica, un diagrama típico Tallo-Hoja consta de una categoría denominada tallo, que es la columna de números localizada en la parte izquierda del diagrama. Es importante notar y, de hecho, resultar obvio, que cada número que compone la columna tallo (es decir, que forma parte de la categoría tallo) se conoce a su vez como tallo y es, sencillamente, el primer dígito común a cada uno de los datos relativamente cercanos entre sí que constituyen una agrupación (o cluster).

Ahora bien, el diagrama tiene otra categoría denominada hoja, constituida por filas de números, localizadas a la derecha del diagrama. Cada fila corresponde a un tallo (o primer dígito común de un cluster), y se sitúa justo a la derecha del mismo. Además, cada número que compone a una de dichas filas es una hoja. Lo importante a reconocer acá es que cada una de estas hojas es, simplemente, el segundo dígito de cada dato del cluster.

Así, en el diagrama de tallo y hojas que sigue abajo, el primer número representado es el 21, el cual es el único número con un tallo común (es decir, un primer dígito común) igual 2; por lo que constituye el único miembro del cluster de las veintenas (o de los 20's). Los siguientes dos números tienen un tallo común igual a 3, es decir, un primer dígito común igual a 3. Dichos números son el 33 y el 36. Observa que en este caso, el cluster lo componen 2 miembros; así también, puedes ver que las hojas correspondientes al tallo común son los números 3 y 6. Continuando con la ilustración, resulta que os siguientes números representados son 40, 45 y 47, cuyo tallo común es, obviamente, igual a 4 y cuyas hojas son los números 0, 5 y 7.

NOTA: Como se verá más abajo, se denomina rama al conjunto compuesto por un tallo (es decir, uno de los números componentes de la columna, o categoría, tallo) y la fila correspondiente de hojas situada a la derecha del mismo.

Los diagramas de tallo-hoja tienen una serie de ventajas sobre la simple lista de datos en una línea:

  • Muestran cómo están distribuidos los datos, y si dicha distribución es simétrica alrededor del centro.
  • Pueden utilizarse a medida que los datos son recolectados.
  • Permiten determinar con facilidad la mediana y la moda.

Sin embargo, los diagramas de tallo-hoja no son aplicables para todas las situaciones. En particular, no son prácticos cuando los todos datos están distribuidos muy cercanamente (apretadamente) entre sí. Por ejemplo, para el caso de los hermanos de los estudiantes de la clase de Álgebra, descrito arriba, todos los datos ocuparían la fila correspondiente al primer tallo (cero). En este caso, ninguna información adicional podría obtenerse del diagrama de tallo-hoja.

Ejemplo 1

Mientras realiza una larga jornada en tren, Rowena recolectó las edades de todos los pasajeros que viajaban en su vagón. Las edades de los pasajeros se muestran a continuación. Construye un diagrama de tallos y hojas con dichos datos. Utiliza dicho diagrama para encontrar la mediana y la moda de las edades de los pasajeros.

& 35, 42, 38, 57, 2, 24, 27, 36, 45, 60, 38, 40, 40, 44, 1, 44, 48, 84, 38, 20, 4,\\& 2, 48, 58, 3, 20, 6, 40, 22, 26, 17, 18, 40, 51, 62, 31, 27, 48, 35, 27, 37, 58, 21

Solución

El primer paso consiste en construir un tallo razonable y práctico. Así, dado que todos los valores se ubican entre 1 y 84, el tallo debería representar, básicamente, a la columna de las decenas, con un rango de datos que varíe desde 0 hasta 8, de modo que, a su vez, el rango de los números representados variase desde 00 (el cual podríamos formar colocando una hoja igual a 0 a la par del 0 que se ubica en el tallo) hasta 89 (este último número formado por una hoja igual a 9 puesta a continuación del número 8, ubicado en el tallo). Una vez fijados los límites de los números representados, podemos completar el diagrama con los datos proporcionados.

Tú podrás observar, inmediatamente, que el intervalo con el mayor número de pasajeros es el grupo 40 - 49. Con el fin de determinar correctamene la mediana y la moda, es útil construir un segundo y ordenado diagrama tallo-hoja, lo cual se logra al colocar las hojas de cada rama en orden ascendente.

La moda resulta, ahora, obvia - hay 4 ceros seguidos en la rama del 4, así que la \text{moda} = 40.

Para encontrar la mediana, utilizaremos el  \left ( \frac{n + 1} {2} \right)^{\text{ésimo}} valor que utilizamos antes. De este modo, dado que existen 43 datos, resulta que  \left ( \frac{n + 1} {2} \right) = \frac{44} {2} = 22. Haciendo la cuenta correspondiente, hasta localizar el 22o valor, resulta que la \text{mediana} = 37.

Construir e Interpretar Histogramas

Revisemos de nuevo el ejemplo de los estudiantes de la clase de Álgebra y sus hermanos y hermanas. Los datos fueron recolectados en la siguiente lista.

1, 4, 2, 1, 0, 2, 1, 0, 1, 2, 1, 0, 0, 2, 2, 3, 1, 1, 3, 6

En dicho ejemplo, logramos organizar los datos dentro de una tabla. Ahora, volveremos a formar una tabla, pero esta vez utilizaremos la palabra frecuencia como encabezado de la columna de valores que indican el número de veces que se repite cada dato en la lista anterior.

Número de Hermanos y/o hermanas Frequencia
0 4
1 7
2 5
3 2
4 1
5 0
6 1

Ahora podemos utilizar esta tabla como una lista de puntos coordenados (x, y), los cuales utilizamos para graficar un diagrama de segmentos lineales que, a su vez, unen los puntos anteriores. Dicho diagrama se muestra arriba.

Aunque este diagrama muestra, en efecto, todos los datos, puede conducir a interpretaciones incorrectas. Por ejemplo, se podría pensar que el segmento rectilíneo que une el número de estudiantes que tienen uno y dos (hermanos/hermanas) nos podría dar información sobre cuántos estudiantes tienen 1.5 hermanos/hermanas (lo cual, obviamente, es imposible). En este caso, donde todos los puntos de datos son números enteros, !Es totalmente incorrecto suponer que la función graficada es continua entre cada par de dichos puntos!

Cuando los datos que estamos representando caen dentro de categorías bien definidas (tales como los enteros 1, 2, 3, 4, 5 & 6), resulta más apropiado utilizar un histograma para representar gráficamente los datos. Un histograma para los datos que estamos analizando se muestra abajo.

Cada número sobre el eje x tiene una columna asociada, la altura de la cual determina cuántos estudianes tienen ese número de hermanos/hermanas. Por ejemplo, la columna correspondiente a x = 2 tiene 5 unidades de altura, la cual nos indica que hay 5 estudiantes con 2 hermanos/hermanas.

Las categorías representadas en el eje x se conocen como intervalos (bins, en Inglés). Los histogramas difieren de los gráficos de barras en que aquéllos no tienen necesariamente intervalos de ancho fijo. Los histogramas también son útiles para representar datos continuos (es decir, datos que varían continuamente, más que en cantidades discretas). Par ilustrar esto, veamos los siguientes ejemplos.

Ejemplo 2

Rowena hizo una encuesta sobre las edades de los pasajeros que se encontraban en su vagón de tren y recolectó los datos en una tabla. Se pide representar gráficamente los datos en un histograma.

Rango de Edad Frecuencia
0 - 9 6
10 - 19 2
20 - 29 9
30 - 39 8
40 - 49 11
50 - 59 4
60 - 69 2
70 - 79 0
80 - 89 1

Solución

Dado que los datos ya están dispuestos en intervalos, utilizaremos éstos como los bins para el histograma. Aun cuando el extremo superior del primer intervalos es 9, el bin en nuestro histograma se extenderá hasta 10. Esto se hace porque, a medida que nos movemos sobre este intervalo de datos, observamos que tenemos un rango de números que crece (pero que no incluye) el extremo inferior del siguiente intervalo (siguiente bin). Así, el rango de valores para el primer intervalo (bin) será, por tanto.

La Edad es mayor o igual que 0, pero (estrictamente) menor que 10.

Algebraicamente, podríamos escribir:

0 \le \ \text{Edad} \ < 10

Utilizaremos esta notación para nombrar (etiquetar) nuestros intervalos (bins) en el siguiente ejemplo.

Examplo 3

La información de precipitación mensual (in milímetros) para Beaver Creek, Oregon, fue recolectada durante un período de cinco años. Los datos se muestran abajo. Mostrar dichos datos en un histograma.

& 41.1, 254.7, 91.6, 60.9, 75.6, 36.0, 16.5, 10.6, 62.2, 89.4, 124.9, 176.7,\\& 121.6, 135.6, 141.6, 77.0, 82.8, 28.9, 6.7, 22.1, 29.9, 110.0, 179.3, 97.6,\\& 176.8, 143.5, 129.8, 94.9, 77.0, 60.8, 60.0, 32.5, 61.7, 117.2, 194.5, 208.6,\\& 176.8, 143.5, 129.8, 94.9, 77.0, 60.8,  20.0, 32.5, 61.7, 117.2, 194.5, 208.6,\\& 133.1, 105.2, 92.0, 60.7, 52.8, 37.8, 14.8, 23.1, 41.3, 75.7, 134.6, 148.8

Solución:

Hay muchas formas en las que podemos organizar estos datos. Ante todo, debemos notar la similitud entre histogramas y diagramas de tallo-hoja. Un diagrama de tallo-hoja se parece a un histograma tendido (acostado) sobre uno de sus lados. Por tanto, podríamos comenzar por construir un diagrama de tallo-hoja para nuestros datos.

Específicamente, para los datos listados arriba, nuestro tallo correspondería a las decenas, variando desde 1 hasta 25. Es importante observar que no hemos redondeado las cifras decimales de los datos, sino más bien, las hemos truncado, es decir que, simplemente, hemos eliminado la cifra decimal. Por ejemplo, 165.7 tiene un tallo igual a 16 y una hoja igual a 5. Acá resulta obvio que no incluimos las siete décimas.

Con esta aproximación de los números representados en el diagrama de tallo-hoja, podemos observar cómo luciría un histograma con un intervalo (bin) con ancho igual a 10. Es posible, incluso, construir un histograma rudimentario al dibujar un contorno de líneas sobre los datos (tal como se observa en la figura de arriba). Debe resultarte obvio que con tantos intervalos, dicho histograma luce aleatorio, y no es posible observar algún patrón. En una situación como esta, necesitamos reducir el número de intervalos. Para ello, incrementamos el ancho del intervalo hasta 25 y recolectamos los datos en una tabla.

Precipitación (mm) Frecuencia
0 \le x < 25 7
25 \le x < 50 8
50 \le x < 75 9
75 \le x < 100 12
100 \le x < 125 6
125 \le x < 150 9
150 \le x < 175 0
175 \le x < 200 6
200 \le x < 225 2
225 \le x < 250 0
250 \le x < 275 1

El histograma asociado con este nuevo ancho se muestra a continuación.

Se puede ver que, con menos intervalos (bins) se hace más evidente la existencia de un patrón en la distribución. Veamos, entonces, cómo luciría el histograma con aun menos intervalos. Para ello, combinaremos pares de intervalos (pares de bins), de donde obtenemos 6 intervalos con ancho igual a 50. La nueva tabla y el nuevo histograma lucen ahora como sigue.

Precipitación (mm) Frecuencia
0 \le x < 50 15
50 \le x < 100 21
100 \le x < 150 15
150 \le x < 200 6
200 \le x < 250 2
250 \le x < 300 1

He aquí el histograma.

Ahora podemos ver claramente el patrón. La precipitación mensual normal es aproximadamente de 75 mm, pero a veces existirá un mes muy lluvioso que incrementará más (o aun mucho más) dicha precipitación.

Se puede concluir que, aunque contradiga nuestra intuición, algunas veces el reducir el número de intervalos (o bins) contribuye a ver más información!

Construir Histogramas por Medio de una Calculadora Graficadora

Veamos de nuevo los datos del ejemplo 1. Pudimos observar cómo los datos en bruto que nos fueron dados pueden ser procesados para dar como resultado un diagrama de tallo-hoja y un histograma. Podemos eliminar parte del trabajo tedioso de este proceso mediante el uso de una calculadora graficadora, la cual arreglará automáticamente nuestros datos en intervalos (bins).

Ejemplo 4

Los siguientes datos, no ordenados, representan las edades de los pasajeros que viajan en un vagón de tren.

& 35, 42, 38, 57, 2, 24, 27, 36, 45, 60, 38, 40, 40, 44, 1, 44, 48, 84, 38, 20, 4,\\& 2, 48, 58, 3, 20, 6, 40, 22, 26, 17, 18, 40, 51, 62, 31, 27, 48, 35, 27, 37, 58, 21.

Utiliza una calculadora graficadora para desplegar los datos en un histograma con anchos de intervalo iguales a 10, 5 y 20:

Paso 1 Introduce los datos en tu calculadora.

Presiona [START] y escoge la opción [EDIT].

Introduce los datos en la columna L_1 de la tabla.

Continúa introduciendo todos los 43 datos,

Paso 2 Selecciona el tipo de gráfico.

Haz que aparezca la opción [STATPLOT] presionando [2nd], [Y=].

Selecciona 1:Plot1 y presiona [ENTER]. Esto hará que aparezca la pantalla de opciones del gráfico. Selecciona el histograma y presiona [ENTER]. Asegúrate que Xlist es la lista que contiene tus datos.

Paso 3 Selecciona los anchos de intervalo y grafica.

Presiona [WINDOW] y asegúrate que Xmin y Xmax permitan mostrar todos los datos. El valor Xscl determina el ancho del intervalo (bin width).

Presiona [GRAPH] para desplegar el histograma.

Cambiando el valor de Xscl, podemos cambiar los anchos de intervalo y ver cómo cambia el aspecto del histograma.

Abajo se muestran histogramas con anchos de intervalo iguales a 10, 5 y 20.

En este ejemplo, \text{Xmin} = 0 y \text{Xmax} = 100 serán valores adecuados para cualquier ancho de intervalo que escojamos. Pero un despliegue correcto del histograma requiere que el valor Ymax sea diferente para cada intervalo seleccionado.

Ejercicios de Repaso

  1. Completar el siguiente diagrama de tallo-hoja. Utilizar el primer dígito (centenas) como tallo, y el segundo dígito (decenas) como hoja. Truncar cualquier unidad y decimal. Ordenar el diagrama para poder encontrar la mediana y la moda. & \text{\text{Datos}}: 607.4, 886.0, 822.2, 755.7, 900.6, 770.9, 780.8, 760.1, 936.9, 962.9, 859.9, 848.3, 898.7,\\& 670.9, 946.7, 817.8, 868.1, 887.1, 881.3, 744.6, 984.9, 941.5, 851.8, 905.4, 810.6, 765.3, 881.9,\\& 851.6, 815.7, 989.7, 723.4, 869.3, 951.0, 794.7, 807.6, 841.3, 741.5, 822.2, 966.2, 950.1
  2. Hacer una tabla de frecuencias para los datos del Ejercicio 1. Usar un ancho de intervalo igual a 50.
  3. Graficar los datos del Ejercicio 1 en un histograma con un ancho de intervalo igual a
    1. 50
    2. 100
  4. El siguiente diagrama de tallo-hoja muestra los datos de velocidad de 40 recolectados en una zona de Culver City, California, donde el límite de velocidad es de 35 mph.
    1. Encontrar la media, la mediana y la moda de la velocidad.
    2. Completar la tabla de frecuencias, comenzando con 25 mph y un ancho de intervalo igual a 5 mph.
    3. Usar dicha tabla para construir un histograma que tenga los intervalos de dicha tabla de frecuencias.

  5. El Histograma mostrado despliega los resultados de una encuesta a mayor escala sobre el número de hermanos y hermanas. Utilizar dicho histograma para encontrar:
    1. La mediana de los datos
    2. La media de los datos
    3. La moda de los datos
    4. El número de personas que tiene un número impar de hermanos/hermanas.
    5. El porcentaje de personas encuestadas que tienen 4 o más hermanos/hermanas.

Respuestas a los Ejercicios de Repaso

  1. La mediana encontrada a partir del diagrama sería 850; la moda es 880 (puesto que todos los valores fueron truncados a las decenas).
Intervalo Frecuencia
600 \le x < 650 1
650 \le x < 700 1
700 \le x < 750 3
750 \le x < 800 6
800 \le x < 850 8
850 \le x < 900 10
900 \le x < 950 5
950 \le x < 1000 6
  1. La media es 36.9 mph (\approx 37 \ mph). La mediana es 35.5 mph. La moda es 32 mph.
Velocidad Frecuencia
25 \le x < 30 5
30 \le x < 35 12
35 \le x < 40 10
40 \le x < 45 7
45 \le x < 50 4
50 \le x < 55 1
55 \le x < 60 1

  1. Con el fin de determinar adecuadamente las respuestas, resulta útil construir una tabla de frecuencias. Para ello, se lee directamente del histograma.
Number of Siblings Frequency
0 10
1 15
2 21
3 17
4 9
5 5
6 3
7 1
8 1
9 0
10 1
Total: 83

La suma nos dice que fueron encuestadas 83 personas.

(a) La mediana es el 42o valor. La mediana = 2.

(b) \text{Media} = \frac{0(10) + 1(15) + 2(21) + 3(17) + 4(9) + 5(5) + 6(3) + 7 + 8 + 10} {83} = \frac{212} {83} = 2.55

(c) \text{Moda} = 2

(d) \text{n(impar)} = 15 + 17 + 5 + 1 = 38

(e) (\%4 \text{ó más}) = \frac{9 + 5 + 3 + 1 + 1 + 1} {83} \times 100 \% = 24.1 \%

Image Attributions

You can only attach files to None which belong to you
If you would like to associate files with this None, please make a copy first.

Reviews

Please wait...
Please wait...
Image Detail
Sizes: Medium | Original
 
CK.MAT.SPA.SE.1.Algebra-I.11.7
ShareThis Copy and Paste

Original text