Contenido principal
Estadística y probabilidad
Curso: Estadística y probabilidad > Unidad 5
Lección 1: Introducción a las gráficas de dispersión- Construir una gráfica de dispersión
- Construir gráficas de dispersión
- Hacer gráficas de dispersión apropiadas
- La dirección en gráficas de dispersión. Ejemplo
- Gráfica de dispersión: fumadores
- La linealidad, intensidad y dirección de una relación bivariada
- Asociaciones lineales positivas y negativas a partir de gráficas de dispersión
- Describir tendencias en gráficas de dispersión
- Asociaciones positivas y negativas en gráficas de dispersión
- Valores atípicos en gráficas de dispersión
- Clústeres en gráficas de dispersión
- Describir gráficas de dispersión (forma, dirección, intensidad, valores atípicos)
© 2023 Khan AcademyTérminos de usoPolítica de privacidadAviso de cookies
Clústeres en gráficas de dispersión
¡Aprende qué es un clúster en una gráfica de dispersión!
¿Qué son los clústeres en las gráficas de dispersión?
Algunas veces los puntos una gráfica de dispersión forman distintos grupos. Estos grupos se llaman clústeres.
Considera la gráfica de dispersión que se muestra arriba, que exhibe la información nutricional de 16 marcas de hot dogs en 1986 (cada punto representa una marca). Los puntos forman dos clústeres, uno a la izquierda y el otro a la derecha.
El clúster izquierdo es aquel cuyas marcas tienden a ser start color #1fab54, start text, b, a, j, a, s, space, e, n, space, c, a, l, o, r, ı, with, \', on top, a, s, space, y, space, b, a, j, a, s, space, e, n, space, s, o, d, i, o, end text, end color #1fab54.
El clúster derecho aquel cuyas marcas tienden a ser start color #11accd, start text, a, l, t, a, s, space, e, n, space, c, a, l, o, r, ı, with, \', on top, a, s, space, y, space, a, l, t, a, s, space, e, n, space, s, o, d, i, o, end text, end color #11accd.
Problemas de práctica
Para poder entender mejor la idea de los clústeres, intentemos hacer un par de problemas de práctica.
Problema 1: peces macho y hembra
Los machos adultos Lamprologus callipterus (un tipo de pez) son mucho más grandes que sus contrapartes hembras, y pesan aproximadamente 13 veces más. Además, mientras que las hembras alcanzan una longitud de 6 centímetros, los machos alcanzan una de 15 centímetros.
Problema 2: resultados del examen SAT
Algunos estudiantes de preparatoria en los Estados Unidos hacen un examen llamado el SAT antes de presentar solicitudes para ingresar a las universidades. La siguiente gráfica de dispersión muestra qué porcentaje de graduados de cada estado que irán a la universidad participó en el SAT en el periodo 2009, start text, negative, end text, 2010, junto con la puntuación promedio de ese estado en la sección de matemáticas.
Hay un conglomerado de los estados con start color #1fab54, start text, m, e, n, o, r, space, p, a, r, t, i, c, i, p, a, c, i, o, with, \', on top, n, end text, end color #1fab54 y un conglomerado de los estados con start color #11accd, start text, m, a, y, o, r, space, p, a, r, t, i, c, i, p, a, c, i, o, with, \', on top, n, end text, end color #11accd.
¿Por qué existen clústeres en conjuntos de datos?
Explicar por qué existen clústeres en un conjunto de datos particular puede ser difícil. En este artículo presentamos tres conjuntos de datos, cada uno con información del mundo real. Solo en caso de los peces tenemos una explicación clara de por qué ocurren clústeres.
Si tienes alguna teoría que explique los clústeres en cualquiera de los otros conjuntos de datos, por favor comparte lo que piensas en los comentarios.
¿Quieres unirte a la conversación?
- Tal vez los agrupamientos puedan explicarse porque las muestras responden a una tercera variable en la que son diferentes. Por ejemplo: los peces, la variable sexo no se está graficando, pero está afectando las muestras.
En el caso de los resultados del examen SAT, tal vez la tercera variable sea Universidad Pública/Privada, por eso, se agrupan en la gráfica de participación - puntuación promedio.(7 votos) - En la gráfica nutricional de los perritos era de esperar la agrupación pues se toman datos de 2 grupos distintos definidos previamente (marcas light/marcas normales). Además al ser un producto de consumo, los valores están controlados en laboratorio, no se pueden esperar muchas diferencias en este sentido entre estos productos.(1 voto)
- porque si tuvieron menos participación su calificación es mayor?(1 voto)
- Que otros tipos de agrupaciones existen ??(0 votos)
- Se necesita estudiar un poco màs para poder entender el tema de las agrupaciones(0 votos)
- porque el estado con menos participantes tuvieron la calificaciones mas alta(0 votos)