Contenido principal
Principios de ciencias de la computación avanzados (AP Computer Science Principles)
La era de "big data"
El mundo digital recopila constantemente más y más datos. Cuando usas un servicio en línea, contribuyes a un conjunto de datos de comportamiento de usuarios. Aún con simplemente usar electricidad y agua en tu casa, contribuyes a un conjunto de datos de uso de servicios públicos.
Con el creciente número de personas y ciudades conectadas a Internet, los conjuntos de datos son cada vez más grandes. Un informe estima que el tamaño total de los datos digitales será de 175 zettabytes en 2025.start superscript, 1, end superscript
¿De cualquier manera, cuántos datos son 175 zettabytes? Un solo zettabyte es un billón de gigabytes. Un teléfono inteligente moderno almacena unos 32 gigabytes. Para almacenar 175 zettabytes, necesitaríamos 6 billones de teléfonos inteligentes (¡1000 teléfonos inteligentes por cada persona viva!).
Ufff, ¡eso es mucho! Pero ¿qué tan grandes son los conjuntos de datos individuales?
Estas estadísticas pueden darnos una idea...
- Un solo escaneo de resonancia magnética produce 20.000 imágenes.start superscript, 1, end superscript
- Google procesa 3500 millones de consultas de búsqueda por día.squared
- Los usuarios de Instagram publican 54,000 fotos cada minuto.cubed
- Un vehículo autónomo genera 11 terabytes de datos cada día.start superscript, 4, end superscript
- Los usuarios de Twitter publican 3,000 tweets cada segundo.start superscript, 5, end superscript
Los conjuntos de "big data" son tan grandes que nuestras formas tradicionales de almacenarlos y procesarlos ya no son adecuadas, y presentan desafíos a los científicos de computación y a los ingenieros de datos. Del lado positivo, también son tan grandes que ofrecen nuevas oportunidades de análisis que antes eran imposibles con un conjunto pequeño de datos.
En esta lección, exploraremos de dónde provienen los grandes datos y las emocionantes formas en que podemos usarlos.