Como visualizar el big data
Ya que estamos hablando del tema debemos hablar de la forma de representar los datos. Los seres humanos hemos sido “diseñados” para identificar las cosas que se salgan de lo normal. Y para identificar patrones en un número determinado y finito de datos, por lo tanto todo lo que se salga de este estándar nos va a costar gran cantidad de trabajo encontrar lo que busquemos o tratar estos datos (Big Data).
- Nube de etiquetas: Es quizás la forma más conocida de representar grandes cantidades de palabras. Lo que hace es mostrar todas las palabras y hacer más grandes aquellas que más veces se repitan.
- Clustergram: Es una técnica de visualización usada para análisis de cluster para mostrar los datos individuales de un determinado dataset. El número de cluster es un dato importante ya que ayuda a entender la escalabilidad de los sistemas.
- History flow: Sirve para ver la evolución de un documento. En el eje horizontal se pone el tiempo y en el vertical los colaboradores. A partir de aquí se puede jugar haciendo que como más grande sea el punto en el tiempo más cantidad de texto ha modificado. Es usado por Wikipedia.
- Flujo de información: Esto es usado a veces para indicar entre que puntos se hacen las conexiones en el globo terráqueo.
Luego ya están los clásicos como histogramas, diagrama de barras, gráficos de sectores (quesitos)… Con un poco de imaginación seguro que podemos adaptar estos modelos a otros similares. Se que no he aportado mucho pero de momento no se me ocurren más, así que si encontráis más se agradecen aportaciones en los comentarios ;)