Archivo de la etiqueta: privacidad

Linkedin recomendaciones de contacto sin motivo aparente

El otro día me dediqué a mirar las recomendaciones de contacto que me enseñaba Linkedin y vi algunas personas que no tenían que aparecer. No tenían que aparecer porque no teníamos ningún tipo de conexión ni de segundo ni tercer grado, en algunos casos las recomendaciones no tenían más que apenas unos pocos contactos (menos de 30), de ubicación geográfica tanto de la vivienda como de la empresa en algunos casos no está ni en la misma comunidad autónoma y no formaban parte de la misma industria prácticamente se podría decir que ellos eran de letras y yo de números.

Indagando un poco Marc me ha pasado un link interesante LinkedIn: The Creepiest Social Network en el que hace algunas indagaciones sobre este mismo problema.

En Linkedin Help Center dice que las sugerencias de contactos se hacen de dos formas:
1) Mediante la relación entre contactos, industria, empresa, experiencias o lugares de formación comunes.

2) Contactos que has importado de tu cuenta de email.

El autor del post anteriormente mencionado al igual que yo no tenemos la conexión entre Linkedin y Facebook. Las únicas aplicaciones externas a Linkedin que les he permitido el acceso es Slideshare y twitterfeed.

Finalmente se llega a la conclusión que Linkedin saca información de lugares dónde no se dicen. Y todo parece indicar que en Silicon Valley se comparten más datos de lo que pensábamos, esto incluye la [en] NSA.

Con este post quiero invitar a la reflexión 😉

Bonus: Os dejo un reportaje sobre Google Books de [cat] Sense ficció, Google i el Cervell mundial.

Posibles problemas del Big Data

No todo es maravilloso en el Big Data, también tiene algunos inconvenientes que es necesario saber para no caer en errores.

Correlación: Que algo suceda no quiere decir que tenga una correlación que nos afecte. Por ejemplo que la gente que viene a trabajar los lunes esté más cansada y que los lunes tengamos más trabajadores que vienen en bus no quiere decir que al venir en bus se cansen más. Puede ser que su fin de semana fuera agotador.

Ahora ya no se pueden trazar estadísticas desde el despacho de la oficina, se tiene que hacer experimentos en el mundo real y comprobar que las hipótesis con sus conclusiones son ciertas.

No todas las organizaciones (incluida la administración) son capaces o tienen ganas de adaptarse.

Comprender los resultados: Prácticamente cualquier ordenador ahora te puede calcular grandes cantidades de datos, pero detrás de los resultados tiene que haber una conclusión. Los números por si solos son estériles, tiene que haber una parte humana para interpretar los resultados correctamente y sacar las conclusiones acertadas.

Problemas de base: Todos los datos están en un mismo sitio? Los poseedores de estos son las mismas personas? Puede pasar que en una empresa los datos estén repartidos entre los diferentes departamentos y almacenados de distintas formas. Esto requeriría una colaboración distinta entre los distintos departamentos de la misma empresa.

Pero no sólo esto, sino que también puede pasar que la empresa no sea la propietaria de los datos y consecuentemente no los puedas usar en según que circunstancias o necesites permisos.

Problemas de identificación: Esta es la incapacidad de identificación de los datos. Pongo un ejemplo más aclarador. Si lo que transmite datos es una tarjeta SIM como sabemos si es hombre o mujer, su edad… Los datos son de más utilidad si están ligados con las personas.

Problemas de privacidad: cada vez más los clientes quieren tener más control sobre sus datos y en que forma se usan, por lo que normalmente tienen que autorizar un permiso expreso para que sus datos se usen. A parte de esto la ley de cada país dictamina como se tienen que tratar estos datos, y en ocasiones como España, esta ley es muy dura. Todo esto puede terminar como 1984 de George Orwell.

Información desactualizada: Algunas veces nos entestamos en guardar datos. Esto es bueno para hacer predicciones, pero no por eso tenemos que dejar de adquirir nueva información. Basar decisiones en datos desactualizados no es muy sabio. Siempre es mejor tener información actualizada, forzando un poco más la situación podemos encontrar el ejemplo de que un cliente se ha mudado y la residencia que tenemos ya no es válida.

Incapacidad de tratamiento de la información en tiempo real: Algunas veces no vamos a necesitar los datos de inmediato, pero otras veces si que necesitamos saber los resultados progresivos para actuar al respeto. Por ejemplo, de que sirve tener los niveles de existencias si sólo se calculan una vez por semana? Si los tienes actualizados posiblemente no tengas problemas de aprovisionamiento. Sé que es un ejemplo infrecuente raro pero sirve.

 No todos los datos son información: hay infinidad de motivos por los cuales el 100% de nuestros datos no aportan información. Como por ejemplo duplicidad de datos P.ej. Retweets manuales (o la misma info en diferentes redes sociales), backups, etc.

Problemas de relevancia: No toda la información tiene la misma importancia. Hay ruido en Internet, pero además para lo que algunos puede ser ruido para otros puede ser música. Seguro que los diarios Chinos son importantes para los Chinos, pero para mi no me aportarían demasiado a menos que viviera allí.

Como veis no todo son ventajas, aunque a mi parecer vale la pena intentarlo. El futuro está en la optimización de los recursos y en esto se basa el Big Data.

Los grandes nos controlan

Ahora ya no solo los países nos espían, las grandes corporaciones también lo hacen. Quizás sea con buena intención, pero eso no quita importancia al asunto. Hace poco se descubrió que algunas compañías telefónicas de EEUU controlaban los sms, emails y todo lo que ocurriera en el smartphone para “mejorar” su servicio. Creo que el principal problema no es que nos espíen, sino que lo hagan sin que lo sepamos, o mejor dicho, sin que la gran mayoría sea consciente. Antes de seguir ved el siguiente vídeo.

Principalmente me voy a centrar en Google ya que más de una vez se ha puesto de manifiesto la moralidad tanto de Facebook como de su creador.

Google con el lema “Don’t be evil”, se ha posicionado como una empresa con valores morales, moderna y para la gente joven. Pero poco a poco se ha ido posicionando de un modo distinto al inicial. Como con la regulación de internet o la recolección de datos. Google es una gran base de datos saviamente utilizada.

Lejos de criticar todos los datos que recolectó Google con los coches del StreetView (wifis, emails…), está recolectando muchos de nuestros datos vía internet.

Los datos que almacena son impresionantes debido a todos los servicios de los que dispone. Google posiblemente sea la empresa que más datos tenga y la que mejor los usa. Cada vez que realizamos una búsqueda, Google sabe de nosotros:

  • Lo que hemos buscado anteriormente, y de este modo nos ofrece unos resultados menos ambiguos y mas centrados en nuestros intereses.
  • Que comparten y que les gusta a nuestros amigos, con más relevancia con su red social Google+ también usa datos de Facebook y Twitter, con la premisa de que si les gusta a nuestros amigos a nosotros también.
  • Lo que han buscado otros usuarios, si la mayoría de la gente que busca una palabra en Google no entra en en primer resultado o entra pero vuelve a buscar para entrar al segundo Google deducirá que el segundo resultado es mejor que el primero.
  • Google Analytics es de Google, y me atrevería a decir que el 99% de las webs que tienen algún método de seguimiento de los usuarios usan Google analytics, y de este modo Google sabe si los usuarios les gusta tu web o no y actuar en consecuencia.
  • Blogger es de Google, él sabe lo que gusta a sus blogeros, los temas interesantes…
  • Rastrea la web de forma continuada y almacena todos los datos incluso algunos protegidos por robots.txt o tags específicas. Además de resistirse a borrar los datos ya almacenados.
  • Gmail quiere decir GoogleMail, todos nuestros emails están en su poder.
  • Adwords y Adsense lo mismo desde diferentes prespecitvas, Google sabe lo que se busca vender y a que precio estás dispuesto porque entren en tu web. Uno de los factores del precio es la cantidad de veces que la gente entra en tu anuncio o el tiempo que pasan luego en tu web.
  • Google docs, hermosa herramienta para editar archivos en linea evitando así tener que enviar copias por email a todos los colaboradores.
  • Google reader, controla que webs son mas leídas o cuales tienen su tráfico mas fiel.
  • Google calendar, no se le pasa ni un evento y si es interesante quizás actúe en consecuencia.
  • Youtube, sabe lo que vemos, sabe lo que subimos.

Me he dejado muchos otros servicios y factores influyentes pero… Aun no estás asustado? Busca cualquier cosa en Google, pídele a un amigo que haga busque lo mismo y compara resultados.

Acojonante no? Esperemos que todo sea por un bien y no les de por hacer el mal. Pero hasta que punto queremos ser desnudados? O hasta que punto seremos capaces de creernos lo que hay en nuestra burbuja?