Archivo de la categoría: Academia

Resumen de la charla: Como escribir una publicación científica increíble por Simon Peyton Jones

Prof. Simon Peyton Jones expone siete puntos que – en base su opinión – una publicación científica debería seguir. El vídeo en si dura 30 minutos en los que repasa los puntos más importantes a seguir al publicar un manuscrito. Prof Jones recomienda que se empiece a escribir el manuscrito antes de empezar a investigar. Durante la escritura intenta ser simple – pero no simplista – y entendible. Sigue una estructura lógica y “reparte amor”. Os dejo el vídeo al final del post. El vídeo está en ingles pero es muy recomendable.

La primera idea que expone es que normalmente cuando tenemos una idea, empezamos a investigar y cuando tenemos suficiente material condensamos los resultados en un paper. Basado en la experiencia de Simon lo que tendríamos que hacer es tener la idea, pero luego empezar a escribir y después a investigar y pulir el texto con los resultados.

Porque tenemos que empezar a escribir después de la concepción de la idea y no investigar? Si empezamos a investigar nos desviamos del objetivo. Al empezar a escribir y exponer el proceso dejamos constancia de los pasos a seguir para llegar al objetivo, plasmamos las ideas que tenemos para el proyecto, nos fuerza a focalizarnos evitando que divagamos con sub-proyectos que nos lleven a ningún sitio. La escritura nos ayuda a desarrollar la literatura y evitar que la idea ya este publicada. También nos ayuda a pensar profundamente en el proyecto, ya no es sólo una idea que puede funcionar. Ahora ya es una idea en la que le estamos poniendo foco y pensamientos, para concretar y delinear el ámbito

Al empezar a escribir tenemos que tener algo muy claro en mente. Tenemos que pensar que al escribir un paper no lo hacemos para nosotros mismos, escribimos papers para los demás. Con los papers pretendemos comunicar conocimientos a otras personas. Queremos transmitir la idea que tenemos en nuestra mente a otras mentes. Para transferir conocimiento satisfactoriamente, el articulo científico tiene que ser entendible para terceros. El “yo ya me entiendo” no vale. La idea básica tiene que ser fácimente asimilable. Declara el concepto del paper abiertamente y de forma directa, no esperes que tus lectores tengan que hacer trabajo de detective para averiguar que conocimientos quieres transmitir. Si tienes más de una idea no intentes ponerlas juntas en el mismo paper. Sepáralas en distintos papers. Obviamente tampoco pretendas dividir una idea en mini-ideas para que puedas publicar miles de papers a la vez. Intenta que la idea de un paper tenga suficiente consistencia pero sin intentar comprimir demasiada información a la vez.

Cuando expongas una idea en un paper hazlo de una forma fácilmente entendible. Hazlo del mismo modo que lo harías en frente de una audiencia. Empieza describiendo tu problema, porque es interesante, porque no esta solventado, expón tu idea, explica porque funciona (con explicaciones y información), y termina comparando tu solución con otras soluciones. Estos pasos se traducen a un esqueleto muy claro que el manuscrito va a seguir.

  1. Título
  2. Abstracto (4 frases)
  3. Introducción (1pag): Aquí vas a describir el problema y exponer las contribuciones que haces a la humanidad. Cuando expongas el problema que no te de pereza a personalizarlo con un ejemplo ficticio. Escribe las contribuciones temprano y re-escríbelas después. Ponlo en formato de bullet points para facilitar el escaneo y dejarlas claras. Cuando escribas las contribuciones de este modo puedes añadir referencias a las secciones en las que solventas el problema. De este modo podrías enlazar tus contribuciones con las soluciones facilitando el lector la ubicación de lo que busque sin desperdiciar su tiempo ni hacer un párrafo aburrido como la lista de la compra.
  4. El problema (1pag)
  5. Mi idea (2pag)
  6. Los detalles (5pag)
  7. Trabajo relacionado (1-2pag) Referencia otros trabajos y compáralos con tus aportaciones. Simon recomienda ponerlo en una ubicación tan avanzada dentro del manuscrito porque de este modo ya habrás tenido tiempo para exponer teorías y conceptos para entender las diferencias. Esto también impedirá que el lector gaste energía y concentración leyendo algo que “no aporta” ya que no hace referencia a tu trabajo ni tus contribuciones de manera directa. Cuando el lector llegue a este punto, el apartado va a ser un tramite mas ya que tendrá construido los conocimientos para seguir el apartado sin mayor complicación.
  8. Conclusiones & trabajo futuro (0.5 pag) Este apartado es cortito. A nadie le interesa leer que quieres hacer mas adelante. Y la idea ya ha sido descrita. Así que este apartado es conciso.

Cuando compares tu trabajo con el de otras personas no uses la máxima: “para que tu trabajo se vea bien tienes que hacer que el trabajo de los demás parezca malo”. Aquí es dónde tienes que “repartir amor”. Repartir amor no va a hacer que tu trabajo se vea peor. Usa frases como “este paper me ha inspirado”, “este paper han tenido una idea muy buena”, “la implementación de este es impecable”, etc. Los autores de los otros papers lo agradecerán y a la larga crearás menos hostilidades. Al comparar describe también tus debilidades. Nada es perfecto. La implementación puede ser mucho mas rápida pero un poco menos precisa, quizás esta sea un sacrificio que muchos estén dispuestos a hacer. Además te elevara a los ojos de los revisores ya que no les parecerá que estas ocultando cosas.

Cuando expongas la idea empieza con la intuición, un problema especifico y luego expande hacia la generalización. Si empiezas con la generalización para empezar el lector va a tener más problemas para entender la idea.

Al exponer la solución no vayas diciendo probé esto pero no funciono, probé lo otro y no funciono. Esto no sirve de nada. La gente quiere saber que hiciste para solucionar el problema. En algunos casos se pueden incorporar al paper ideas que probaste y no funcionaron, pero con una finalidad. A veces algo que parece muy obvio de entrada puede no funcionar. Si este es el caso, para evitar que otros caigan en el mismo error o los revisores sugieran otra implementación puedes exponer algunas ideas fallidas. Pero nunca lo hagas de modo sistemático y mucho menos con todas las ideas frustradas.

Si el proceso te ha llevado hasta aquí ya tienes todo el paper escrito. Ahora va a tocar pulirlo. Para pulir el manuscrito tienes que pedir ayuda externa. Otro par de ojos a menudo ven cosas que no hemos visto. Pregunta a amigos que lean el paper y te den consejos. Ten en cuenta que por definición cualquier persona va a poder leer el paper por primera vez  solo una vez. No pidas a todos que lean tu paper a la vez. Pídeselo a uno escucha el feedback, corrige y así sucesivamente. Una vez han leído el paper ya van a tener la idea en mente y les va a ser más fácil entender el manuscrito que si lo leen por primera vez.

Cuando pidas a alguien que lea tu articulo especifica en que quieres que se concentren/focalicen. Si lo has terminado de escribir lo importante es que sea entendible, ameno y no se pierdan. Una vez tengas estos problemas solventados sera importante que no tengas errores ortográficos, que uses una buena gramática y seas más detallista.

Cuando alguin no entiende el paper no es su culpa! Importante cuando alguien te de feedback úsalo como oro. No son ellos que son tontos eres tu que no te has explicado adecuadamente. Es mejor que sean tus amigos quienes te digan que no lo han entendido y no que el journal te rechace el articulo. Y aun así, cuando el journal te rechaza el articulo, te va a dar feedback, úsalo! Cualquier pieza de feedback es valiosa para intentar mejorar y avanzar. No lo hacen para joder o porque son malos.

Para finalizar también puedes pedir feedback a personas que has referenciado en tu paper. No abuses de esta técnica. Pero puedes mandar un email a algún autor que no conoces y decirle que lo has referenciado y que si le importaría comentarte que les parece el articulo. Lo dicho no abuses y trata cualquier pieza de feedback como oro. Ya que te están dando algo que nadie puede comprar, tiempo.

Espero que te haya gustado. Si conoces otra charla igual de interesante sobre como escribir artículos o tienes algún otro consejo no te olvides de dejar un comentario!

 

 

SCORE: Usando metodologías ágiles para gestionar equipos de investigación

Con la introducción al agile creé el primer post de la serie, seguido de los post explicando las distintas facetas del Scrum (con los roles y el flujo de trabajo) hoy vengo con una aplicación directa para los equipos de investigación. Los grupos de investigación son grupos de gente que trabajan en el plano de las ideas. Al igual que los desarrolladores de software al final del día no crean ningún producto tangible solo ideas, información, conocimiento, pero nada que puedas tocar.

Hace ya bastantes años algunos de los grupos de investigadores de la universidad de Maryland (USA) decidieron implementar una nueva metodología para la supervisión de sus estudiantes, ya sean de grado, máster, doctorado o post-doc. Una metodología que se adaptara a las necesidades de cada individuo y no a las del título que ostentasen.

Esta implementación vino dada debido a la falta de tiempo que empezaban a sufrir los profesores. Con el incremento de estudiantes y responsabilidades cada vez tenían menos tiempo para dedicar a los estudiantes. Así que decidieron crear e implementar la metodología SCORE. Score proviene de SCrum fOr REsearch.

La idea principal consiste en reducir la carga de meetings a los que los miembros del grupo están sujetos sin comprometer la calidad del trabajo. Para conseguir optimizar el tiempo que pasan los profesores con sus alumnos crearon dos tipos de meetings. 15min meeting y los 1 on 1 meeting on demand.

  • Los 15min meetings tienen sitio tres veces por semana y como indica su nombre duran 15 minutos. Estos meetings, al igual que scrum, se hacen de pie para asegurar la brevedad de este. Durante este tiempo es requerido que todos los miembros del grupo acudan presencialmente y a modo excepcional lo hagan por videoconferencia. En el meeting todos los asistentes tienen que responder a tres preguntas:
    1. Que has hecho des de tu último meeting?
    2. Que problemas te has encontrado?
    3. Que quieres hacer para el próximo meeting?

    Al ser meetings tan frecuentes no pasa nada si algunas veces se responde que no ha habido resultados significativos.

  • El segundo tipo de meetings son los 1 on 1 meetings on demand. Que traducido sería meetings a título individual pero que se tiene que pedir cita. Con este tipo de meetings la idea es intentar reducir los meetings periódicos que solo roban tiempo. No siempre se requiere la misma duración para un meeting. Algunas veces los meetings precisan 15min y otras 2h porque la tarea es más compleja. Al pedir el meeting ya sabes de lo que se va a hablar y no va a ser una pérdida de tiempo.

Los estudiantes parecen bastante satisfechos con la nueva organización del laboratorio. Los profesores también parecen satisfechos con el resultado. Y a mi personalmente me parece interesante que hayan suprimido el meeting semanal que muchos grupos tienen en los que se presenta a lo grande.

 

Referencias:

Un doctorado sirve para continuar en academia o salir para industria

Un doctorado o PhD en si tiene muchas finalidades. Para lo que sirve hacer un PhD depende de cada persona y las aspiraciones que tenga cada uno en la vida. Si te quieres dedicar a la investigación o ser profesor universitario es la única salida. Pero en algunas empresas tener un doctorado conlleva una serie de connotaciones (mayoritariamente positivas). Una persona que se ha sacado el doctorado es una persona que ha trabajado duramente durante un largo periodo de tiempo para conseguir profundizar en un tema extremadamente especifico. Po lo cual una persona que ha conseguido dicho nivel de especialización puede resultar altamente atractiva para empresas que busquen un perfil muy concreto.

La otra alternativa es que tengas empresas pretendientes gracias a las soft-skills adquiridas durante ese tiempo. Por ejemplo, las empresas alemanas valoran los doctorados para posiciones directivas. A los alemanes les gustan los doctorados en el management porque son personas que en teoría tienen una buena ética de trabajo. Durante el PhD los estudiantes han tenido la oportunidad de pensar, y planificar proyectos, gestionar estudiantes y aprender organización general. También han aprendido a comunicar conceptos no triviales de la mejor manera posible, organizar las ideas de forma lógica y adquirir conocimientos ajenos de manera rápida. Finalmente gracias al requisito general de publicar los resultados de la investigación, los doctorados han aprendido también a expresarse de forma escrita de manera concisa y directa.

Resumen del paper: Análisis de datos topológicos

Recientemente me encontré un par de papers relevantes para la minería de datos (data mining). Incluso hay una empresa que basa su business model en este concepto (Ayasdi). El concepto como habéis podido leer en el titulo es análisis de datos topológicos. ¿Que significa esto? La ida principal, tal y como se expone en la Figura 1 (sacada del paper [1]), se basa en que los datos tienen forma y la forma es consistente. Por ejemplo, la letra “A” seguirá siendo la misma letra a pesar de que le apliquemos distintas transformaciones ya que la información obtenida es calculada en base a las distancias relativas. Podemos rotar los datos, hacia un lado u otro. Podemos cambiar la tipografía o la forma (aplastarla o extenderla) que seguirá siendo la misma letra. Al final la letra “A” esta formada por millones de puntos que no vemos. Quizás perdemos algo de detalle especifico pero se gana en visión global.

descripción gráfica de la letra A
Figura 1: Transformaciones aplicadas a la letra A siguen formando la misma letra. Extraído de [1]
El primer paso consiste en agrupar en sub-poblaciones en bins (contenedores). En el segundo paso estas divisiones son analizadas. Cada uno de los contenedores contiene puntos que son similares el uno al otro. Como los bins han sido divididos de tal forma que solapan entre ellos por lo que cada punto de nuestros datos pueden estar en más de un grupo. Finalmente para construir la red (network) dibujamos un link entre los distintos clusters de la network final.

Para empezar a construir la red tenemos que escoger la métrica y la lente. La métrica la usaremos para medir la similitud (o distancia) entre dos puntos mientras que la lente es una función matemática para observar los datos. Cualquier métrica que sirva para producir un numero de un punto puede ser una lente. Una lente puede ser la media, max, min, el centro, PCA-score, distancia SVM, entre otros. Se pueden agrupar los resultados de distintas lentes multiplicando el resultado de los outputs.

El vector unitario producido por a lente es dividido en subgrupos que se solapan. Todos los puntos que tienen valores de lentes en el mismo subgrupo se agrupan juntos en un contenedor. De esta forma distintas particiones son obtenidas para todos los puntos gracias al resultado de la lente. Como las lentes producen sets que solapan es posible que un punto este en múltiples contenedores. Todos los puntos en un contenedor son agrupados ya que todos los puntos son altamente similares entre si y este grupo representa un simple nodo de nuestra red. El color que le asignaremos es la media del color de la lente de este grupo. El nodo en su representación gráfica tiene un tamaño proporcional al numero de puntos que tenga el cluster.

Habiendo hecho lo pasos anteriores tendremos distintos nodos en nuestra red, con diferentes tamaños y colores. Los nodos se conectaran entre si cuando tengan puntos en común. Estos links generaran la red topológica final.

Tenemos que tener en cuenta que esta implementación tiene dos parámetros. Uno es la resolución que indica el numero de contenedores en los cuales vamos a partir los datos. Una baja resolución genera unos pocos nodos gruesos sintetizando la información generada por el algoritmo. Contrariamente si la incrementamos genera muchísimos nodos pero de un tamaño mas pequeño perdiendo similitud entre nodos incluso generando clusters aislados. El segundo parámetro se llama ganancia y controla las regiones que se solapan entre contenedores. Como mas grande sea la ganancia mas aristas (conexiones entre nodos) vas a obtener el tu red. Este parámetro resalta las relaciones entre los elementos de tus datos.

No hay unos valores óptimos para la resolución y la ganancia. Cada red es singular y sus parámetros tienen que ser escogidos acordemente. También depende de lo que se quiera observar en la red. Por lo que cada análisis requerire una afinación (tuning). Tened en cuenta que una resolución alta no siempre es lo mejor, ya que al final lo que puede producir un resultado muy similar al observar los datos directamente

Ya hemos explicado todas las ventajas ahora toca exponer algunas de sus desventajas. No es ninguna “magic bullet” puede funcionar para muchos casos pero hay otros en los que este algoritmo no sea el mejor para nuestros datos. No hay una sola solución que sea buena para todos los casos. Parte del problema es que es una ciencia con un alto componente matemático. Como los principios del deep learning, hasta que no haya implementaciones eficientes y fáciles de usar, la “gente normal” se va a abstener de usarlo. Finalmente, el coste computacional. Calcular todos los pasos es extremadamente costoso ya que se tienen que hacer distintos barridos sobre los datos e incluso calcular las distancias entre pares.

Para los que os vaya la marcha os dejo un vídeo de youtube. Se trata de un seminario en Standford donde se explica extremadamente bien el concepto (en ingles). Luego os dejo una presentación en slideshare donde se explica el concepto detalladamente. Y para terminar os dejo tres referencias que he usado para escribir este post y que si entendéis inglés las recomiendo encarecidamente que les echéis un vistazo.

 

 

Archivos multimedia para profundizar en el TDA

 

Referencias:

 

  1. Offroy, M., & Duponchel, L. (2016). Topological data analysis: A promising big data exploration tool in biology, analytical chemistry and physical chemistry. Analytica chimica acta910, 1-11.
  2. Nielson, J. L., Paquette, J., Liu, A. W., Guandique, C. F., Tovar, C. A., Inoue, T., … & Lum, P. Y. (2015). Topological data analysis for discovery in preclinical spinal cord injury and traumatic brain injury. Nature communications6, 8581.
  3. Chazal, F., & Michel, B. (2017). An introduction to Topological Data Analysis: fundamental and practical aspects for data scientists. arXiv preprint arXiv:1710.04019.

Un Doctorado o PhD es un académico que se ha hiper-especializado en un campo

Doctores hay de diversos tipos. Hay el doctor con el que todos pensamos al oír la palabra; el doctor que es medico. En los países anglosajones los doctores médicos usan la abreviatura MD. Pero los doctores en el sentido de PhD (Doctor of Philosophy) son otro tipo de doctores, en este caso son académicos. El titulo de doctorado (Ph.D.) los daban originalmente las universidades a las personas que conseguían la aprobación de sus iguales. Para conseguir dicho titulo los académicos tenían que demostrar una larga y productiva trayectoria profesional en el área de la filosofía. La palabra filosofía en este caso se refiere en el sentido mas amplio de la definición, en la búsqueda de conocimientos. Sólo personas con trayectorias profesionales avanzadas que han dedicado su vida a profundizar y expandir sus conocimientos.

Actualmente el título de doctorado (PhD) es concedido a las personas que pasan de tres a cinco años investigando. En algunos países de Europa el doctorado se puede empezar después de hacer un máster/maestría y duran por lo menos tres años. En el caso de estados unidos los doctorados son más largos ya que no requieren un titulo de master y por lo tanto incluyen clases para adquirir conocimiento especializado en el campo.