11 comandos para data scientists que quieran aprender a usar la consola

Algunas veces manipular datos puede resultar costoso. A menudo los data scientists tenemos que manipular grandes cantidades de datos por lo que es bueno conocer algunos tranquillos para optimizar el proceso. Aquí os dejo unos cuantos comandos con algunas opciones para trabajar más eficientemente. head head archivo.txt Este comando imprime las 10 primeras lineas del […]

Reducir el tamaño de las imágenes insertadas en un documento de Latex

El otro día estaba escribiendo mi tesis en latex y me di cuenta que las páginas que tenían figuras tardaban mucho en cargar. Llegué a la conclusión que era debido a la complejidad de la imagen. Por lo que después de hacer un poco de investigación encontré la solución. Tenia que convertir todos los pdf […]

Obtener las “chains” separadas de un simple PDB

El otro día peleándome con TM-align para conseguir alineaciones de distintos pdbs que parecieran razonables me di cuenta que dicho programa tiene problemas con las proteínas multi-dominio. La solución que le encontré fue en bajarme los PDBs y luego separar las chains. Aquí os dejo el script. [code language=”python”] import re import os #Idea: https://www.biostars.org/p/59715/ […]

Script en python para convertir secuencias de proteínas de Stockholm a fasta

Aquí os dejo un pequeño python script que convierte “multiple sequence alignments” del formato Stockholm a Fasta de una forma sencilla y rápida. [code language=”python”] import sys from Bio import SeqIO from Bio.Seq import Seq from Bio.SeqRecord import SeqRecord if(len(sys.argv) <3): print(‘two arguments needed: input path, output path’) exit(2) with open(sys.argv[1],’r’) as inFile: with open(sys.argv[2], […]

Manual para instalar OpenVPN en Ubuntu con script

Hace ya algun tiempo me hice con un servidor y lo voy usando para hacer mis cosicas. Como por ejemplo instalar rTorrent para poder bajarme ficheros el cual estuvo acompañado de otro post para mover ficheros entre el servidor y mi ordenador. Esta vez lo que quiero hacer es usar el server como túnel para […]

Que formato es el mejor para guardar números con decimales (float)?

Hace ya algunos días que le estoy dando vueltas al crear un script que me cogiera determinados datos y los fuera guardando en un archivo. Como quiero guardar muchos datos durante un largo periodo de tiempo he pensado que quizás debería empezar por lo básico. Que formato de archivo es mejor para almacenar este tipo […]