Scripts

How to add ROC AUC as a metric in Tensorflow / Keras

Posted on March 19, 2020

The way to add the ROC AUC as a metric on your Tensorflow / Keras project is to copy this function that computes the ROC AUC and use the function name in the model. The function only requires a little customized tf code. To use the function in the model. We first need to compile with the function passed directly and not a string (as it is shown in the example below). Then we can use it in the callbacksRead More

11 comandos para data scientists que quieran aprender a usar la consola

Posted on July 31, 2018

Algunas veces manipular datos puede resultar costoso. A menudo los data scientists tenemos que manipular grandes cantidades de datos por lo que es bueno conocer algunos tranquillos para optimizar el proceso. Aquí os dejo unos cuantos comandos con algunas opciones para trabajar más eficientemente. head head archivo.txt Este comando imprime las 10 primeras lineas del archivo. Si queremos un numero distinto de lineas podemos usar la opción -n. head -n 20 archivo.txt Este último comando nos imprimirá las 20 primerasRead More

Reducir el tamaño de las imágenes insertadas en un documento de Latex

Posted on September 29, 2017

El otro día estaba escribiendo mi tesis en latex y me di cuenta que las páginas que tenían figuras tardaban mucho en cargar. Llegué a la conclusión que era debido a la complejidad de la imagen. Por lo que después de hacer un poco de investigación encontré la solución. Tenia que convertir todos los pdf a png (u otro tipo de formato de imagen). El script convierte todos archivos de un directorio de pdf a png. Con cada iteración delRead More

Obtener las "chains" separadas de un simple PDB

Posted on September 25, 2017

El otro día peleándome con TM-align para conseguir alineaciones de distintos pdbs que parecieran razonables me di cuenta que dicho programa tiene problemas con las proteínas multi-dominio. La solución que le encontré fue en bajarme los PDBs y luego separar las chains. Aquí os dejo el script. [code language=”python”] import re import os #Idea: https://www.biostars.org/p/59715/ list_path = ‘list-DLG4_HUMAN.txt’ db_path = ‘/n/scratch2/rr191/databases/pdb2/’ with open(list_path, ‘r’) as f_pdb: for pdb in f_pdb: #Getting the info from the pdb to download structure =Read More

Script en python para convertir secuencias de proteínas de Stockholm a fasta

Posted on May 15, 2017

Aquí os dejo un pequeño python script que convierte “multiple sequence alignments” del formato Stockholm a Fasta de una forma sencilla y rápida. [code language=”python”] import sys from Bio import SeqIO from Bio.Seq import Seq from Bio.SeqRecord import SeqRecord if(len(sys.argv) <3): print(‘two arguments needed: input path, output path’) exit(2) with open(sys.argv[1],’r’) as inFile: with open(sys.argv[2], "w") as output_handle: SeqIO.write(list(SeqIO.parse(inFile,’stockholm’)), output_handle, "fasta") [/code]

Manual para instalar OpenVPN en Ubuntu con script

Posted on October 20, 2015

Hace ya algun tiempo me hice con un servidor y lo voy usando para hacer mis cosicas. Como por ejemplo instalar rTorrent para poder bajarme ficheros el cual estuvo acompañado de otro post para mover ficheros entre el servidor y mi ordenador. Esta vez lo que quiero hacer es usar el server como túnel para evitar contenidos restringidos en el país dónde estoy y mejorar la seguridad en redes abiertas. Primero de todo tendremos que instalar el software necesario. ParaRead More

Que formato es el mejor para guardar números con decimales (float)?

Posted on August 18, 2015

Hace ya algunos días que le estoy dando vueltas al crear un script que me cogiera determinados datos y los fuera guardando en un archivo. Como quiero guardar muchos datos durante un largo periodo de tiempo he pensado que quizás debería empezar por lo básico. Que formato de archivo es mejor para almacenar este tipo de datos. Para averiguar que formato es el ideal para tal propósito he ideado un script en python que lo que hace es generar cuatroRead More