Análisis CB1

En esta página se adjunta la información complementaria al artículo “Análisis Bioinformático del receptor cannabinoide humano de tipo 1” para la asignatura de Bioinformática de 3º en el Grado en Biotecnología de la Universidad de Salamanca

BLAST

Las distintas búsquedas realizadas pueden descargarse aquí:

CB1_default_NOTpred_hyp

Búsqueda con parámetros por defecto con una query Entrez para eliminar proteínas predichas e hipotéticas

Search     Alignment     BLASTSeqs

CB1_500_10_6_B45_12;2_NOTpred_hyp

Ampliación a 500 hits, y cambio de matriz y de penalización por huecos (B45, 12;2)

Search     Alignment     BLASTSeqs

CB1_500_10_3_B45_12;2_NOTpred_hyp_ANDcann

Añadimos al query Entrez que el nombre de la proteína coincida con “Cannabinoid receptor 1”

Search     Alignment     BLASTSeqs     BLASTnr221 (Archivo con 221 secuencias no redundantes seleccionadas a mano de un total de 270)

CB1_ref_500_10_2_B45_12;2_NOTpred_hyp

Limitar la búsqueda a RefSeq

Search     Alignment     BLASTSeqs     BLASTSelected (22 secuencias usadas para el resto de análisis)

CB1_ref_hum_500_10_2_B45_12;2_NOTpred_hyp

Búsqueda de proteínas homólogas en humanos en vez de ortólogos en otras especies de cordados

Search     Alignment     BLASTSeqs     BLASTSelected (41 secuencias para continuar con el análisis)

CORE

Esta herramienta permite comparar distintos alineamientos. Se descargaron las páginas de resultado: Core

Jalview y MEGA7

El archivo del proyecto Jalview con el que se trabajó finalmente: JalviewPoject

Los archivos con las secuencias alineadas en formato fasta, clustal y mega: AlignmentFiles

Los distintos árboles filogenéticos en formato MEGA7 y PDF:

NeigJoinTree     MaxParsimTree     UPGMATree (Creados a partir de la región conservada 1)

CompleteSeqNJTree (Creado a partir del alineamiento completo)

WebLogo

Gracias a este programa se pudo mostrar de forma gráfica la secuencia de cada zona conservada en forma de logos. Aquí puedes descargar los 7 logos que se crearon: Logos

PRATT & PROSITE

Estas herramientas nos premitieron calcular patrones en el alineamiento de nuestras secuencias y contrastar estos patrones con las bases de datos de proteínas en busca de similitudes. Se guardaron las páginas de resultado de la búsqueda en PROSITE: Patrones

Otros recursos

Para la creación de árboles sin dejar de ceñirme a los requisitos de formato de MEGA, programé un pequeño script para sustituir accesion de genes por sus nombres “legibles”. Además, utilizando SublimeText pude agilizar el procesado de los archivos de texto con su función de búsqueda por expresiones regulares:

REGEXP FASTA     IDesp.py