Bioinformática es el uso de las matemáticas y de las técnicas informáticas para resolver problemas biológicos, normalmente creando o usando programas informáticos, modelos matemáticos o ambos. Una de las principales aplicaciones de la bioinformática es la minería de datos (data mining) y el análisis de los datos obtenidos en los proyectos genoma (Proyecto de Genoma Humano). Otras aplicaciones son el alineamiento de secuencias, la predicción de estructuras proteicas y las redes metabólicas.
Bases de datos
Existen bases de datos primarias, que contienen información directa de la secuencia, estructura o patrón de expresión de ADN o proteína, y secundarias, que contienen datos derivados del análisis de las bases de datos primarias, como mutaciones, relaciones evolutivas, agrupación por familias o funciones, implicación en enfermedades, etc.
De nucleótidos
La colaboración de las tres bases de datos más importantes hace posible acceder a casi toda la información de secuencias de ADN desde cualquiera de sus tres sedes:
- EMBL-BANK en el Instituto europeo de Bioinformática (EBI)
- DNA Data Bank of Japan (DDBJ) en el Centro de Información Biológica (CIB)
- GenBank en el Centro Nacional de Información Biotecnológica (NCBI)
De proteínas
Bases de datos de secuencias de aminoácidos.
- Swissprot contiene secuencias anotadas o comentadas, es decir, cada secuencia ha sido revisada, documentada y enlazada a otras bases de datos.
- TrEMBL por Translation of EMBL Nucleotide Sequence Database incluye la traducción de todas las secuencias codificantes derivadas del (EMBL-BANK) y que todavía no han podido ser anotadas en Swissprot.
- PIR por Protein Information Resource está dividida en cuatro sub-bases que tienen un nivel de anotación decreciente.
- ENZYME enlaza la clasificación de actividades enyimáticas completa a las secuencias de Swissprot.
- PROSITE contiene información sobre la estructura secundaria de proteínas, familias, dominios, etc.
- INTERPRO integra la información de diversas bases de datos de estructura secundaria como PROSITE, proporcionando enlaces a otras bases de datos e información más extensa.
- PDB por Protein Data Bank es la base de datos de estructura terciaria 3-D de proteínas que han sido cristalizadas.
De genomas
- Ensembl integra genomas eucariotas grandes, por el momemto contiene genoma humano, ratón, rata, fugu, zebrafish, mosquito, Drosophila, C. elegans, y C. briggsae.
- Genomes server y TIGR son portales con información y/o enlaces de todos los genomas secuenciados por el momento, desde virus a humanos.
- Wormbase es el portal del genoma de gusano C. elegans.
- Flybase es el portal de la mosca del vinagre Drosophila melanogaster.
Otras
- Taxonomy es el portal de clasificación taxonómica de organismos
- Pubmed da acceso gratuito al índice de publicaciones de la Biblioteca Nacional de Medicina (NLM), con enlaces a artículos completos.
- OMIM por Online Mendelian Inheritance in Man es un catálogo de genes humanos relacionados con informaciones genéticas.
Véase también
Enlaces externos