Affectation : Unité 1087, l’Institut du thorax, Nantes
Nom du Directeur : Hervé LE MAREC
Missions :
L'ingénieur(e) en analyse de données biologiques conçoit et maintient les outils, les bases de données et les interfaces nécessaires au traitement et à la consultation des données.
Il/elle participe également à l'analyse des données issues de la recherche des équipes de l’unité, en particulier les données issues des techniques de génotypage et de séquençage massif.
En étroite collaboration avec la plateforme de bio-informatique et l'équipe de biostatistiques, il/elle participe à la mise en place de protocoles d'analyses. Il/elle valorise ses résultats et ses outils sous la forme de publications.
Activités :
-
Concevoir et élaborer les outils informatiques nécessaires à l'activité du laboratoire
-
Administrer les serveurs et les clusters du laboratoire
-
Mettre en place des protocoles de traitements des données issues des technologies utilisées sur la
plateforme (principalement séquençage nouvelle génération, génotypage, CGH, ...)
-
Concevoir et élaborer la structure de bases de données et de systèmes d’information permettant de
collecter, structurer, stocker et mettre en relation ces données
-
Diffuser et valoriser les résultats sous forme de rapports techniques, de publications ou de
présentations orales auprès des communautés professionnelles et scientifiques
-
Former, en interne et en externe, aux principes et à la mise en œuvre des techniques de l’analyse
des données biologiques
-
Gérer et maintenir le parc des logiciels hébergés sur les serveurs, maintenir le wiki du laboratoire.
Spécificité(s) du poste :
Astreintes de sécurité liées aux serveurs de calcul et de stockage de l'unité.
Compétences Connaissances :
-
Avoir des connaissances dans le domaine des sciences de la vie qui sont liés aux études du laboratoire (génétique/génomique)
-
Avoir une excellente maîtrise des langages C, C++ et java
-
Avoir une maîtrise des outils et des API usuelles du domaine étudié (samtools, ...), des algorithmes
en bioinformatique, des bases de données publiques (UCSC, NCBI...)
-
Maîtriser le travail sous unix, de l'analyse des données à haut débit et des bonnes pratiques
informatiques, avec en particulier une bonne connaissance des outils usuels de l'analyse des
données de séquençage d'exomes ou de génomes complets (samtools, GATK...), de RNA-seq
-
Avoir la connaissance des technologies liées au web sémantique (RDF, SPARQL)
-
Avoir la connaissance approfondie des méthodes de recueil, d'analyse et de traitement des
données
-
Avoir la connaissance de l’architecture client-serveur, création de modules pour apache/httpd
-
Avoir des connaissances sur le déploiement d'outils sous galaxy.
Savoir-faire :
Savoir travailler sur des clusters de calcul administré par SGE / SLURM
Savoir écrire des programmes robustes en java et C++. Utiliser un système RCS tel que git
Savoir concevoir des interfaces et des services web sous apache tomcat. Programmation de CGI Savoir stocker des données sous HDF5, berkeleydb, mysql, mongodb, leveldb, sqlite
Savoir programmer des extensions pour le logiciel KNIME, ou pour mysql
Savoir manipuler le format XML (DOM, SAX, StaX, XPATH), JSON, SVG)
Posséder une excellente maîtrise de GNU-Make pour l'automatisation des tâches
Maîtriser les systèmes de bases de données relationnelles et non relationnelles (“nosql”)
Maîtriser les formats XSLT, XSD/JXB et les protocoles SOAP/WSDL, HTML, javascript, Ajax ... Maîtriser les technologies Java courantes: servlets/JSP, JPA, JDBC, JAXB, SWING ...
Savoir travailler en équipe
S’adapter aux évolutions technologiques.Aptitudes :
Travailler en interaction avec des biologistes, et des informaticiens Garantir la pertinence des outils d’analyse et des résultats
Maîtriser le français et l’anglais (écrite et orale).
Expérience(s) professionnelle(s) souhaitée(s) :
Double compétence biologie-informatique exigée
Expérience démontrée de l'analyse de données NGS, documentée par plusieurs publications
scientifiques de bon niveau et par le développement réussi d'outils d'interprétation de données NGS.
Diplôme(s) souhaité(s) :
Doctorat en sciences. Diplôme requis :
Doctorat ou diplôme d’ingénieur.