Analyse des données RNA-Seq sous l’environnement Galaxy, Lyon 2019
Sessions
20, 21, 22 novembre 2019, Lyon
Lieu : PRABI Campus de la Doua - Villeurbanne
Durée
2,5 journées - 17,5 heures
OBJECTIFS
Connaître les caractéristiques des données de séquençage haut-débit obtenues dans le cadre de l’analyse du transcriptome (RNA-seq).
Savoir planifier une expérience simple de type RNA-seq en fonction de ses objectifs scientifiques et des caractéristiques et contraintes expérimentales.
Connaître les principales méthodes et outils d’analyse des données RNA-seq. Pouvoir les mettre en oeuvre dans un cas simple via un serveur web Galaxy.
Pouvoir visualiser les résultats dans un navigateur de génome.
PROGRAMME
Théorie - Introduction générale, Méthodes de séquençage
- caractéristiques des jeux de données de séquences
- présentation générale des problématiques de calcul et de stockage de données NGS
- formats de fichiers
- analyse qualité
- base de données Short Read Archive
Pratique - Récupération des données, Analyse qualité
Théorie - Introduction à Galaxy
- Présentation de l’interface web de Galaxy
- vue d’ensemble des outils d’analyse de données NGS disponibles sous Galaxy
- introduction à la création et au partage de Workflows/ “Chainage de Tâches” sous Galaxy
- Présentation de l’instance Galaxy du PRABI - (support informatique des TD et guichet de services)
Théorie - RNA-seq : Objectifs, Plan d’expérience et Analyse de Données
- Transcriptomes procaryote, eucaryote
- Objectifs biologiques
- annotation, mesure de l’expression (analyse différentielle), recherche des isoformes d’un gène et quantification, recherche de variants SNP...
- Acquisition expérimentale
- Choix techniques expérimentaux en fonction des objectifs (longueurs des séquences, profondeur de séquençage, déplétion des ARN ribosomiques, séquençage orienté...)
Importance du plan d’expérience
- Alignement des séquences sur un génome de référence
- sans épissage (Bowtie), principe, format de fichiers
- avec épissage (Tophat, STAR, HISAT2...)
- analyse qualité des alignements
- visualisation (navigateur UCSC, IGV)
- Quantification et Analyse différentielle
- attribution des lectures aux gènes ou aux transcrits et quantification (htseq, cufflinks, stringtie, kallisto...)
- notion de RPKM, TPM
- notions de statistiques utiles pour les analyses de données de séquences haut-débit
- analyse différentielle de l’expression des gènes (normalisation, DESeq2, tests multiples )
- Sans génome de référence : assemblage de novo de trancriptome
- présentation de Trinity : assemblage de transcrits
Pratique - RNA-seq - Expression Différentielle
- pipeline hisat2 / stringtie
- pipeline hisat2 / htseq / DEseq2
- samtools, RSeqQC, IGV
Pratique - RNA-SEQ sans génome de référence
MODALITES PRATIQUES
Public concerné
Biologistes (Chercheurs, ingénieurs, étudiants) ayant en projet ou en cours des expériences de RNA-seq
Pédagogie
Effectif maximum : 12 Personnes
Remise de support de cours
La formation sera sanctionnée par une attestation de formation.
Stage à 50% pratique
Chaque auditeur disposera d’un poste informatique individuel pendant la formation.
Intervenants
Mme C. Oger
Frais pédagogiques
1200 € HT
Auditeurs académiques 1050 € HT
Les repas sont pris en charge par Biosciences&Co
INFORMATIONS ET INSCRIPTIONS
Biosciences&Co / Dr Jean-François Prost jf.prost@biosciencesco.fr
Tél : +(33) 4 37 66 26 55 / P. 06 27 58 28 66
30, Rue Pré Gaudry, 69007 LYON
Site Web