Analyse de transcriptome

 

Expression différentielle

Objectifs

L'analyse d'expression différentielle permet de comparer le niveau d'expression de chaque gène entre deux conditions afin de rechercher des gènes biomarqueurs, c'est à dire des gènes exprimés de façon différentielle entre ces deux conditions. C'est une approche exhaustive qui comporte plusieurs avantages:

  • Pas de connaissance préalable requise sur l'organisme étudié.
  • Analyse de l'ensemble du transcriptome sans à priori de départ sur les gènes d'intérêt.
  • Possibilité d'utiliser les données de séquençage pour générer un transcriptome de novo.

 

Mapping

Le mapping est un alignement de séquences courtes (typiquement des reads issus de séquençage Illumina) sur une référence au format FASTA.  L’étape de mapping sert à mesurer le niveau d'expression de chaque gène dans chacune des conditions à comparer.

 

Exemples d’applications

  • Médicale: recherche de gènes biomarqueurs d'une maladie ou d'une infection.
  • Pharmaceutique: recherche de gènes permettant de prédire la réponse à un traitement.
  • Agronomique: recherches de gènes impliqués dans la réponse à un stress (hydrique, salin ...).

 

Outils utilisés

  • Trinity: Assemblage du transcriptome de novo (optionnel).
  • Bowtie2: Réalignement des reads sur le transcriptome ou le génome.
  • Suite logicielle rsem / EBSeq: Mesure du niveau d'expression de chaque transcrit et comparaison du niveau d'expression entre les différentes conditions.

 

Pré-requis

  • Pour chaque condition : Séquences au format FASTQ issues du séquençage d'un ou plusieurs transcriptomes. Il faut au minimum 10-15M de reads par échantillon ainsi que des duplicats (ou triplicats conseillés) pour chacune des conditions :bioinformatics-2013-liu-bioinformatics-btt688.pdf
  • Transcriptome ou génome de référence (optionnel). le transcriptome de référence peut être généré par unassemblage de novo des reads.

 

Rendu client

Fichiers de comparaison au format CSV, Heat map (option).

 

Délais de réalisation

Paramètres à prendre en compte

  • Disponibilité du transcriptome ou génome de référence
  • Nombre d'échantillons
  • Nombre de comparaisons à effectuer

  

A titre d’exemple

Une analyse d'expression différentielle (sans assemblage) comportant 24 comparaisons sur 18 conditions en duplicat nécessite 3 à 4 jours de calculs.

 

Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.