Les données Hi-C fournissent une information sur l'organisation tridimensionnelle du génome à partir de mesures d'interactions entre positions génomiques le long de la chromatine. Cette structure en trois dimensions a un rôle important dans la régulation
de l'expression des gènes. L'objectif de l'analyse différentielle est d'identifier, à partir de réplicats obtenus dans deux conditions biologiques différentes, des régions génomiques qui présentent des différences significatives de structure entre les deux conditions. Ici, nous proposons de nous appuyer sur une modélisation hiérarchique des données Hi-C, permettant de tenir compte de la dépendance spatiale présente dans ce type de données. En utilisant un travail précédent permettant de représenter les données par des arbres et de les utiliser pour réaliser des tests, on peut, à partir de régions définies a priori, identifier celles qui sont d'intérêt. On s'intéresse ici au développement d'une méthode permettant d'identifier automatiquement de telles régions.
- Poster