Informations

Gènes où une mutation invalidante et une amplification du nombre de copies provoquent différentes maladies génétiques


J'essaie de dresser une liste de ces gènes, car ils doivent être strictement réglementés. MeCP2 en est un - il provoque le syndrome de Rett avec une mutation invalidante, mais provoque le syndrome de duplication MeCP2 si son nombre de copies a été augmenté. Quelqu'un en connait d'autres ?


Gènes où une mutation invalidante et une amplification du nombre de copies provoquent différentes maladies génétiques - Biologie

Les conflits d'intérêts Ces auteurs divulguent ce qui suit : Josep M. Llovet est consultant pour Bayer, BMS, Lilly, Blueprint, Celsion, GSK et Boehringer-Ingelheim, et a reçu des subventions de recherche de Bayer, BMS, Blueprint et Boehringer-Ingelheim. Jessica Zucman-Rossi est consultante pour IntraGen. Les autres auteurs ne révèlent aucun conflit.

Le financement Jessica Zucman-Rossi est boursier de la Ligue Contre le Cancer et de l'INCa avec le projet ICGC. Josep M. Llovet a reçu des subventions du programme-cadre 7 de la Commission européenne (Heptromic, numéro de proposition 259744), de la Samuel Waxman Cancer Research Foundation, du programme Grant I+D (SAF2013-41027) et de l'Asociación Española Contra el Cáncer (AECC).

Les noms d'auteur en gras désignent la co-première paternité partagée.


Fond

L'aneuploïdie, le phénomène selon lequel les génomes acquièrent ou perdent des fragments chromosomiques, a été causalement impliquée dans une grande variété de maladies humaines telles que les troubles neuropsychiatriques et le cancer [1,2,3]. La plasticité génétique et phénotypique résultant de l'évolution de l'aneuploïdie provoque des résistances aux traitements et des récidives de la maladie [4,5,6], ce qui remet fondamentalement en question la médecine actuelle. Des études récentes ont montré que non seulement les tissus malades, mais aussi les tissus pathologiquement normaux peuvent contenir un degré élevé de mosaïcisme somatique (par exemple, le sang périphérique [7] et l'œsophage [8]). Par conséquent, définir quelles altérations du nombre de copies (CNA) provoquent la pathogenèse et lesquelles font partie des variations normales devient de plus en plus importante en médecine génomique, en particulier pour le cancer [9, 10].

Divers efforts ont été déployés pour obtenir une connaissance complète des ANC responsables du diagnostic, du pronostic et des thérapies ciblées du cancer. L'analyse systématique du CNA dans plus de 10 000 échantillons de tumeurs primitives de l'atlas du génome du cancer (TCGA) et de 2500 échantillons de l'International Cancer Genome Consortium (ICGC) a révélé des paysages distincts du CNA dans différents types de cancer [11,12,13]. La comparaison des CNA parmi les tumeurs autologues obtenues à différents stades de différentes histologies a révélé que les CNA sont essentiels pour l'évolution tumorale dans le temps et dans l'espace. Cependant, les études basées sur des échantillons de tissus en vrac ne peuvent pas décrire complètement l'histoire de l'évolution tumorale, qui se produit en résolution unicellulaire [14], et ont donc un pouvoir limité pour découvrir les moteurs génétiques associés.

Les progrès récents dans le séquençage de l'ADN monocellulaire (par exemple, l'approche basée sur la tagmentation [15] et la solution CNV monocellulaire par le 10x Genomics) ont permis l'acquisition à grande échelle de profils de nombre de copies monocellulaires (SCCN) dans des dizaines de milliers de cellules à une résolution d'environ 100 ko (

0,1X de couverture de séquençage par cellule) [16,17,18,19]. D'autres plates-formes telles que le séquençage d'ARN monocellulaire [20, 21] et le séquençage ATAC monocellulaire [22] ont également été utilisées pour le profilage du SCCN. Un ensemble d'outils bioinformatiques a été développé pour appeler les profils SCCN, en tenant compte de divers facteurs de confusion [23,24,25].

Ces profils SCCN présentent non seulement un riche pool de perturbations génétiques invisibles au niveau tissulaire, mais potentialisent également la reconstruction de la lignée cellulaire, sur la base de laquelle l'impact d'un allèle sur la fitness cellulaire peut être mesuré. Ainsi, les approches statistiques qui intègrent le traçage de la lignée cellulaire avec l'analyse génétique des populations [26] peuvent permettre la découverte de nouveaux gènes de maladie et de mécanismes de progression de la maladie.

Jusqu'à présent, les études effectuant un traçage rétrospectif de la lignée à partir de données unicellulaires ont largement utilisé des approches phylogénétiques conçues pour modéliser l'évolution des espèces, qui est assez différente de l'évolution cellulaire en termes de durée, d'échelle, de génétique et de dynamique [27, 28]. De nombreuses approches phylogénétiques existantes supposent que les sites génomiques évoluent indépendamment et suivent l'hypothèse dite de site infini (ISA) [29]. Mais dans le contexte de l'aneuploïdie, un site génomique peut souvent être altéré à plusieurs reprises par différents CNA, en partie en raison de contraintes sur les structures du génome et de la chromatine, les propriétés de réplication/réparation de l'ADN [30] et la sélection fonctionnelle. Pour appliquer les approches conventionnelles de parcimonie maximale sur les données du SCCN, il faut sur-segmenter les régions génomiques et représenter les nombres de copies sous forme de caractères dans des intervalles disjoints, ce qui représente mal les propriétés des ADN et déforme la propension à l'évolution entre les états du nombre de copies. D'autres méthodes conventionnelles utilisant des distances euclidiennes, de Hamming ou corrélationnelles représentent également mal la nature segmentaire et non linéaire de l'évolution du CNA [31], conduisant à une inférence inexacte de la topologie des arbres et des longueurs de branches.

Quelques nouvelles approches phylogénétiques ont été développées pour s'attaquer à ces limitations en introduisant une nouvelle métrique de distance appelée Distance minimale d'événement (MED), qui postule le nombre minimal et la série de gains ou de pertes en une seule copie qui sont nécessaires pour faire évoluer un génome vers un autre. . En particulier, l'algorithme MEDICC [32] déduit un arbre phylogénétique du nombre de copies à partir des profils de nombre de copies alléliques d'un ensemble d'échantillons. Cependant, le problème est NP-difficile [33]. Même les solutions simplifiées ne pourraient être appliquées qu'à des dizaines de génomes et ne sont pas évolutives aux ensembles de données monocellulaires actuels constitués de milliers de cellules. Zeira et al. [34] ont proposé une solution en temps linéaire au problème basée sur une formulation de programmation linéaire en nombres entiers (ILP), mais aucun outil n'a été publié.

Disposer des nouveaux algorithmes d'inférence d'arbre à distance et efficaces était un bon pas en avant, mais on ne sait toujours pas comment identifier les variantes fonctionnelles, étant donné un arbre phylogénétique cellulaire. Intuitivement, les variantes fonctionnelles affectant l'aptitude cellulaire devraient entraîner une modification des fréquences alléliques des variantes dans les populations descendantes, comme l'impliquent les précédentes études multirégionales de phylogénétique tumorale [10, 35]. Cependant, les procédures mathématiques [28, 31] n'ont pas été développées pour quantifier l'impact d'une altération génomique sur un arbre phylogénétique, en tenant compte de la rareté de l'échantillonnage de la population cellulaire, de la multiplicité dans la partition des sous-ensembles et de la propension de l'altération à un emplacement génomique particulier. , etc. [36]


Résultats

Présentation de l'approche DriverNet

Nous avons développé une nouvelle approche algorithmique intégrée (DriverNet) pour analyser les interrogations génomiques et transcriptomiques basées sur la population des (sous) types de tumeurs pour l'identification de mutations motrices pathogènes. Notre approche relie les aberrations génomiques à des modèles transcriptionnels perturbés, informés par des associations ou des interactions connues entre les gènes. Les détails complets de l'algorithme sont décrits dans les méthodes en ligne, mais seront brièvement résumés ici. Représenté schématiquement sur la figure 1C, DriverNet formule des associations entre les mutations et les niveaux d'expression à l'aide d'un graphique bipartite où les nœuds sont : i) l'ensemble de gènes représentant l'état de mutation (la partition de gauche du graphique) et ii) l'ensemble de gènes représentant l'expression aberrante statut dans chacun des patients (la partition de droite du graphique). Pour chaque patient, une arête entre les nœuds sur les partitions gauche et droite du graphique est tracée si les trois conditions suivantes sont toutes satisfaites : i) gène g je est muté chez le patient p de la population (nœuds verts sur la partition de gauche du graphique) ii) gène g j montre une expression aberrante chez le patient p (nœuds rouges sur la partition de droite du graphe) et iii) g je et g j sont connus pour interagir selon des bases de données de voies ou d'ensembles de gènes (un « graphe d'influence » après [18]). Notre méthode utilise ensuite une approche d'optimisation gloutonne pour expliquer autant de nœuds sur la partition de droite du graphe bipartite que possible en utilisant le plus petit nombre de nœuds sur la partition de gauche du graphe de telle sorte que les gènes expliquant le plus grand nombre d'événements d'expression aberrants (par Exemple, g2 dans la figure 1C) sont nommés comme gènes moteurs putatifs. Enfin, nous appliquons des tests de signification statistique à ces candidats sur la base de distributions nulles informées par un rééchantillonnage stochastique.

Ensembles de données

Pour notre analyse, nous avons utilisé quatre ensembles de données accessibles au public qui contiennent des données sur le génome et le transcriptome de plusieurs types de tumeurs (tableau 1). Des descriptions détaillées de l'analyse des ensembles de données et des workflows de pré-traitement sont disponibles dans le fichier supplémentaire 1. L'ensemble de données GBM représente le nombre de copies, les mutations et les données d'expression pour 120 patients atteints de glioblastome multiforme [6] tirés du portail TCGA [19]. Notez que les cas qui avaient à la fois des données de mutation et de nombre de copies ont été inclus dans cet ensemble de données. L'ensemble de données METABRIC [20] représente les altérations du nombre de copies et les données d'expression génique associées pour 997 patientes atteintes d'un cancer du sein. TN représente les mutations validées, le nombre de copies et les données d'expression pour 66 patientes atteintes d'un cancer du sein triple négatif [11]. L'ensemble de données TCGA HGS contient des mutations, un nombre de copies et des données d'expression pour 304 patientes atteintes d'un cancer de l'ovaire séreux de haut grade [7] qui ont été extraites du portail TCGA. Comme pour l'ensemble de données GBM, nous n'avons inclus que les cas qui avaient à la fois des données de mutation et de nombre de copies. Le flux de travail d'analyse des données est illustré schématiquement dans le fichier supplémentaire 2. Les ensembles de données GBM2, TN2 et HGS2 représentent uniquement les mutations et les données d'expression génique pour 140, 66 et 307 glioblastomes, triples négatifs et patients atteints de cancer de l'ovaire séreux de haut grade, respectivement.

L'analyse comparative des performances établit DriverNet comme un algorithme sensible et spécifique

En pratique, les mesures quantitatives avec des techniques standard d'étalonnage de sensibilité/spécificité sont impraticables en l'absence de vérité terrain. Cependant, en raison de la disponibilité de bases de données sur les gènes du cancer bien étudiées, y compris le recensement des gènes du cancer (CGC) [21] et le catalogue des mutations somatiques dans les ensembles de données sur le cancer (COSMIC) [22], nous avons entrepris d'approcher les mesures de performance et de comparer DriverNet avec les deux méthodes concurrentes suivantes : i) une méthode décrite par Masica et Karchin [14], qui utilise des statistiques basées sur la corrélation suivies d'un test exact de Fisher pour associer les mutations aux modèles d'expression génique (appelée « Fisher », voir fichier 1), ii) une méthode décrite dans Youn et Simon [5], qui identifie les gènes pilotes en fonction du taux de mutation de fond, de l'impact fonctionnel sur les protéines et de la redondance dans le code génétique (appelée « Fréquence »). Conformément aux deux approches mentionnées ci-dessus, nous avons supprimé les données du nombre de copies de l'analyse et limité les comparaisons aux données de mutation uniquement (GBM2, TN2 et HGS2, tableau 1), ce qui a entraîné l'exclusion de l'ensemble de données METABRIC car il contenait une aberration du nombre de copies. données uniquement. Nous avons utilisé deux mesures d'étalonnage systématiques comme suit : i) examiner la proportion de prédictions trouvées dans la base de données Cancer Gene Census (CGC) [21] ii) examiner la prévalence des mutations somatiques des gènes candidats conformément à la base de données COSMIC, en supposant que les gènes une prévalence de mutation plus élevée dans la population de patientes correspondante d'intérêt dans COSMIC (glioblastome, cancer du sein et de l'ovaire) sont plus susceptibles d'être des gènes moteurs. Théoriquement, cette mesure devrait favoriser l'approche Fréquence.

Pour évaluer systématiquement la spécificité, nous avons comparé la proportion de prédictions qui étaient présentes dans CGC en fonction des seuils de sensibilité décroissants (Figure 2A, B, C) pour les trois méthodes. Nous avons également examiné la distribution cumulative de la prévalence des mutations dans la base de données COSMIC pour les trois ensembles de données (Figure 2D, E, F). Dans toute la gamme des prévisions les plus élevées produites par DriverNet, la concordance avec CGC était toujours plus élevée que pour Fisher et Frequency dans les ensembles de données GBM2 et TN2. Pour HGS2, DriverNet et l'approche de fréquence ont surpassé la méthode de Fisher. La prévalence cumulée dans l'ensemble de données COSMIC était plus élevée pour DriverNet par rapport aux deux autres approches dans toute la gamme des prédictions les plus élevées, la fréquence étant la deuxième meilleure. Ainsi, DriverNet a besoin de beaucoup moins de prédictions pour capturer la majorité des conducteurs dans l'ensemble de données, ce qui indique une spécificité relative plus élevée.

Analyse comparative des performances DriverNet avec les ensembles de données GBM2, HGS2 et HGS2. (A-C) Concordance avec le Recensement des gènes du cancer pour les approches DriverNet, basées sur la fréquence et basées sur Fisher en fonction du top N gènes classés (sur 200) pour les ensembles de données GBM2, TN2 et HGS2, respectivement. (D-F) Concordance avec la base de données COSMIC (distribution cumulative de la prévalence des mutations dans la base de données COSMIC) pour les approches DriverNet, Frequency-based et Fisher en fonction du top N gènes classés (sur 200) pour les ensembles de données GBM2, TN2 et HGS2, respectivement. Notez que pour l'ensemble de données GBM2, DriverNet nomme 113 gènes comme pilotes candidats, par conséquent, la concordance des gènes DriverNet avec le Recensement des gènes du cancer est tracée pour les 113 candidats.

Pour GBM2 (mutations uniquement), la méthode Frequency a identifié huit gènes : EGFR, IDH1, NF1, PIK3R1, PTEN, RB1, TP53, et FKBP9 comme significativement altéré avec sept d'entre eux trouvés dans CGC (Fichier supplémentaire 3). Au total, DriverNet a identifié 34 gènes (p < 0,05) dont sept des gènes nommés par l'approche basée sur la fréquence (Fichier supplémentaire 4). Plusieurs gènes trouvés dans CGC (PIK3C2G, MDM2, BCR, ERBB2, DDIT3, FGFR1, BRCA2, MET, et PDGFRA) figuraient également parmi les 34 meilleurs gènes nominés par DriverNet. Nous avons détecté RENCONTRÉ comme le gène classé 29e (p = 0,002, muté dans trois cas), ce qui a été rapporté dans [1], suggérant qu'il a été négligé par la méthode Frequency, qui a classé ce gène au 93e rang.

Pour TN2 (mutation uniquement, pas de numéro de copie), la méthode Frequency a identifié cinq gènes : PIK3CA, RB1, TP53, PTEN, et MYO3A comme des gènes significativement altérés par mutation, dont quatre ont été trouvés dans CGC (Fichier supplémentaire 5). Au total, DriverNet a identifié 59 gènes avec p < 0,05, dont quatre ont été nominés par l'approche Fréquence (Fichier complémentaire 6). Une prédiction DriverNet non identifiée par l'approche Fréquence incluse JAK1 (p = 0, classé 13e, muté dans un cas), qui joue un rôle clé dans la signalisation de la prolactine, impliquée dans le cancer du sein [23, 24].

Pour HGS2 (mutation uniquement, pas de numéro de copie), la méthode Fréquence identifiée CSMD3, BRCA1, BRCA2, et TP53 comme des gènes significativement altérés, dont trois ont été trouvés dans CGC (Fichier supplémentaire 7). DriverNet identifié BRCA1, BRCA2, et TP53 en plus des gènes CGC, KRAS, PTEN, KIT, NRAS, RPN1, RB1, PIK3CA, CLTCL1, ATIC, CREBBP, MET, PPP2R1A, CLTC, CTNNB1, BRAF, et TSHR (Fichier supplémentaire 8). BRAF, PIK3CA, KRAS, et NRAS sont des facteurs oncogènes connus et soulignent le pouvoir d'intégration des données d'expression pour désigner des gènes importants mais rarement mutés. De plus, le gène suppresseur de tumeur connu, PTEN, figurait parmi les meilleurs gènes de DriverNet (rang 11e), mais a été négligé par la méthode Frequency, qui a classé ce gène au 525e rang.

Des mutations peu fréquentes modulant les réseaux transcriptionnels figurent en bonne place dans les ensembles de données au niveau de la population

Nous avons ensuite cherché à déterminer la prévalence des conducteurs rares dans les quatre ensembles de données négligés par l'approche basée sur la fréquence pour la prédiction des conducteurs. Nous avons identifié des facteurs significatifs « peu fréquents » (p < 0,05) où le gène d'intérêt a été abrogé par mutation ou altération du nombre de copies (CNA) dans < 2% des cas. En raison de la vérité terrain inconnue en ce qui concerne les conducteurs réels, nous limitons la présentation à ces gènes également trouvés dans le CGC. Cela a abouti à 22 gènes dans METABRIC, 13 gènes dans HGS, 1 gène dans TN et 2 gènes dans GBM (tableau 2). Les conducteurs peu fréquents dans METABRIC étaient PTEN, RB1, MDM2, MYC, CDKN2A, CLTC, CREBBP, GNAS, EGFR, CCNE1, EP300, CBL, PIK3R1, JAK2, TP53, NUP98, PIK3CA, IDH2, KRAS, et TRA@. Les deux PIK3CA (deux cas avec des amplifications de haut niveau) et PIK3R1 (deux cas avec des délétions homozygotes) ont été altérés dans 0,19% des cas, et ont pourtant montré des preuves de conduite des niveaux d'expression des gènes connectés aux queues de la distribution d'expression. Fait intéressant, nous avons identifié sept cas (0,67 %) avec des délétions homozygotes dans TP53 (locus 17p13.1) coïncidant avec l'expression aberrante dans les voies de signalisation MAPK et Wnt (Fichiers supplémentaires 9 et 10). Perte de fonction de TP53 est généralement associée à une mutation, cependant, ces résultats suggèrent que dans de rares cas, les délétions homozygotes peuvent être le mécanisme par lequel TP53 est perdu dans le cancer du sein.

Dans HGS, nous avons trouvé 13 gènes qui étaient des conducteurs peu fréquents également trouvés dans CGC (AKT2, KIT, NRAS, RPN, PIK3CA, CREBBP, PPP2R1A, ATIC, CLTCL1, MET, MAP2K4, ETV1, et EP300) (Tableau 2). Curieusement, TROUSSE (1,97 % des cas) et NRAS (0,66 % des cas) ont été détectés comme conducteurs (p = 2E-4 et 9E-4, respectivement Fichiers complémentaires 11 et 12) où TROUSSE est muté dans les mélanomes, les tumeurs stromales gastro-intestinales, les patients adultes atteints de leucémie myéloïde aiguë et de nombreux autres types de tumeurs à haute fréquence et est la cible de l'inhibiteur de kinase Imatinib. Les mutations dans NRAS (généralement associés aux mélanomes, aux myélomes multiples, à la leucémie myéloïde aiguë et au cancer de la thyroïde) étaient, dans les deux cas, la mutation du point chaud Q61R dans le domaine Ras. Les deux TROUSSE et NRAS les mutations ont été négligées en tant que mutations motrices par l'approche basée sur la fréquence (Fichier supplémentaire 7). Cela illustre la sensibilité accrue de DriverNet dans l'identification des conducteurs peu fréquents dans la population. Il est intéressant de noter que les mutations généralement associées aux cancers de l'ovaire de grade inférieur (type I) tels que PIK3CA (0,66 % des cas mutés) et CTNNB1 (0,6% des cas mutés) ont également été désignés comme conducteurs malgré une fréquence extrêmement faible. Les deux PIK3CA les mutations étaient toutes deux dans des points chauds d'activation bien connus, E545K et H1047R. Nous suggérons que ces (quatre cas distincts) pourraient en fait être des cancers de l'ovaire mal diagnostiqués sur le plan histologique. Ces cas représentent une anecdote importante car de nombreuses populations tumorales contiennent des mutations rares qui créent des profils d'expression aberrants. Les cancers de l'ovaire de type I présentent des profils d'expression très différents par rapport aux cancers séreux de haut grade de type II [25]. Si effectivement ces cas ne sont pas séreux, il ne serait pas surprenant, étant donné la formulation DriverNet d'intégration des profils génomiques et transcriptomiques, que ces mutations rares couvrent de nombreux événements aberrants. De plus, nous notons que les précédents MAP2K4 comme conducteur peu fréquent avec une mutation dans un cas et des délétions homozygotes dans deux cas, et la présence de ETV1, généralement connus pour les fusions de gènes, sont répertoriés parmi les moteurs peu fréquents dans les données ovariennes HGS. Enfin, nous avons croisé la liste des gènes p < 0.05 avec Cheung et al. [26] (une liste de gènes présentant des vulnérabilités génétiques dans les lignées cellulaires cancéreuses) et a noté que ALG8 et CCNE1 chevauché.

Dans les ensembles de données TN et GBM, les résultats étaient plus clairsemés. Dans l'ensemble de données TN, un seul gène était un conducteur peu fréquent qui était également dans CGC : JAK1 avec une mutation survenant dans un seul cas (tableau 2). JAK1 les valeurs aberrantes associées ont été enrichies pour la signalisation EGFR1 (fichiers supplémentaires 13 et 14), suggérant que la mutation a des effets en aval sur un important réseau de signalisation oncogène. Dans l'ensemble de données GBM, deux gènes, à savoir KRAS et AKT1, étaient des conducteurs peu fréquents et ont également été trouvés dans CGC. KRAS les valeurs aberrantes associées ont été enrichies pour la signalisation MAPK et PDGFR et AKT1 Les valeurs aberrantes ont été enrichies pour la signalisation de la famille FoxO (Fichiers supplémentaires 15 et 16). L'activation d'AKT est associée à de nombreuses malignités, où AKT agit, en partie, en inhibant les suppresseurs de tumeur FoxO [27]. Collectivement, les enquêtes sur les conducteurs rares dans METABRIC, HGS, TN et GBM soulignent authentique, mais de rares mutations motrices, qui seraient probablement omises par les méthodes examinant les aberrations génomiques par sélection ou analyse de fréquence. Ces résultats indiquent que les rares mutations motrices modulant les réseaux d'expression constituent une composante significative du paysage de la variation transcriptionnelle attribuée au génome somatique, et ne doivent donc pas être négligées dans l'énumération complète des mutations motrices dans les études au niveau de la population.

Les changements du nombre de copies génomiques hébergeant des oncogènes connus modulent simultanément les voies métaboliques

Nous avons ensuite examiné les modèles d'expression modulée associés aux conducteurs se produisant au sein de la même amplification de haut niveau ou délétion homozygote. Étonnamment, nous avons noté quatre exemples dans les ensembles de données METABRIC et GBM où des gènes proximaux par rapport aux conducteurs connus et au sein du même changement de nombre de copies génomiques présentaient des preuves d'une modification de l'expression des voies métaboliques à l'exclusion de la modulation connue des voies oncogènes ou suppresseurs de tumeurs (Figure 3). PNMT code pour l'enzyme phényléthanolamine N-méthyltransférase et réside à environ 20 Kb centromérique à ERBB2 avec un gène intermédiaire. ERBB2, amplifié dans environ 15 à 20 % des cancers du sein, est un récepteur du facteur de croissance membranaire bien connu et ciblable qui est efficacement inhibé par le trastuzumab en pratique clinique. La proximité de PNMT à ERBB2 entraîne une co-amplification des deux gènes dans presque tous les cas (82/83 cas avec une amplification de haut niveau de ERBB2 (Fichier supplémentaire 10)). PNMT était le moteur le mieux classé dans notre analyse (ERBB2 était de rang 3). Lorsque nous avons examiné les gènes aberrants associés à ERBB2 et PNMT, ERBB2-les gènes aberrants associés étaient, comme prévu, enrichis pour les voies de signalisation Erbb et EGF. PNMT-les valeurs aberrantes associées ont été enrichies pour les voies de biosynthèse des macromolécules non oncogènes, y compris les voies métaboliques et le métabolisme de la tyrosine (figure 3A). La modulation concomitante des voies oncogènes et métaboliques a également été trouvée dans d'autres amplifications de haut niveau dans METABRIC, y compris l'amplification 11q14 de PAK1 et NDUFC2 (Fichier supplémentaire 10). PAK1 (27 cas avec des amplifications de haut niveau) montre des signes de conduite EGFR la signalisation (figure 3B) et, surtout, sépare avec un sous-type positif ER de mauvais résultat, comme indiqué dans [20]. NDUFC2 (30 cas avec des amplifications de haut niveau), en aval de PAK1 d'environ 660 Kb, code pour une enzyme NADH déshydrogénase. Valeurs aberrantes associées à NDUFC2 ont été associés à des voies métaboliques et à une voie de phosphorylation oxydative : une voie métabolique qui utilise l'énergie libérée par l'oxydation des nutriments pour produire de l'adénosine triphosphate (Figure 3B).

Modulation simultanée des voies métaboliques dans les altérations du nombre de copies abritant des oncogènes connus. EnrichmentMap [32] schémas illustrant les voies Reactome enrichies dans l'ensemble des valeurs aberrantes associées à des paires de gènes co-amplifiés ou co-délétés. Dans chaque paire, un gène est un suppresseur de tumeur ou un oncogène connu tandis que l'autre est un gène du métabolisme. Les voies sont présentées sous forme de nœuds connectés dans un graphique où la taille du nœud indique le nombre de gènes dans la voie. Les bords entre les nœuds indiquent des gènes communs aux deux voies où l'épaisseur du bord représente le degré de chevauchement. En général, peu de chevauchement a été observé entre les moteurs métaboliques et les moteurs oncogènes/suppresseurs de tumeurs. (UNE) PNMT et ERBB2 gènes co-amplifiés au locus chr17q12 dans le cancer du sein. (B) PAK1 et NDUFC2 gènes co-amplifiés au locus 11q14 dans le cancer du sein. (C) CDKN2A et PAIM gènes co-délétés à chr9p21.3 dans GBM.

Un modèle similaire de modulation simultanée des voies métaboliques par les changements de nombre de copies hébergeant des oncogènes connus a été observé dans les données GBM. La kinase cycline-dépendante CDKN2A et la méthylthioadénosine phosphorylase PAIM sont séparés d'environ 100 Kb et sont des gènes adjacents. PAIM (DriverNet rang 3) et suppresseur de tumeur connu CDKN2A (DriverNet rang 4) sont connus pour être co-supprimés et ils ont été observés comme tels dans notre analyse. Nous avons observé 53 cas avec des délétions homozygotes dans CDK2NA avec co-suppression d'accompagnement de PAIM dans tous les cas (Fiche supplémentaire 16). Dans deux autres cas avec CDKN2A mutations ponctuelles, PAIM n'a pas été trouvé muté ou supprimé. Les parcours enrichis de la CDK2NA-les valeurs aberrantes associées comprenaient le cycle cellulaire, la signalisation p53 et le réseau de facteurs de transcription FOXM1, entre autres. La seule voie enrichie significative des valeurs aberrantes associées à la suppression du MTAP était la voie métabolique (figure 3C).

Nous avons examiné PNMT-, NDUFC2-, et PAIM-gènes périphériques associés qui faisaient partie des voies métaboliques et aussi ERBB2-, PAK1-, et CDKN2A-gènes périphériques associés qui étaient liés aux voies oncogènes/suppresseurs de tumeurs. Les gènes périphériques liés aux voies métaboliques et aux voies oncogènes/suppresseurs de tumeurs ont été distribués à travers des loci disparates dans le génome, éliminant la co-amplification comme cause des signaux observés (Fichier supplémentaire 17).

Les résultats des gènes métaboliques co-aberrés avec des gènes oncogènes et suppresseurs de tumeurs suggèrent fortement qu'au moins une partie de la perturbation des voies métaboliques dans le cancer peut être attribuée mécaniquement à des aberrations somatiques dans le génome. De plus, nos résultats indiquent la possibilité intrigante que des aberrations génomiques abritant des pilotes oncogènes/suppresseurs tumoraux connus soient sélectionnées en raison d'une modulation de la voie oncogène couplée à une modulation de la voie métabolique sans chevauchement.


Les références

Iafrate, A.J. et al. Détection de variations à grande échelle dans le génome humain. Genêt nature. 36, 949–951 (2004).

Kidd, J.M. et al. Cartographie et séquençage de la variation structurelle de huit génomes humains. La nature 453, 56–64 (2008).

Korbel, J.O. et al. La cartographie appariée révèle une variation structurelle importante dans le génome humain. Science 318, 420–426 (2007).

Redon, R. et al. Variation globale du nombre de copies dans le génome humain. La nature 444, 444–454 (2006). Une enquête auprès de 270 individus des échantillons humains HapMap à l'aide de puces SNP et d'hybridation génomique comparative.

Sebat, J. et al. Polymorphisme du nombre de copies à grande échelle dans le génome humain. Science 305, 525–528 (2004).

Wong, K.K. et al. Une analyse complète des variations courantes du nombre de copies dans le génome humain. Un m. J. Hum. Genet. 80, 91–104 (2007).

Bruder, C.E.G. et al. Les jumeaux monozygotes phénotypiquement concordants et discordants présentent différents profils de variation du nombre de copies d'ADN. Un m. J. Hum. Genet. 82, 1–9 (2008).

Piotrowski, A. et al. Mosaïque somatique pour la variation du nombre de copies dans les tissus humains différenciés. Hum. Mutat. 29, 1118–1124 (2008).

Beckmann, J. S., Estivill, X. & Antonarakis, S. E. Variantes du nombre de copies et traits génétiques : plus proches de la résolution de la variabilité phénotypique à génotypique. Nature Rév. Genet. 8, 639–646 (2007).

Dumas, L. et al. Variation du nombre de copies de gènes couvrant 60 millions d'années d'évolution humaine et primate. Génome Res. 17, 1266–1277 (2007). Cet article retrace l'histoire de la variation du nombre de copies à travers l'évolution de la lignée des primates.

Nahon, J. L. Naissance de gènes « spécifiques à l'homme » au cours de l'évolution des primates. Génétique 118, 193–208 (2003).

Bailey, J. A. & Eichler, E. E. Duplications segmentaires des primates : creusets de l'évolution, de la diversité et de la maladie. Nature Rév. Genet. 7, 552–564 (2006).

Stankiewicz, P., Shaw, C. J., Withers, M., Inoue, K. & Lupski, J. R. Les duplications segmentaires en série au cours de l'évolution des primates aboutissent à une architecture complexe du génome humain. Génome Res. 14, 2209–2220 (2004).

Marques-Bonet, T. et al. Une explosion de duplications segmentaires dans le génome de l'ancêtre des grands singes africains. La nature 457, 877–881 (2009).

Inoue, K. & Lupski, J.R. Mécanismes moléculaires pour les troubles génomiques. Annu. Rév. Genomics Hum. Genet. 3, 199–242 (2002).

Oh non, S. Évolution par duplication de gènes (Springer, Berlin, New York, 1970).

Rotger, M. et al. Suppression partielle du CYP2B6 en raison d'un croisement inégal avec le CYP2B7. Pharmacogenet. Génomique 17, 885–890 (2007).

Zhang, F. et al. Le mécanisme de réplication de l'ADN FoSTeS/MMBIR peut générer des réarrangements humains génomiques, géniques et de réarrangement d'exons. Genêt nature. 41, 849–853 (2009). Des études sur les réarrangements associés à la maladie dans le chromosome 17p proximal révèlent des réarrangements complexes de taille et d'occurrence variables au cours de la mitose avec des implications potentielles pour le conseil génétique concernant le risque de récidive.

Volik, S. et al. Décoder la structure à petite échelle d'un génome et d'un transcriptome du cancer du sein. Génome Res. 16, 394–404 (2006).

Brodeur, G. M. & Hogarty, M. D. dans La base génétique du cancer humain (éd. Vogelstein, B. & Kinzler, K. W.) 161-172 (McGraw-Hill, New York, 1998).

Frank, B. et al. Variante du nombre de copies dans le gène suppresseur de tumeur candidat MTUS1 et le risque familial de cancer du sein. Carcinogenèse 28, 1442–1445 (2007).

Lupski, J. R. Troubles génomiques : les caractéristiques structurelles du génome peuvent entraîner un réarrangement de l'ADN et des traits de maladie humaine. Tendances Genet. 14, 417–422 (1998).

Stranger, B.E. et al. Impact relatif de la variation du nombre de nucléotides et de copies sur les phénotypes d'expression génique. Science 315, 848–853 (2007).

Hastings, P. J., Ira, G. & Lupski, J. R. Un modèle de réplication induite par la rupture à médiation par microhomologie pour l'origine de la variation du nombre de copies humaines. PLoS Genet. 5, e1000327 (2009). Cette revue présente le modèle MMBIR pour le réarrangement chromosomique avec le détail des preuves sur lesquelles il est basé.

Friedberg, E.C. et al. Réparation de l'ADN et mutagenèse (ASM, Washington DC, 2005).

Lee, J. A., Carvalho, C. M. & Lupski, J. R. Un mécanisme de réplication de l'ADN pour générer des réarrangements non récurrents associés à des troubles génomiques. Cellule 131, 1235–1247 (2007). Description de la structure complexe et de la microhomologie des duplications non récurrentes observées chez les patients atteints d'un trouble génomique.

Nobile, C. et al. Analyse de 22 points d'arrêt de délétion dans l'intron 49 de dystrophine. Hum. Genet. 110, 418–421 (2002).

Carvalho, C.M. et al. Réarrangements complexes chez les patients présentant des duplications de MECP2 peut se produire par Fork Stalling et Template Switching. Hum. Mol. Genet. 18, 2188–2203 (2009).

Chen, J. M., Chuzhanova, N., Stenson, P. D., Férec, C. & Cooper, D. N. Glissement de réplication en série intrachromosomique dans trans donne lieu à divers réarrangements génomiques impliquant des inversions. Hum. Mutat. 26, 362–373 (2005).

Gajecka, M. et al. Complexité inattendue aux jonctions de points d'arrêt chez les individus phénotypiquement normaux et mécanismes impliqués dans la génération de translocations équilibrées t(122)(p36q13). Génome Res. 18, 1733–1742 (2008).

Sheen, C.R. et al. Doubles mutations complexes impliquant F8 et FUNDC2 causée par une réplication distincte induite par la rupture. Hum. Mutat. 28, 1198–2006 (2007).

Vissers, L.E. et al. Réarrangements complexes du chromosome 17p associés à des répétitions à faible nombre de copies chez deux patients atteints d'anomalies congénitales. Hum. Genet. 121, 697–709 (2007).

Stankiewicz, P. et al. L'architecture du génome catalyse les réarrangements chromosomiques non récurrents. Un m. J. Hum. Genet. 72, 1101–1116 (2003).

Lee, J.A. et al. Rôle de l'architecture génomique dans PLP1 duplication causant la maladie de Pelizaeus-Merzbacher. Hum. Mol. Genet. 15, 2250–2265 (2006).

Lee, J.A. et al. Paraplégie spastique de type 2 associée à une neuropathie axonale et apparente PLP1 effet de position. Anne. Neurol. 59, 398–403 (2006).

Lovett, S. T., Hurley, R. L., Sutera, V. A. Jr, Aubuchon, R. H. & Lebedeva, M. A. Crossing over between regions of limited homology in Escherichia coli. Voies RecA-dépendantes et RecA-indépendantes. La génétique 160, 851–859 (2002).

Liskay, R. M., Letsou, A. & Stachelek, J. L. Exigence d'homologie pour une conversion génique efficace entre des séquences chromosomiques dupliquées dans des cellules de mammifères. La génétique 115, 161–167 (1987).

Reiter, L.T. et al. Produits de recombinaison méiotique humaine révélés par le séquençage d'un hotspot pour l'échange de brins homologues chez plusieurs patients atteints de délétion HNPP. Un m. J. Hum. Genet. 62, 1023–1033 (1998).

Stankiewicz, P. & Lupski, J. R. Architecture du génome, réarrangements et troubles génomiques. Tendances Genet. 18, 74–82 (2002).

Krogh, B.O. & Symington, L.S. Protéines de recombinaison dans la levure. Annu. le révérend Genet. 38, 233–271 (2004).

Pâques, F. & Haber, J. E. Multiples voies de recombinaison induites par les cassures double brin Saccharomyces cerevisiae. Microbiole. Mol. Biol. Tour. 63, 349–404 (1999).

Esposito, M. S. Preuve que la recombinaison mitotique spontanée se produit au stade à deux brins. Proc. Natl Acad. Sci. Etats-Unis 75, 4436–4440 (1978).

Stark, J. M. & Jasin, M. Une perte importante d'hétérozygotie est supprimée pendant la réparation homologue des cassures chromosomiques. Mol. Cellule. Biol. 23, 733–743 (2003).

Dupaigne, P. et al. L'activité de l'hélicase Srs2 est stimulée par les filaments Rad51 sur l'ADNdb : implications pour l'incidence des croisements lors de la recombinaison mitotique. Mol. Cellule. 29, 243–254 (2008).

Sun, W. et al. L'orthologue FANCM Fml1 favorise la recombinaison au niveau des fourches de réplication bloquées et limite les croisements lors de la réparation des cassures double brin de l'ADN. Mol. Cellule 32, 118–128 (2008).

Ira, G., Malkova, A., Liberi, G., Foiani, M. & Haber, J. E. Srs2 et Sgs1–Top3 suppriment les croisements lors de la réparation des cassures double brin chez la levure. Cellule 115, 401–411 (2003).

Prakash, R. et al. L'hélicase de levure Mph1 dissocie les boucles D fabriquées par Rad51 : implications pour le contrôle des croisements dans la recombinaison mitotique. Gènes Dev. 23, 67–79 (2009).

Wu, L. & Hickson, I. D. L'hélicase du syndrome de Bloom supprime le croisement pendant la recombinaison homologue. La nature 426, 870–874 (2003).

Prado, F. & Aguilera, A. Contrôle du croisement par résection d'ADN simple brin. Les tendances. Genet. 19, 428–431 (2003).

Smith, C. E., Llorente, B. & Symington, L. S. Changement de modèle pendant la réplication induite par la rupture. La nature 447, 102–105 (2007). Cet article montre des preuves expérimentales de levure sur la nature du BIR. Plus précisément, changement de modèle entre des chromosomes homologues (ou parfois des chromosomes non homologues, ce qui provoque une translocation). Il a montré une réplication vers le télomère après la commutation.

Bauters, M. et al. Non récurrent MECP2 les duplications médiées par les cassures d'ADN induites par l'architecture génomique et la réparation de la réplication induite par les cassures. Génome Res. 18, 847–858 (2008).

Deem, A. et al. Une réplication défectueuse induite par une rupture conduit à des demi-croisements dans Saccharomyces cerevisiae. La génétique 179, 1845–1860 (2008).

Narayanan, V. & Lobachev, K. S. L'amplification génique intrachromosomique déclenchée par des cassures en épingle à cheveux nécessite une recombinaison homologue et est indépendante de la jonction terminale non homologue. Cycle cellulaire 6, 1814–1818 (2007).

Payen, C., Koszul, R., Dujon, B. & Fischer, G. Les duplications segmentaires résultent de la réparation dépendante de Pol32 de fourches cassées via deux mécanismes alternatifs basés sur la réplication. PLoS Genet. 4, e1000175 (2008). Preuve de levure que les LCR surviennent par un mécanisme réplicatif, en particulier un mécanisme impliquant le BIR.

Schmidt, K. H., Wu, J. & Kolodner, R. D. Contrôle des translocations entre gènes hautement divergents par Sgs1, le Saccharomyces cerevisiae homologue de la protéine du syndrome de Bloom. Mol. Cellule. Biol. 26, 5406–5420 (2006).

Lin, F. L., Sperle, K. & Sternberg, N. Modèle de recombinaison homologue lors du transfert d'ADN dans des cellules L de souris : rôle des extrémités de l'ADN dans le processus de recombinaison. Mol. Cellule. Biol. 4, 1020–1034 (1984).

Sweigert, S. E. & Carroll, D. Réparation et recombinaison de plasmides irradiés par X dans Xenopus laevis ovocytes. Mol. Cellule. Biol. 10, 5849–5856 (1990).

Haber, J. E. Explorer les voies de la recombinaison homologue. Cour. Avis. Cell Biol. 4, 401–412 (1992).

Elliott, B., Richardson, C. & Jasin, M. Mécanismes de translocation chromosomique au niveau des éléments Alu introniques dans les cellules de mammifères. Mol. Cellule 17, 885–894 (2005).

Rayssiguier, C., Thaler, D. S. & Radman, M. La barrière à la recombinaison entre Escherichia coli et Salmonelle typhimurium est perturbé dans les mutants de réparation des mésappariements. La nature 342, 396–401 (1989).

Unal, E. et al. La voie de réponse aux dommages de l'ADN utilise la modification des histones pour assembler un domaine de cohésine spécifique à la rupture double brin. Mol. Cellule 16, 991–1002 (2004).

Strom, L., Lindroos, H. B., Shirahige, K. & Sjogren, C. Le recrutement post-réplicatif de la cohésine aux cassures double brin est requis pour la réparation de l'ADN. Mol. Cellule 16, 1003–1015 (2004).

Kim, J. S., Krasieva, T. B., LaMorte, V., Taylor, A. M. & Yokomori, K. Recrutement spécifique de la cohésine humaine pour les dommages à l'ADN induits par le laser. J. Biol. Chem. 277, 45149–45153 (2002).

Sjogren, C. & Nasmyth, K. La cohésion des chromatides sœurs est requise pour la réparation post-réplicative des cassures double brin dans Saccharomyces cerevisiae. Cour. Biol. 11, 991–995 (2001).

Kobayashi, T., Horiuchi, T., Tongaonkar, P., Vu, L. & Nomura, M.SIR2 régule la recombinaison entre différentes répétitions d'ADNr, mais pas la recombinaison au sein de gènes d'ARNr individuels chez la levure. Cellule 117, 441–453 (2004).

Kobayashi, T. & Ganley, A. R. Régulation de la recombinaison par dissociation de la cohésine induite par la transcription dans les répétitions d'ADNr. Science 309, 1581–1584 (2005).

Kaye, J.A. et al. Les cassures d'ADN favorisent l'instabilité génomique en empêchant une ségrégation correcte des chromosomes. Cour. Biol. 14, 2096–2106 (2004).

Soutoglou, E. et al. Stabilité positionnelle des cassures simple double brin dans les cellules de mammifères. Nature Cell Biol. 9, 675–682 (2007).

Oh, S.D. et al. L'orthologue BLM, Sgs1, empêche le croisement aberrant en supprimant la formation de molécules articulaires multichromatides. Cellule 130, 259–272 (2007).

Jain, S. et al. Un point de contrôle d'exécution de la recombinaison régule le choix de la voie de recombinaison homologue lors de la réparation des cassures double brin de l'ADN. Gènes Dev. 23, 291–303 (2009).

McVey, M. & Lee, S. E. MMEJ réparation des cassures double brin (director's cut): séquences supprimées et terminaisons alternatives. Tendances Genet. 24, 529–538 (2008).

Lieber, M. R. Le mécanisme de la jonction des extrémités de l'ADN non homologue humain. J. Biol. Chem. 283, 1–5 (2008).

Daley, J.M., Palmbos, P.L., Wu, D. & Wilson, T.E. Nonhomologous end join in levure. Annu. le révérend Genet. 39, 431–451 (2005).

Haviv-Chesner, A., Kobayashi, Y., Gabriel, A. & Kupiec, M. Capture de fragments linéaires lors d'une rupture double brin dans la levure. Acides nucléiques Res. 35, 5192–5202 (2007).

Yu, X. & amp Gabriel, A. Les voies de jonction d'extrémité Ku-dépendantes et Ku-indépendantes conduisent à des réarrangements chromosomiques lors de la réparation des cassures double brin dans Saccharomyces cerevisiae. La génétique 163, 843–856 (2003).

Nickoloff, J. A., De Haro, L. P., Wray, J. & Hromas, R. Mécanismes de translocation de leucémie. Cour. Avis. Hématol. 15, 338–345 (2008).

McClintock, B. Organisation chromosomique et expression génique. Harb de printemps froid. Symp. Quant. Biol. 16, 13–47 (1951).

Tanaka, H. & Yao, M. C. Amplification du gène palindromique - un rôle conservé au cours de l'évolution pour les répétitions inversées de l'ADN dans le génome. Nature Rev. Cancer 9, 216–224 (2009).

Tanaka, H., Bergstrom, D. A., Yao, M. C. & Tapscott, S. J. Les grands palindromes d'ADN en tant que forme courante d'aberrations chromosomiques structurelles dans les cancers humains. Hum. Cellule 19, 17–23 (2006).

Coquelle, A., Pipiras, E., Toledo, F., Buttin, G. & Debatisse, M. L'expression de sites fragiles déclenche l'amplification génique intrachromosomique des mammifères et fixe des limites aux premiers amplicons. Cellule 89, 215–225 (1997).

Shaw, C.J. & Lupski, J.R. Les délétions non récurrentes 17p11.2 sont générées par des mécanismes homologues et non homologues. Hum. Genet. 116, 1–7 (2005).

Arlt, M.F. et al. Le stress de réplication induit des modifications du nombre de copies à l'échelle du génome dans les cellules humaines qui ressemblent à des variantes polymorphes et pathogènes. Un m. J. Hum. Genet. 84, 339–350 (2009).

Durkin, S.G. et al. Le stress de réplication induit des microdélétions tumorales dans FHIT/FRA3B. Proc. Natl Acad. Sci. Etats-Unis 105, 246–251 (2008).

Kuo, M. T., Vyas, R. C., Jiang, L. X. & Hittelman, W. N. Rupture chromosomique sur un site fragile majeur associé à l'amplification du gène de la glycoprotéine P dans des cellules CHO multirésistantes. Mol. Cell Biol. 14, 5202–5211 (1994).

Coquelle, A., Rozier, L., Dutrillaux, B. & Debatisse, M. L'induction de multiples cassures double brin au sein d'une hsr par l'expression meganucleaseI-Scel ou l'activation du site fragile conduit à la formation de doubles minutes et d'autres réarrangements chromosomiques. Oncogène 21, 7671–7679 (2002).

Michel, B., Ehrlich, S. D. & Uzest, M. Cassures double brin de l'ADN causées par l'arrêt de la réplication. EMBO J. 16, 430–438 (1997).

Albertini, A. M., Hofer, M., Calos, M. P. & Miller, J. H. Sur la formation de délétions spontanées : l'importance des homologies de séquences courtes dans la génération de grandes délétions. Cellule 29, 319–328 (1982).

Farabaugh, P. J., Schmeissner, U., Hofer, M. & Miller, J. H. Études génétiques de la lac répresseur. VII. Sur la nature moléculaire des points chauds spontanés dans le gène lacI de Escherichia coli. J. Mol. Biol. 126, 847–857 (1978).

Ikeda, H., Shimizu, H., Ukita, T. & Kumagai, M. Un nouveau test pour la recombinaison illégitime dans Escherichia coli: stimulation de la formation de phages biotransducteurs lambda par la lumière ultraviolette et son indépendance par rapport à la fonction RecA. Av. Biophys. 31, 197–208 (1995).

Shimizu, H. et al. Recombinaison illégitime indépendante de l'homologie courte dans Escherichia coli: mécanisme distinct de la recombinaison illégitime dépendante de l'homologie courte. J. Mol. Biol. 266, 297–305 (1997).

Bi, X. & Liu, L.F. recA-indépendant et recA-recombinaison plasmidique intramoléculaire dépendante : homologie différentielle et effet d'exigence et de distance. J. Mol. Biol. 235, 414–423 (1994).

Mazin, A. V., Kuzminov, A. V., Dianov, G. L. & Salganik, R. I. Mécanismes de formation de délétions dans Escherichia coli plasmides. II. Suppressions médiées par de courtes répétitions directes. Mol. Le général Genet. 228, 209–214 (1991).

Chedin, F., Dervyn, E., Dervyn, R., Ehrlich, S.D. & Noirot, P. La fréquence de formation de délétions diminue de façon exponentielle avec la distance entre les courtes répétitions directes. Mol. Microbiole. 12, 561–569 (1994).

Lovett, S. T., Gluckman, T. J., Simon, P. J., Sutera Jr, V. A. & Drapkin, P. T. Recombination between repeats in Escherichia coli par un recA- mécanisme indépendant sensible à la proximité. Mol. Le général Genet. 254, 294–300 (1994).

Bierne, H., Vilette, D., Ehrlich, S.D. & Michel, B. Isolement d'un adnE mutation qui améliore la recombinaison homologue indépendante de RecA dans le Escherichia coli chromosome. Mol. Microbiole. 24, 1225–1234 (1997).

Saveson, C. J. & Lovett, S. T. Formation de délétion améliorée par réplication aberrante de l'ADN dans Escherichia coli. La génétique 146, 457–470 (1997).

Bzymek, M. & Lovett, S. T. Instabilité des séquences d'ADN répétitives: le rôle de la réplication dans de multiples mécanismes. Proc. Natl Acad. Sci. Etats-Unis 98, 8319–8325 (2001).

Lovett, S. T. & Feshenko, V. V. Stabilisation des répétitions en tandem divergentes par la réparation des mésappariements : preuve de la formation de délétions via un intermédiaire de réplication désaligné. Proc. Natl Acad. Sci. Etats-Unis 93, 7120–7124 (1996).

Cairns, J. & Foster, P. L. Réversion adaptative d'une mutation de décalage du cadre dans Escherichia coli. La génétique 128, 695–701 (1991).

Slack, A., Thornton, P. C., Magner, D. B., Rosenberg, S. M. & Hastings, P. J. Sur le mécanisme d'amplification génique induite sous stress dans Escherichia coli. PLoS Genet. 2, e48 (2006). Preuve expérimentale de E. coli suggérant que le changement structurel chromosomique se produit par un mécanisme réplicatif, et révélant également que les caractéristiques de l'amplification dans E. coli sont similaires à ceux des changements non récurrents observés dans les troubles génomiques humains. Propose la formation de CNV par commutation de modèle entre les fourches.

Kugelberg, E., Kofoid, E., Reams AB, Andersson, D.I. & Roth, J.R. Voies multiples d'amplification génique sélectionnée au cours d'une mutation adaptative. Proc. Natl Acad. Sci. Etats-Unis 103, 17319–17324 (2006).

Allgood, N.D. & Silhavy, T.J. Escherichia coli xonA (sbcB) les mutants améliorent la recombinaison illégitime. La génétique 127, 671–680 (1991).

Bzymek, M., Saveson, C. J., Feschenko, V. V. & amp Lovett, S. T. Mécanismes de désalignement glissé de la formation de délétions : in vivo sensibilité aux nucléases. J. Bactériol. 181, 477–482 (1999).

Lydeard, J. R., Jain, S., Yamaguchi, M. & Haber, J. E. La réplication induite par la rupture et la maintenance des télomères indépendante de la télomérase nécessitent Pol32. La nature 448, 820–823 (2007).

VanHulle, K. et al. L'ADN inversé répète la réparation des canaux de cassures double brin distantes en fusions de chromatides et réarrangements chromosomiques. Mol. Cellule. Biol. 27, 2601–2614 (2007).

Davis, A.P. & Symington, L.S. Réplication induite par rupture dépendante de RAD51 dans la levure. Mol. Cellule. Biol. 24, 2344–2351 (2004).

McVey, M., Adams, M., Staeva-Vieira, E. & Sekelsky, J. J. Preuve de cycles multiples d'invasion de brins lors de la réparation de lacunes double brin dans Drosophile. La génétique 167, 699–705 (2004).

Bindra, R. S., Crosby, M. E. & Glazer, P. M. Régulation de la réparation de l'ADN dans les cellules cancéreuses hypoxiques. Métastases cancéreuses Rev. 26, 249–260 (2007).

Huang, L. E., Bindra, R. S., Glazer, P. M. & Harris, A. L. Instabilité génétique induite par l'hypoxie - un mécanisme calculé sous-jacent à la progression tumorale. J. Mol. Méd. 85, 139–148 (2007).

Bindra, R. S. & Glazer, P. M. Répression de l'expression du gène RAD51 par les complexes E2F4/p130 dans l'hypoxie. Oncogène. 26, 2048–2057 (2007).

Coquelle, A., Toledo, F., Stern, S., Bieth, A. & Debatisse, M. Un nouveau rôle pour l'hypoxie dans la progression tumorale : induction de sites fragiles déclenchant des réarrangements génomiques et formation de DM complexes et de HSR. Mol. Cellule 2, 259–265 (1998).

Hastings, P. J., Bull, H. J., Klump, J. R. & Rosenberg, S. M. Amplification adaptative : un mécanisme d'instabilité chromosomique inductible. Cellule 103, 723–731 (2000).

Lombardo, M.-J., Aponyi, I. & Rosenberg, S. M. Régulateur général de la réponse au stress RpoS dans la mutation adaptative et l'amplification dans Escherichia coli. La génétique 166, 669–680 (2004).

Ponder, R. G., Fonville, N. C. & amp Rosenberg, S. M. Un passage de la haute fidélité à la réparation des cassures double brin d'ADN sujette aux erreurs est à la base d'une mutation induite par le stress. Mol. Cellule 19, 791–804 (2005).

Mullighan, C.G. et al. Analyse à l'échelle du génome des altérations génétiques dans la leucémie lymphoblastique aiguë. La nature 446, 758–764 (2007).

Shao, L. et al. Identification des anomalies chromosomiques dans les régions subtélomériques par analyse de microarray : une étude de 5 380 cas. Un m. J. Méd. Genet. UNE 146A, 2242–2251 (2008).

Yatsenko, S.A. et al. Mécanismes moléculaires des réarrangements subtélomériques associés au syndrome de microdélétion 9q34.3. Hum. Mol. Genet. 18, 1924–1936 (2009).

Zhang, L., Lu, H. H., Chung, W. Y., Yang, J. & Li, W. H. Modèles de duplication segmentaire dans le génome humain. Mol. Biol. Évol. 22, 135–141 (2005).

Elle, X. et al. La structure et l'évolution des régions de transition centromériques dans le génome humain. La nature 430, 857–864 (2004).

Nguyen, D.Q., Webber, C. & Ponting, C.P. Bias of selection on human copy-number variants. PLoS Genet. 2, e20 (2006).

Visser, R. et al. Identification d'un hotspot de recombinaison majeure de 3,0 kb chez les patients atteints du syndrome de Sotos qui portent une microdélétion commune de 1,9 Mb. Un m. J. Hum. Genet. 76, 52–67 (2005).

de Smith, A.J. et al. Les petites variantes de délétion ont des points d'arrêt stables généralement associés à Alu éléments. PLoS UN 3, e3104 (2008).

Bacola, A. et al. Les points de rupture des délétions grossières coïncident avec les conformations d'ADN non-B. Proc. Natl Acad. Sci. Etats-Unis 101, 14162–14167 (2004).

Bacola, A., Wojciechowska, M., Kosmider, B., Larson, J. E. & Wells, R. D. L'implication des structures d'ADN non B dans les réarrangements chromosomiques bruts. Réparation de l'ADN (Amst.) 5, 1161–1170 (2006).

Inagaki, H. et al. Instabilité chromosomique médiée par l'ADN non B : la conformation cruciforme et non la séquence d'ADN est responsable de la translocation récurrente chez l'homme. Génome Res. 19, 191–198 (2009).

Myers, S., Freeman, C., Auton, A., Donnelly, P. & McVean, G. Un motif de séquence commun associé aux points chauds de recombinaison et à l'instabilité du génome chez l'homme. Genêt nature. 40, 1124–1129 (2008).

Shaw, C. J. & Lupski, J. R. Implications de l'architecture du génome humain pour les troubles basés sur le réarrangement : la base génomique de la maladie. Hum. Mol. Genet. 13, R57–R64 (2004).

Bi, W. et al. L'augmentation de l'expression de LIS1 affecte le développement du cerveau humain et murin. Genêt nature. 41, 168–177 (2009).

Galhardo, R. S., Hastings, P. J. & Rosenberg, S. M. Mutation en tant que réponse au stress et régulation de l'évolutivité. Critique. Rév. Biochem. Mol. Biol. 42, 399–435 (2007). Une large revue de la mutation induite par le stress et sa signification pour l'évolution.

Rosenberg, S. M. Évoluer de manière réactive : mutation adaptative. Nature Rév. Genet. 2, 504–515 (2001).

Cirz, R.T. et al. Inhibition des mutations et lutte contre l'évolution de la résistance aux antibiotiques. PLoS Biol. 3, e176 (2005).

Riesenfeld, C., Everett, M., Piddock, L.J. & Hall, B.G. Les mutations adaptatives produisent une résistance à la ciprofloxacine. Antimicrobien. Agents Chemother. 41, 2059–2060 (1997).

Bindra, R.S.S. et al. Régulation à la baisse de Rad51 et diminution de la recombinaison homologue dans les cellules cancéreuses hypoxiques. Mol. Cellule. Biol. 24, 8504–8518 (2004). Cet article montre que les enzymes RH sont régulées à la baisse par le stress dans les cellules humaines, et que cela s'accompagne d'une réduction des RH.

Mihaylova, V.T. et al. Diminution de l'expression du gène de réparation des mésappariements de l'ADN Mlh1 sous stress hypoxique dans les cellules de mammifères. Mol. Cellule. Biol. 23, 3265–3273 (2003).

Kolodner, R.D. et al. Ligne germinale msh6 mutations dans les familles de cancer colorectal. Cancer Rés. 59, 5068–5074 (1999).

Loeb, L. A. Le phénotype mutateur peut être requis pour la cancérogenèse en plusieurs étapes. Cancer Rés. 51, 3075–3079 (1991).

Modrich, P. Réparation des mésappariements, stabilité génétique et évitement des tumeurs. Phil. Trans. R. Soc. Londres. B 347, 89–95 (1995).

Nguyen, D.Q. et al. La sélection purificatrice réduite prévaut sur la sélection positive dans l'évolution des variants du nombre de copies humaines. Génome Res. 18, 1711–1723 (2008).

Perry, G.H. et al. Régime alimentaire et évolution de la variation du nombre de copies du gène de l'amylase humaine. Genêt nature. 39, 1256–1260 (2007).

Gonzalez, E. et al. L'influence de CCL3L1 duplications segmentaires contenant des gènes sur la susceptibilité au VIH-1/SIDA. Science 307, 1434–1440 (2005).

Higgs, D.R. et al. Un examen de la génétique moléculaire du groupe de gènes de l'alpha-globine humaine. Du sang 73, 1081–1104 (1989).

Nozawa, M., Kawahara, Y. & Nei, M. Dérive génomique et variation du nombre de copies des gènes des récepteurs sensoriels chez l'homme. Proc. Natl Acad. Sci. Etats-Unis 104, 20421–20426 (2007).

Jakobsson, M. et al. Variation du génotype, de l'haplotype et du nombre de copies dans les populations humaines mondiales. La nature 451, 998–1003 (2008).

Locke, D.P. et al. Déséquilibre de liaison et héritabilité des polymorphismes du nombre de copies dans les régions dupliquées du génome humain. Un m. J. Hum. Genet. 79, 275–290 (2006).

Sharp, A.J. et al. Duplications segmentaires et variation du nombre de copies dans le génome humain. Un m. J. Hum. Genet. 77, 78–88 (2005).

Fortna, A. et al. Duplication et perte de gènes spécifiques à la lignée dans l'évolution de l'homme et des grands singes. PLoS Biol. 2, E207 (2004).

McCarroll, S.A. et al. Détection intégrée et analyse génétique de la population des SNP et variation du nombre de copies. Genêt nature. 40, 1166–1174 (2008).

Turner, D.J. et al. Taux germinaux de de novo délétions et duplications méiotiques provoquant plusieurs troubles génomiques. Genêt nature. 40, 90–95 (2008).

Lam, K. W. & Jeffreys, A. J. Processus de modification du nombre de copies dans l'ADN humain : la dynamique de la suppression du gène de la -globine. Proc. Natl Acad. Sci. Etats-Unis 103, 8921–8927 (2006).

Lam, K. W. & Jeffreys, A. J. Processus de de novo duplication des gènes humains de la -globine. Proc. Natl Acad. Sci. Etats-Unis 104, 10950–10955 (2007).

Flores, M. et al. Réarrangements récurrents d'inversion d'ADN dans le génome humain. Proc. Natl Acad. Sci. Etats-Unis 104, 6099–6106 (2007).

Liang, Q., Conte, N., Skarnes, W. C. & Bradley, A. Variation étendue du nombre de copies génomiques dans les cellules souches embryonnaires. Proc. Natl Acad. Sci. Etats-Unis 105, 17453–17456 (2008).

Lupski, J. R. Réarrangements génomiques et maladie sporadique. Genêt nature. 39, S43-47 (2007).

van Ommen G. J. Fréquence de la nouvelle variation du nombre de copies chez l'homme. Genêt nature. 37, 333–334 (2005).

Tuzun, E., Bailey, J. A. & Eichler, E. E. Duplications segmentaires récentes dans l'assemblage de travail du rat surmulot brun. Génome Res. 14, 493–506 (2004).

Graubert, T.A. et al. Une carte haute résolution de la variation du nombre de copies d'ADN segmentaire dans le génome de la souris. PLoS Genet. 3, e3 (2007).

Lovett, S. T. Erreurs codées : mutations et réarrangements induits par un désalignement au niveau de séquences d'ADN répétitives. Mol. Microbiole. 52, 1243–1253 (2004).


RÉSULTATS

Gènes amplifiés identifiés par l'analyse du nombre de copies à l'échelle du génome

Un total de 58 SCLC, constitués de 33 tumeurs fraîches et de 25 lignées cellulaires (tableau d'informations à l'appui S1A, B), ont été soumis à une analyse par puce SNP 250K, et toutes les régions génomiques avec ≥ 5 copies dans ≥ 5 loci SNP consécutifs ont d'abord été prélevées. que les régions amplifiées dans les génomes des SCLC. Cependant, selon ces critères, des chromosomes entiers ou des bras chromosomiques entiers étaient plus fréquemment détectés que des régions chromosomiques focales dans divers chromosomes parmi diverses tumeurs et lignées cellulaires. Par conséquent, les régions chromosomiques amplifiées définies comme des segments de 5 loci SNP consécutifs avec des nombres de copies estimés de ≥6 ont ensuite été prélevées dans chaque SCLC. Dix régions amplifiées ont été identifiées sur les chromosomes 1p, 8q, 9p, 12p et 19p dans 7 des 33 tumeurs fraîches (tableau d'information S2). Les tailles des régions amplifiées allaient de 0,05 à 3,61 Mb (moyenne ± SD = 1,06 ± 1,25 Mb), et 110 gènes ont été cartographiés dans ces régions. Quarante-sept régions amplifiées ont été identifiées sur les chromosomes 1p, 2p, 8q, 9p, 12p, 14q, 17q et 20q dans 13 des 25 lignées cellulaires (Tableau d'informations à l'appui S2). Les tailles des régions amplifiées allaient de 0,08 à 4,22 Mb (moyenne ± SD = 0,67 ± 0,81 Mb), et 211 gènes ont été cartographiés dans ces régions. Par conséquent, diverses régions chromosomiques ont été identifiées comme étant focalement amplifiées par les critères du nombre de copies ≥ 6, les tailles des régions amplifiées étaient similaires dans les tumeurs fraîches et les lignées cellulaires, et les plusieurs régions amplifiées dans les tumeurs fraîches se chevauchaient avec celles des lignées cellulaires (Informations à l'appui Tableaux S2). En conséquence, les régions couramment amplifiées ont été déterminées par comparaison des régions amplifiées parmi les 58 SCLC, comprenant à la fois des tumeurs fraîches et des lignées cellulaires. Huit régions sur les chromosomes 1p, 2p, 8q et 9p étaient couramment (≥2 SCLC) amplifiées dans ces SCLC (tableau 1). Les tailles des régions variaient de 0,03 à 0,77 Mb (moyenne ± SD = 0,25 ± 0,23 Mb), et 34 gènes ont été cartographiés dans ces régions. Trois des 8 régions contenaient MYC oncogènes familiaux, MYCL1, MYCN, et MYC, respectivement, connu pour être fréquemment amplifié dans les CPPC (Wistuba et al., 2001 Kim et al., 2006 Voortman et al., 2010 Larsen et Minna, 2011 ).

Non Cytobande Début Finir Taille Gène Nom de l'échantillon Nombre de SCLC amplifiés
(Mo) (Mo) (Mo) Tumeur fraîche Ligne cellulaire
1 1p34.3 37.37 38.19 0.77 LOC728431, ZC3H12A, MEAF6, SNIP1, DNALI1, GNL2, RSPO1, C1orf109, CDCA8, EPHA10, MANEAL, YRDC, C1orf122, MTF1, INPP5B, SF3A3, FHL3, UTP11L, POU3F1 SM09-008T H1184 3
H510
2 1p34.2 39.96 40.05 0.09 TRIT1, MYCL1 SM09-012T H1184 6
H1963
H510
HCC33
H2141
3 2p24.3 15.98 16.16 0.18 MYCNOS, MYCN - H526 2
H69
4 8q12.2 62.01 62.18 0.17 LOC100130298 - H2171 3
Lu135
N417
5 8q12.2 62.36 62.39 0.03 CLVS1 - H2171 3
Lu135
N417
6 8q24.21 128.75 128.88 0.13 MYC, MIR1204, PVT1 H2171 6
SM09-011T1 H446
SM09-019T H82
N417
7 9p24.1 5.35 5.78 0.43 PLGRKT, CD274, PDCD1LG2, KIAA1432, ERMP1 R-513T H1607 3
SM09-010T
8 9p23 13.27 13.45 0.18 FLJ41200 - H1607 2
H446

MYCL1 et MYCN ont été co-amplifiés avec TRIT1 à 1p34.2 et MYCNOS à 2p24,3, respectivement, dans 6 et 2 SCLC. Dans la région 8q24.21, MYC, MIR1204, et PVT1 ont été co-amplifiés dans 6 SCLC. Les points de rupture du nombre de copies des régions amplifiées à 8q24.21 ont été cartographiés dans le PVT1 gène dans cinq des six SCLC (Tableaux d'informations de support S2 Informations de support Fig. S1). La région 1p34.3 a été co-amplifiée avec MYCL1 à 1p34.2, et les régions 8q12.2 ont été co-amplifiées avec MYC à 8q24.21, respectivement, dans plusieurs SCLC (Supporting Information Fig. S2). Par conséquent, la survenue de réarrangements intrachromosomiques compliqués a été suggérée dans le processus de MYCL1 et MYC amplification, entraînant la co-amplification de plusieurs autres gènes sur les chromosomes 1 et 8, respectivement.

En plus des régions sur les chromosomes 1, 2 et 8, deux nouvelles régions couramment amplifiées ont été identifiées sur les chromosomes 9p, 9p23 et 9p24.1 (tableau 1, fig. 1). La région 9p23 dont FLJ41200 a été amplifiée dans 2 SCLC, tandis que la région 9p24.1, y compris PLGRKT, CD274, PDCD1LG2, KIAA1432, et ERMP1, a été amplifié dans trois SCLC. Les deux régions ont été co-amplifiées dans la lignée cellulaire H1607, alors que seule la région 9p23 a été amplifiée dans la lignée cellulaire H446 et seule la région 9p24.1 a été amplifiée dans deux tumeurs fraîches (Supporting Information Fig. S2). Sur le chromosome 9p, NFIB à 9p23 et JAK2 à 9p24.1 ont été signalés comme étant amplifiés dans SCLC (Voortman et al., 2010 Dooley et al., 2011 ). Cependant, NFIB et JAK2 n'ont été amplifiés que dans un seul SCLC, respectivement. Par conséquent, ces deux gènes n'ont pas été cartographiés dans les régions couramment amplifiées sur le chromosome 9p (Tableau d'informations à l'appui S2 Tableau 1 Fig. 1).

Expression de gènes amplifiés sur le chromosome 9p

Cinq gènes, PLGRKT, CD274, PDCD1LG2, KIAA1432, et ERMP1, ont été cartographiés dans la région couramment amplifiée à 9p24.1 (tableau 1). Pour déterminer quels gènes ont été surexprimés par amplification génique, leur expression d'ARNm a été profilée dans 19 tumeurs fraîches (Informations complémentaires Fig. S3A). Ces cinq gènes ont été amplifiés dans l'une des 19 tumeurs, SM09-010T. Expression de PLGRKT, CD274 et KIAA1432, mais pas de PDCD1LG2 et ERMP1, était nettement élevé dans SM09-010T (Informations annexes Fig. S3B). Par conséquent, PLGRKT, CD274, et KIAA1432 pourrait être surexprimé par l'amplification génique dans les SCLC.

Pour déterminer davantage les gènes dont l'expression est associée au nombre de copies sur le chromosome 9p, nous avons ensuite réalisé l'étude d'association de l'expression génique avec le nombre de copies de gène dans 55 CPPC, dont 30 tumeurs fraîches et 25 lignées cellulaires (Tableau d'informations à l'appui S1A, B). En plus de PLGRKT, CD274 et KIAA1432 à 9p24.1 et FLJ41200 à 9p23 en tant que gènes couramment amplifiés dans les SCLC, NFIB à 9p23 et JAK2 à 9p24.1 ont également été soumis à l'analyse. Expression de CD274 et KIAA1432 dans les cellules amplifiées était significativement plus élevée que dans les cellules non amplifiées (P < 0,05) (Fig. 2A), et cinq gènes sauf FLJ41200 ont montré des associations significatives entre les niveaux d'expression d'ARNm et le nombre de copies (P < 0.05) (Fig. 2B). Notamment, KIAA1432 a montré la plus forte association entre eux (P = 1.04E-06). Par conséquent, KIAA1432 est la cible la plus puissante activée par amplification génique sur le chromosome 9p dans le SCLC. S'il y a une autre cible dans la région 9p23, NF1B est plus susceptible d'être celui que FLJ41200.

Copiez le nombre de gènes amplifiés définis par génomique-PCR en temps réel

Pour étudier plus avant la prévalence et la spécificité de l'amplification génique dans les régions des chromosomes 1, 2, 8 et 9 dans les SCLC, 87 SCLC comprenant 62 tumeurs et 25 lignées cellulaires ont été soumis à des analyses génomiques-PCR en temps réel. Parmi eux, 33 tumeurs et 25 lignées cellulaires ont également été soumises à des analyses de matrice SNP 250K (Tableau d'informations à l'appui S1A, B). Trois MYC les gènes de la famille et six gènes sur le chromosome 9p ont été analysés, et les critères d'amplification génique par PCR génomique en temps réel ont été définis comme des rapports de nombre de copies d'ADN 3 qui étaient équivalents au nombre de copies ≥6. Cinq des 33 tumeurs et 12 des 25 lignées cellulaires ont montré une amplification de 1 à 5 des 9 gènes par analyse par puces SNP 250K (Tableaux d'informations à l'appui S2). À l'exception de deux SCLC, la lignée cellulaire H1184 avec MYCL1 l'amplification et la tumeur SM09-011T1 avec MYC l'amplification, l'amplification des gènes définis par des puces SNP 250K a été détectée de manière cohérente par génomique-PCR en temps réel (Tableau d'informations à l'appui S3). D'autre part, dans sept SCLC sans amplification par des analyses de matrice SNP 250K, 1 à 6 gènes ont été jugés amplifiés par des analyses génomiques-PCR en temps réel. Les incohérences des résultats étaient dues aux raisons suivantes. Premièrement, seule une petite région comprenant MYC couvert par deux marqueurs SNP a été amplifié dans la lignée cellulaire Lu135. Par conséquent, cette région n'a pas été définie comme étant amplifiée par une analyse par puce SNP, mais définie comme étant amplifiée par une analyse génomique-PCR en temps réel. Deuxièmement, dans R-511T et SM09-006T, perte du numéro de copie du lieu de référence, RPPH1, sur le chromosome 14 a amélioré le degré d'amplification de plusieurs gènes par analyse génomique-PCR en temps réel. Troisièmement, dans H2195 et R-506M1, il était difficile de définir les nombres de copies probablement en raison de l'hétérogénéité des cellules aneuploïdes et de la présence de cellules non cancéreuses contaminées, respectivement. Par conséquent, dans ces SCLC, les gènes avec des ratios de nombre de copies 3 par PCR génomique en temps réel ont été définis comme cinq copies par analyse de matrice SNP.

Même avec quelques incohérences entre les résultats des analyses de puces SNP et ceux des analyses génomiques-PCR en temps réel, l'association entre eux était hautement significative (P = 5.58E-07 par le test exact de Fisher). Par conséquent, nous avons ensuite étudié la prévalence et la spécificité de l'amplification génique sur la base des données obtenues par analyse génomique-PCR en temps réel. L'amplification de ces gènes a été détectée dans 12 des 62 tumeurs fraîches (19,4 %) et 13 des 25 lignées cellulaires (52,0 %) (tableau 2). Trois MYC les gènes familiaux ont été amplifiés de manière mutuellement exclusive dans 16 SCLC (18,4 %). Les gènes sur le chromosome 9p ont été amplifiés dans 10 SCLC (11,5%). Notamment, NF1B/FLJ41200 à 9p23 et JAK2/CD274/PLGRKT/KIAA1432 à 9p24.21 n'étaient pas co-amplifiés dans 8 des 10 SCLC, ce qui indique que l'amplification de ces deux régions s'est produite indépendamment dans la plupart des SCLC. Par conséquent, la présence de gènes cibles pour l'amplification dans chaque région a été fortement suggérée. Pour cette raison, les spécificités de l'amplification 9p23 et de l'amplification 9p24.21 ont été analysées indépendamment parmi les 87 SCLC. Il est important de noter que quatre gènes de la région 9p24.1 ont été amplifiés de manière mutuellement exclusive avec MYC gènes familiaux, alors que MYC gène a été co-amplifié dans l'un des trois SCLC avec NF1B amplification, cohérente avec les résultats des analyses de matrice SNP 250K (Informations à l'appui Fig. S2).

1p34.2 2p24.3 8q24.21 9p23 9p24.1
Nom de l'échantillon MYCL1 MYCN MYC NFIB FLJ41200 JAK2 PLGRKT CD274 KIAA1432
H1963 +
HCC33 +
H510 +
H2141 +
SM09-012T +
S391T +
H69 +
H526 +
1591T +
R-511T +
H82 +
N417 +
Lu135 +
H2171 +
SM09-019T +
H446 + + +
H2195 + +
SM09-008T +
SM09-006T + + + + + +
H1607 + + + + +
R-506M1 + + + +
SM09-010T + + +
R-513T + + +
SM09-004T + +
1491M +
Taux d'amplification dans 87 CPPC (%) 6.9 4.6 6.9 3.4 5.7 3.4 6.9 6.9 6.9

Identification des transcriptions de fusion par séquençage de transcriptome entier

Quarante-deux SCLC, constitués de 19 tumeurs fraîches et de 23 lignées cellulaires, ont été soumis à un séquençage du transcriptome entier pour identifier les gènes de fusion exprimés dans les SCLC (tableaux d'information à l'appui S1A, B et S4). Le nombre total de lectures variait de 74 378 482 à 93 612 490, et leur moyenne était de 86 529 758. Un total de 60 transcrits de fusion, transcrits à partir d'une partie de 95 gènes, ont été identifiés comme étant exprimés par les critères d'environ 10 lectures d'extrémités appariées (PE) pour chaque transcrit (tableau 3). Vingt-deux d'entre eux (36,7%) étaient dans le cadre et devaient donc produire des protéines de fusion. Il n'y avait pas d'ensemble de transcrits de fusion 5'-3' détectés de manière récurrente dans les SCLC 2. Cependant, deux des gènes partenaires 5', PVT1 et RLF, ont été détectés de manière récurrente dans ≥2 SCLC (14 paires dans 7 SCLC). PVT1 a été détecté comme le gène partenaire 5' de sept paires de fusion avec différents gènes partenaires 3' dans cinq SCLC. Précédemment, PVT1 s'est avéré fusionné avec CHD7 dans H2171 et Lu135 (Campbell et al., 2008 Pleasance et al., 2010 ). Dans cette étude, PVT1-CHD7 a été détecté dans H2171 avec ≥10 lectures de PE mais n'était pas dans Lu135. RLF a été détecté comme le gène partenaire 5' de 7 paires de fusion avec différents gènes partenaires 3' dans 2 SCLC. RLF a été signalé comme étant un gène de fusion avec MYCL1 exprimé dans les cellules SCLC (Makela et al., 1991a , 1991b , 1995 ), et le RLF-MYCL1 la fusion a également été détectée dans H1963 avec ≥10 lectures d'EP dans cette étude. Trois des cinq paires de fusion ayant RLF comme gène partenaire 5', RLF-MYCL1, RLF-SMAP2 et RLF-FAM132A, devaient produire des protéines de fusion. Les 46 transcrits de fusion restants ont été détectés dans un seul SCLC, respectivement, et 19 d'entre eux devaient produire des protéines de fusion. Par conséquent, aucun des 22 transcrits de fusion prédits pour produire des protéines de fusion n'a été exprimé de manière récurrente dans plusieurs cas de CPPC.

Gène partenaire 5' Gène partenaire 3' Distance sur le génome (pb) Cadre
Non Échantillon #PE lit #jonction lit Gène ARNm Non Chr Ampli. Gène ARNm Non Chr Ampli. Dans le cadre
I. Transcriptions 5' détectées dans ≥ 2 cas
1 H82 408 239 PVT1 NR_003367.1 8 + MYH7 NM_000257.2 14 +
2 H2171 345 177 PVT1 NR_003367.1 8 + CHD7 NM_017780.3 8 + 67027313
3 H2171 219 20 PVT1 NR_003367.1 8 + SLC7A7 NM_001126105.2 14 105507749
4 H2171 114 17 PVT1 NR_003367.1 8 + CCNB1IP1 NM_021178.3 14 N / A
5 H2107 37 13 PVT1 NR_003367.1 8 NOL4 NM_001198546.1 18 N / A
6 N417 34 82 PVT1 NR_003367.1 8 + CLVS1 NM_173519.2 8 + 66392576
7 H446 12 26 PVT1 NR_003367.1 8 + LY6H NM_001130478.1 8 15125833
8 HCC33 525 128 RLF NM_012421.3 1 + UBE2J2 NM_058167.2 1 39417806
9 H1963 391 562 RLF NM_012421.3 1 + MYCL1 NM_001033081.2 1 + 259353 +
10 H1963 194 68 RLF NM_012421.3 1 + COL9A2 NM_001852.3 1 + 59570
11 H1963 118 68 RLF NM_012421.3 1 + BCL2L1 NM_001191.2 20 + N / A
12 H1963 112 124 RLF NM_012421.3 1 + HM13 NM_030789.2 20 + N / A
13 H1963 43 163 RLF NM_012421.3 1 + SMAP2 NM_001198978.1 1 + 133135 +
14 HCC33 33 132 RLF NM_012421.3 1 + FAM132A NM_001014980.2 1 39444938 +
II. Transcriptions de fusion détectées dans un seul cas
15 H1963 2168 1627 TPX2 NM_012112.4 20 + HM13 NM_030789.2 20 + 169703 +
16 SM09-012T 290 335 CAP1 NM_001105530.1 1 + MACF1 NM_012090.4 1 + 991332
17 H1963 226 52 BCL2L1 NM_138578.1 20 + HM13 NM_030789.2 20 + 94884
18 HCC33 193 83 TRIT1 NM_017646.4 1 + EP400 NM_015409.4 12 + N / A
19 H1963 125 45 BCL2L1 NM_138578.1 20 + DEM1 NM_022774.1 1 + N / A +
20 H2171 122 56 ENO2 NM_001975.2 12 ACRBP NM_032489.2 12 +
21 H1963 99 99 BCL2L1 NM_138578.1 20 + JANTES3 NM_014747.2 1 + N / A
22 SM09-004T 82 101 WAC NM_016628.4 10 GPR158 NM_020752,2 10 2931268
23 Lu139 79 45 CSMD3 NM_052900.2 8 MYC NM_002467.4 8 14299072
24 H1184 54 88 RERE NM_001042681.1 1 SLC2A5 NM_001135585.1 1 223728 +
25 H69 50 44 FOXK2 NM_004514.3 17 HEXDC NM_173620.2 17 77073
26 H1963 50 17 BCL2L1 NM_138578.1 20 + ZNF684 NM_152373.3 1 + N / A +
27 N417 42 30 NCOR2 NM_001077261.3 12 SCARBE1 NM_005505.4 12 210164
28 HCC33 41 71 UBE4B NM_001105562.2 1 TBCB NM_001281.2 19 N / A +
29 SM09-010T 41 43 KIAA1432 NM_001135920.2 9 + JAK2 NM_004972.3 9 501144 +
30 H1963 41 31 ZMPSTE24 NM_005857.4 1 + MFSD2A NM_001136493.1 1 + 288105
31 H510 38 37 SMEK1 NM_032560.4 14 CHALEUR3 NM_182922.2 16 N / A +
32 SM09-016T 36 48 NAV2 NM_001111018.1 11 LOC494141 NR_026563.1 11 1137161
33 Lu135 32 23 LRRC45 NM_144999.2 17 GCGR NM_000160.3 17 209390
34 H510 30 67 TWSG1 NM_020648.5 18 PIK3C3 NM_002647.2 18 30132781
35 H69 30 34 PAWR NM_002583.2 12 GNS NM_002076.3 12 14832520
36 H1184 25 20 SF3A3 NM_006802.2 1 + GNL2 NM_013285.2 1 + 361067 +
37 H209 24 19 CREBBP NM_001079846.1 16 SLX4 NM_032444.2 16 113472
38 SM09-016T 24 14 RASA2 NM_006506.2 3 NICN1 NM_032316.3 3 91739168 +
39 H1963 22 48 SMAP2 NM_022733.2 1 + MYCL1 NM_001033081.2 1 + 472040
40 SM09-016T 22 13 SFMBT1 NM_001005158.2 3 AP2A2 NM_001242837.1 11 N / A
41 H510 21 12 PTK2 NM_001199649.1 8 PKHD1L1 NM_177531.4 8 31125439
42 H526 19 31 SLC25A36 NM_001104647.1 3 PLSCR1 NM_021105.2 3 5534191
43 H526 19 20 XPR1 NM_001135669.1 1 TRMT1L NM_001202423.1 1 4227805 +
44 H2195 18 22 HMBOX1 NM_001135726.1 8 ZFAND3 NM_021943.2 6 N / A +
45 SM09-014T 18 10 CRLS1 NM_001127458.1 20 KCNK17 NM_001135111.1 6 N / A
46 H510 17 14 PHF15 NM_015288.4 5 UBE2B NM_003337.2 5 133999
47 H1963 17 10 BCL2L1 NM_138578.1 20 + ZNF643 NM_023070.2 1 + N / A +
48 SM09-016T 15 40 ATP5L NM_006476.4 11 TEAD1 NM_021961.5 11 105305820
49 SM09-014T 14 23 NUDCD1 NM_001128211.1 8 SYBU NM_001099743.1 8 244247 +
50 Lu134 14 17 SPG11 NM_001160227.1 15 SORD NM_003104.5 15 359425 +
51 SM09-016T 14 17 NGLY1 NM_001145293.1 3 CCKBR NM_176875.3 11 N / A +
52 SM09-016T 13 21 DLEC1 NM_007335.2 3 ODZ4 NM_001098816.2 11 N / A
53 H1963 13 19 PPT1 NM_000310.3 1 + BCL2L1 NM_001191.2 20 + N / A
54 H128 13 12 PNIA NM_004536.2 5 OCLN NM_001205254.1 5 1414179
55 H1963 12 10 BCL2L1 NM_138578.1 20 + BMP8B NM_001720.3 1 + N / A
56 H526 12 10 CIT NM_001206999.1 12 RFC5 NM_001130112.2 12 1653559 +
57 H1963 11 22 BCL2L1 NM_138578.1 20 + RLF NM_012421.3 1 + N / A
58 SM09-018T 10 22 NFIX NM_002501.2 19 GATAD2A NM_017660.3 19 6287032 +
59 SM09-016T 11 19 ÉTAPE1 NM_005862.2 3 STXBP5L NM_014980.2 3 14912391
60 H2171 10 12 PICALM NM_001008660.2 11 CCDC81 NM_001156474.1 11 304853 +

Amplification de gènes avec des fusions

Nous avons ensuite étudié le nombre de copies de 95 gènes dans les 60 paires de fusion identifiées par séquençage du transcriptome entier (tableau 3). Vingt-huit des gènes partenaires 5' détectés dans 9 SCLC et 22 des gènes partenaires 3' détectés dans sept SCLC ont été cartographiés dans les régions amplifiées.

Dans quatre des cinq SCLC exprimant des transcrits de fusion avec PVT1 comme gène partenaire 5', les portions 5' du PVT1 gène à 8q24.21 ont été amplifiés, indiquant que des cassures chromosomiques s'étaient produites dans le PVT1 locus (Informations complémentaires Fig. S1). Trois des sept gènes fusionnés avec PVT1 ont également été amplifiés. Par conséquent, il a été indiqué que les cassures chromosomiques se produisent souvent dans le PVT1 lieu pendant le processus de MYC amplification. Pour cette raison, nous avons poursuivi nos recherches PVT1 transcrits de fusion exprimés dans les lignées cellulaires H2171, Lu135 et N417, qui ont montré une co-amplification de trois régions sur le chromosome 8q (tableau 1). En plus de PVT1-CHD7 (PE lit = 345), PVT1-SLC7A7 (PE lu = 219), et PVT1-CCNB1IP1 (PE lectures = 114) ont été détectés dans H2171. Comme décrit ci-dessus, non PVT1 fusion a été détectée dans Lu135. PVT1-CLVS1 (PE lu = 34) et PVT1-ASPH (lectures de PE = 27, lectures de jonction = 9) ont été détectées dans N417.

RLF, détecté comme le gène partenaire 5' de sept paires de fusion dans deux lignées cellulaires, H1963 et HCC33, a été amplifié dans les deux lignées cellulaires (tableau 3). Trois gènes partenaires 3′, MYCL1, COL9A2, et SMAP2, fusionné avec RLF en H1963 ont également été cartographiés sur 1p34.2 et amplifiés. Deux autres gènes partenaires 3', BCL2L1 et HM13, fusionné avec RLF en H1963 et mappés sur 20q11.21, ont également été amplifiés. Les deux autres gènes partenaires 3', UBE2J2 et FAM132A à 1p36.33, ont également été amplifiés dans HCC33 avec 2 SNP consécutifs. Par conséquent, la production de transcrits de fusion avec RLF s'accompagnait toujours d'une amplification des gènes 5′ et 3′, indiquant que ces gènes avaient fusionné au cours du processus de MYCL1 amplification.

Ces résultats indiquent fortement que l'amplification de plusieurs régions sur les chromosomes 1 et 8 simultanément mais pas séquentiellement se produit dans les cellules SCLC, et soutiennent en outre que des réarrangements intrachromosomiques compliqués se produisent dans le processus de MYCL1 ou MYC amplification, entraînant la co-amplification et la fusion de plusieurs gènes sur les chromosomes 1 et 8. Par conséquent, le PVT1 et RLF loci seraient des points chauds de ruptures chromosomiques dans le processus d'amplification génique dans les cellules SCLC.

SCLC avec expression de plusieurs transcriptions de fusion

Soixante transcrits de fusion ont été détectés dans 23 des 42 SCLC (tableau 3, tableau d'informations à l'appui S4), indiquant la présence de SCLC exprimant plusieurs transcrits de fusion. En effet, seize paires de fusion constituées de 15 gènes ont été identifiées dans H1963 (Supporting Information Fig. S4A). Douze des 15 gènes, dont MYCL1, ont été mappés sur l'amplicon 1p34.2, et les 3 gènes restants ont été mappés sur l'amplicon 20q11.21. Sept fusions étaient intrachromosomiques entre les gènes à 1p34.2 ou 20q11.21, tandis que les neuf autres fusions étaient interchromosomiques entre les gènes à 1p34.2 et les gènes à 20q11.21. Par conséquent, en H1963, des réarrangements chromosomiques compliqués se sont probablement produits au cours du processus de MYCL1 amplification.

Sept paires de fusion composées de 14 gènes ont été identifiées dans SM09-016T (Supporting Information Fig. S4B). Sept et 7 des 14 gènes ont été mappés sur les chromosomes 3 et 11, respectivement. Les gènes partenaires 5' et 3' pour quatre des sept fusions ont été mappés sur les mêmes chromosomes, tandis que ceux des trois fusions restantes ont été mappés sur des chromosomes différents. Par conséquent, ces gènes ont été fusionnés par des réarrangements intrachromosomiques ou interchromosomiques. Fait intéressant, aucun gène fusionné n'a été amplifié dans SM09-016T, ce qui indique que des réarrangements chromosomiques compliqués s'étaient produits sans amplification génique. Deux à cinq transcrits de fusion ont été détectés dans huit autres SCLC. Parmi les 24 fusions détectées dans ces SCLC, 18 d'entre elles étaient intrachromosomiques et les six autres étaient interchromosomiques. Huit des gènes partenaires 5' et quatre des gènes partenaires 3' ont été cartographiés dans les régions amplifiées. Par conséquent, les réarrangements intrachromosomiques semblaient se produire préférentiellement dans les cellules SCLC indépendamment du processus d'amplification génique.

KIAA1432-JAK2 Fusion détectée dans un SCLC avec amplification 9p24.1

Fait intéressant, un KIAA1432–JAK2 le transcrit de fusion a été détecté dans SM09-010T avec amplification de la KIAA1432 gène à 9p24.1 (tableau 3 figure 3A). En outre, trois (4,6%) des 65 SCLC analysés par RT-PCR se sont avérés exprimer KIAA1432–JAK2 transcrits de fusion. Cependant, un seul d'entre eux exprimé dans SM09-010T était prédit produire une protéine de fusion, bien que le domaine tyrosine kinase ait été interrompu par fusion (Fig. 3B).


Conditions de santé liées aux changements génétiques

Achondroplasie

Deux mutations dans le FGFR3 gène cause plus de 99% des cas d'achondroplasie, qui est une forme de nanisme à membres courts. Les deux mutations conduisent au même changement dans la protéine FGFR3. Plus précisément, le bloc de construction de protéine (acide aminé) glycine est remplacé par l'acide aminé arginine à la position de protéine 380 (écrit comme Gly380Arg ou G380R). Les chercheurs pensent que ce changement génétique rend le récepteur trop actif, ce qui entraîne des perturbations de la croissance osseuse qui surviennent dans ce trouble.

Syndrome de Crouzon avec acanthosis nigricans

Un seul FGFR3 une mutation génique a été identifiée chez des personnes atteintes du syndrome de Crouzon avec acanthosis nigricans. Cette maladie rare provoque une jonction prématurée des os du crâne (craniosynostose), entraînant une tête difforme et des traits du visage distinctifs, ainsi qu'une anomalie cutanée appelée acanthosis nigricans qui se caractérise par une peau épaisse, sombre et veloutée dans les plis et les plis du corps. Le changement génétique qui provoque le syndrome de Crouzon avec acanthosis nigricans remplace l'acide aminé alanine par l'acide aminé glutamique à la position 391 de la protéine FGFR3 (écrit Ala391Glu ou A391E). Le récepteur altéré est plus facilement activé que la normale et peut déclencher des voies de signalisation même sans attachement de facteurs de croissance. L'hyperactivité résultante de la protéine FGFR3 perturbe la croissance normale des os du crâne et de la peau, conduisant aux caractéristiques du syndrome de Crouzon avec acanthosis nigricans.

Naevus épidermique

mutations dans le FGFR3 ont été trouvés chez environ 30 % des personnes atteintes d'un certain type de naevus épidermique (pluriel : naevus). Spécifiquement, FGFR3 les mutations génétiques sont associées à certains naevus épidermiques kératinocytaires, qui sont des excroissances cutanées anormales composées de cellules cutanées appelées kératinocytes. FGFR3 aucune mutation génétique n'a été trouvée dans d'autres types de naevus épidermiques.

Le plus commun FGFR3 mutation génique dans les naevus épidermiques modifie un seul acide aminé dans la protéine FGFR3. L'acide aminé arginine est remplacé par l'acide aminé cystéine en position 248 (écrit Arg248Cys ou R248C). Cette mutation crée une protéine qui est activée sans attachement d'un facteur de croissance, ce qui signifie que la protéine FGFR3 est constamment active. Des études suggèrent que les cellules avec ce FGFR3 mutation génique se développent et se divisent plus que les cellules normales. La prolifération des cellules de la peau qui en résulte conduit à des naevus épidermiques.

Les FGFR3 les mutations génétiques trouvées dans les naevus épidermiques se produisent également chez les personnes atteintes d'une autre anomalie cutanée appelée kératose séborrhéique et chez les personnes atteintes de troubles squelettiques connus sous le nom de dysplasie thanatophorique, syndrome de Crouzon avec acanthosis nigricans et SADDAN (chacun décrit dans une autre section de cette page). Cependant, contrairement aux affections squelettiques, les mutations associées aux naevus épidermiques (et à la kératose séborrhéique) sont des mutations somatiques qui surviennent de manière aléatoire. Dans les naevus épidermiques, les mutations se produisent au cours des premiers stades de développement avant la naissance et ne sont présentes que dans les cellules du naevus, et non dans les cellules cutanées normales qui l'entourent.

Hypochondroplasie

Plus de 25 mutations dans le FGFR3 gène ont été identifiés chez les personnes atteintes d'hypochondroplasie, une autre forme de nanisme à membres courts qui est plus doux que l'achondroplasie. De nombreux cas sont causés par l'un des deux FGFR3 mutations géniques, qui conduisent toutes deux au même changement dans la protéine FGFR3. Spécifiquement, l'acide aminé asparagine est remplacé par l'acide aminé lysine à la position de protéine 540 (écrit comme Asn540Lys ou N540K). Autre FGFR3 les mutations génétiques sont probablement à l'origine d'un petit nombre de cas d'hypochondroplasie. Bien que les effets de ces mutations associées à l'hypochondroplasie n'aient pas été expliqués, ils entraînent probablement une légère hyperactivité du récepteur, ce qui entraîne des perturbations de la croissance osseuse qui surviennent dans ce trouble.

Syndrome lacrimo-auriculo-dento-digital

Au moins une mutation dans le FGFR3 s'est avéré responsable du syndrome lacrimo-auriculo-dento-digital (LADD). Les principales caractéristiques du syndrome LADD sont une production anormale de larmes, des oreilles mal formées avec une perte auditive, une diminution de la production de salive, de petites dents et des déformations de la main. Les FGFR3 La mutation du gène qui cause le syndrome LADD remplace l'acide aminé acide aspartique par l'acide aminé asparagine en position 513 dans la protéine du récepteur FGFR3 (écrit Asp513Asn ou D513N). Cette mutation réduit très probablement la capacité de la protéine réceptrice FGFR3 à déclencher une signalisation chimique dans les cellules lorsqu'elle est attachée à son facteur de croissance. Ces défauts de signalisation cellulaire perturbent la maturation et le développement cellulaires, ce qui entraîne une formation anormale des oreilles, du squelette et des glandes dans les yeux et la bouche chez les personnes atteintes du syndrome LADD.

Syndrome de Muenke

Une seule mutation dans le FGFR3 Il a été démontré que le gène cause le syndrome de Muenke, qui est une maladie qui provoque une craniosténose, entraînant une tête déformée et des traits du visage distinctifs. Des signes et symptômes supplémentaires peuvent inclure une perte auditive, des anomalies subtiles des mains et des pieds et un retard de développement. La mutation à l'origine du syndrome de Muenke substitue l'acide aminé arginine à l'acide aminé proline en position 250 dans la protéine FGFR3 (écrite Pro250Arg ou P250R). Cette mutation entraîne la production d'un récepteur trop actif, ce qui permet aux os du crâne de fusionner plus tôt que la normale.

La mutation Pro250Arg a également été identifiée chez certaines personnes atteintes d'une craniosténose coronale apparemment isolée. Cette condition est caractérisée par une fusion prématurée de la ligne de croissance qui traverse le sommet de la tête d'une oreille à l'autre (la suture coronale). Les personnes atteintes de craniosténose coronale isolée ne présentent pas les autres caractéristiques parfois associées au syndrome de Muenke (telles que des anomalies des mains et des pieds).

SADDAN

Une mutation dans le FGFR3 a été identifié chez des personnes atteintes de SADDAN (achondroplasie sévère avec retard de développement et acanthosis nigricans). SADDAN se caractérise par un nanisme des membres courts (achondroplasie), un retard de développement profond et une peau épaisse, foncée et veloutée. Le changement génétique qui provoque cette condition substitue l'acide aminé méthionine à l'acide aminé lysine à la position 650 de la protéine FGFR3 (écrite Lys650Met ou K650M). Les chercheurs pensent que cette mutation suractive fortement la protéine FGFR3, ce qui entraîne de graves problèmes de croissance osseuse. Il reste incertain comment la mutation provoque un retard de développement ou acanthosis nigricans.

Dysplasie thanatophorique

mutations dans le FGFR3 ont été identifiés chez des personnes atteintes de dysplasie thanatophorique, qui est un trouble squelettique grave caractérisé par des membres extrêmement courts et une poitrine étroite. Plus que 10 FGFR3 des mutations génétiques ont été trouvées pour provoquer une dysplasie thanatophorique de type I. La plupart de ces mutations modifient un seul acide aminé dans la protéine FGFR3. La mutation la plus courante substitue l'acide aminé cystéine à l'acide aminé arginine à la position de la protéine 248 (écrit Arg248Cys ou R248C). D'autres mutations font que la protéine est plus longue que la normale.

Il a été démontré qu'une seule mutation provoque une dysplasie thanatophorique de type II. Cette mutation remplace l'acide aminé lysine par l'acide aminé glutamique en position 650 de la protéine FGFR3 (écrit Lys650Glu ou K650E). Ce changement affecte une partie différente de la protéine FGFR3 que les mutations qui causent la dysplasie thanatophorique de type I.

Les modifications génétiques responsables des deux types de dysplasie thanatophorique provoquent une hyperactivité du récepteur FGFR3, ce qui entraîne de graves problèmes de croissance osseuse qui surviennent dans cette condition.

Cancer de la vessie

Certaines mutations génétiques sont acquises au cours de la vie d'une personne et ne sont présentes que dans certaines cellules. Ces changements, appelés mutations somatiques, ne sont pas héréditaires. mutations somatiques dans le FGFR3 ont été trouvés dans certains cas de cancer de la vessie. Le cancer de la vessie est une maladie dans laquelle certaines cellules de la vessie deviennent anormales et se multiplient de manière incontrôlable pour former une tumeur. Le cancer de la vessie peut provoquer du sang dans les urines, des douleurs pendant la miction, des mictions fréquentes, la sensation d'avoir besoin d'uriner sans pouvoir le faire ou des douleurs lombaires.

Le cancer de la vessie est généralement divisé en deux types, le cancer de la vessie non invasif sur le plan musculaire (NMIBC) et le cancer de la vessie invasif sur le plan musculaire (MIBC), en fonction de l'emplacement de la tumeur dans la vessie. Environ 80 pour cent des tumeurs NMIBC ont FGFR3 mutations génétiques. FGFR3 les mutations génétiques modifient des acides aminés uniques dans la protéine FGFR3, qui semble suractiver la signalisation protéique. En conséquence, les cellules de la vessie sont susceptibles de croître et de se diviser de manière anormale. Cette division cellulaire incontrôlée conduit à la formation d'un cancer de la vessie.

Le myélome multiple

MedlinePlus Genetics fournit des informations sur le myélome multiple

Autres troubles

Au moins deux FGFR3 il a été découvert que des mutations génétiques provoquent un trouble rare appelé camptodactylie, grande taille, syndrome de perte auditive (syndrome CATSHL). Les personnes atteintes de cette maladie sont plus grandes que la moyenne et ont généralement une perte auditive. Ils peuvent également avoir des doigts ou des orteils pliés en permanence (camptodactylie) et d'autres anomalies squelettiques. Les chercheurs suggèrent que le FGFR3 les mutations génétiques impliquées dans le syndrome CATSHL réduisent la fonction de la protéine FGFR3, bien qu'il ne soit pas clair comment les mutations conduisent aux signes et symptômes de la maladie.

mutations dans le FGFR3 ont été trouvés chez 30 à 70 pour cent des personnes atteintes de kératoses séborrhéiques, qui sont de petites tumeurs sombres, non cancéreuses (bénignes) de la peau causées par une prolifération de cellules cutanées. Les kératoses séborrhéiques se développent à l'âge adulte et sont observées chez une majorité de personnes de plus de 50 ans. FGFR3 les mutations génétiques associées aux kératoses séborrhéiques sont des mutations somatiques et ne sont pas héréditaires. Au moins neuf FGFR3 des mutations génétiques ont été identifiées chez des personnes atteintes de kératoses séborrhéiques. Ces mutations modifient des acides aminés simples dans la protéine FGFR3. Les protéines FGFR3 mutées sont anormalement actives, ce qui entraîne une prolifération des cellules de la peau, conduisant à une kératose séborrhéique. Il a été suggéré que les mutations impliquées dans la kératose séborrhéique pourraient être causées par l'exposition à la lumière ultraviolette (UV).

L'Arg248Cys somatique FGFR3 La mutation génétique trouvée dans le naevus épidermique (décrite ci-dessus) peut également provoquer le syndrome de Garcia-Hafner-Happle (également connu sous le nom de syndrome du naevus épidermique du récepteur 3 du facteur de croissance des fibroblastes). Cette affection se caractérise par un naevus épidermique kératinocytaire mou et velouté et des problèmes neurologiques, tels que des convulsions, une déficience intellectuelle, un sous-développement du tissu qui relie les deux moitiés du cerveau (corps calleux) et une perte de cellules cérébrales (atrophie corticale) . On pense que les problèmes neurologiques surviennent parce que la mutation somatique affecte les cellules du cerveau en plus de celles de la peau.

Autres cancers

En plus du cancer de la vessie, des mutations somatiques dans le FGFR3 ont été associés à un cancer des globules blancs (myélome multiple) et à un cancer du col de l'utérus. Certains cas de myélome multiple sont liés à un réarrangement du matériel génétique (une translocation) impliquant le chromosome 14 et la région du chromosome 4 contenant le FGFR3 gène. Les mutations qui ont été associées au cancer du col de l'utérus sont des changements de nucléotides simples dans le FGFR3 gène.

FGFR3 On pense que les mutations génétiques qui conduisent au myélome multiple et au cancer du col de l'utérus suractivent la protéine FGFR3 dans certaines cellules. Le récepteur muté dirige les cellules à croître et à se diviser en l'absence de signaux provenant de l'extérieur de la cellule. Cette division incontrôlée peut conduire à la prolifération de cellules cancéreuses.


Abréviations

Aire sous la courbe dose-réponse

Chromosome artificiel bactérien

Encyclopédie des lignées cellulaires cancéreuses

Hybridation génomique comparative

Portail de réponse thérapeutique contre le cancer

Base de données de variants génomiques

Famille de tumeurs du sarcome d'Ewing

Hybridation in situ en fluorescence

Comité de nomenclature des gènes HUGO

Organisation du génome humain

La perte de l'hétérozygotie

Réseau national complet de lutte contre le cancer

CGH chromosomique à base d'oligonucléotides

Réaction en chaîne par polymérase

Polymorphisme d'un seul nucléotide

Recherche thérapeutiquement applicable pour générer des traitements efficaces


Copier les gènes de la maladie liés à la variation du nombre

L'un des problèmes les plus importants et les plus difficiles en biomédecine et en génomique est de savoir comment identifier les gènes liés aux maladies. Les ensembles de données issus des biotechnologies à haut débit ont été largement utilisés pour surmonter ce problème sous divers angles, par exemple., épigénomique, génomique, transcriptomique, protéomique, métabolomique. Au niveau génomique, les variations du nombre de copies (CNV) ont été reconnues comme des variations génétiques critiques, qui contribuent de manière significative à la diversité génomique. Ils ont été associés à des maladies à la fois courantes et complexes et ont donc une grande influence sur une variété de troubles génétiques mendéliens et somatiques.

Résultats

Dans cette revue, basée sur une variété de maladies complexes, nous donnons un aperçu du rôle essentiel de l'utilisation des CNV pour identifier les gènes liés à la maladie, et discutons en détail des différentes méthodes à haut débit et de séquençage appliquées pour la détection des CNV. Certaines limites et défis concernant la CNV sont également mis en évidence.

Conclusion

Une détection fiable des CNV permettra non seulement de discriminer des mutations motrices pour diverses maladies, mais aidera également à développer une médecine personnalisée en l'intégrant à d'autres caractéristiques génomiques.


Gènes où une mutation invalidante et une amplification du nombre de copies provoquent différentes maladies génétiques - Biologie

Les mutations génétiques sont influencées par le contexte, la structure et les caractéristiques génomiques de la séquence.

Les mécanismes responsables de nombreux points chauds mutationnels ont été identifiés.

Les points chauds sont en grande partie liés aux loci sujets aux mutations lors de la réplication ou de la réparation de l'ADN.

La sélection conduit à des mutations récurrentes dans les tissus somatiques qui peuvent être exploitées à des fins thérapeutiques.

La mutation du génome humain se traduit par trois classes de variation génomique : les variantes à nucléotide unique, les insertions ou délétions courtes et les grandes variantes structurelles (SV). Certaines mutations se produisent au cours de processus normaux, tels que la recombinaison méiotique ou le développement des cellules B, et d'autres résultent de la réplication de l'ADN ou de la réparation aberrante de cassures dans des contextes spécifiques à une séquence. Quel que soit le mécanisme, les mutations sont soumises à la sélection et certains points chauds peuvent se manifester par la maladie. Ici, nous discutons des régions génomiques sujettes aux mutations, des mécanismes contribuant à la susceptibilité aux mutations et des processus conduisant à leur accumulation dans les génomes normaux et somatiques. Avec un séquençage plus précis et plus précis du génome humain, des points chauds de mutation supplémentaires, des détails mécanistiques de leur formation et la pertinence des points chauds pour l'évolution et la maladie seront probablement découverts.


Voir la vidéo: Mutations de lADN et variabilité génétique -SVT - LA VIE 1ère spé #3 - Mathrix (Janvier 2022).