Informations

1.1.1 : Thèmes et concepts de biologie - Biologie


La biologie est la science qui étudie la vie. Qu'est-ce que la vie exactement ? Cela peut sembler une question idiote avec une réponse évidente, mais il n'est pas facile de définir la vie. Par exemple, une branche de la biologie appelée virologie étudie les virus, qui présentent certaines des caractéristiques des entités vivantes mais en manquent d'autres. Il s'avère que bien que les virus puissent attaquer les organismes vivants, provoquer des maladies et même se reproduire, ils ne répondent pas aux critères que les biologistes utilisent pour définir la vie.

Depuis ses débuts, la biologie s'est débattue avec quatre questions : Quelles sont les propriétés communes qui rendent quelque chose « vivant » ? Comment fonctionnent ces divers êtres vivants ? Face à la diversité remarquable du vivant, comment organiser les différents types d'organismes pour mieux les comprendre ? Et enfin, ce que les biologistes cherchent finalement à comprendre, comment cette diversité est-elle apparue et comment se poursuit-elle ? Alors que de nouveaux organismes sont découverts chaque jour, les biologistes continuent de chercher des réponses à ces questions et à d'autres.

Propriétés de la vie

Tous les groupes d'organismes vivants partagent plusieurs caractéristiques ou fonctions clés : ordre, sensibilité ou réponse aux stimuli, reproduction, adaptation, croissance et développement, régulation, homéostasie et traitement énergétique. Considérées ensemble, ces huit caractéristiques servent à définir la vie.

Commander

Les organismes sont des structures hautement organisées qui se composent d'une ou plusieurs cellules. Même les organismes unicellulaires très simples sont remarquablement complexes. A l'intérieur de chaque cellule, les atomes forment des molécules. Ceux-ci constituent à leur tour des composants cellulaires ou des organites. Les organismes multicellulaires, qui peuvent être constitués de millions de cellules individuelles, ont un avantage sur les organismes unicellulaires en ce que leurs cellules peuvent être spécialisées pour remplir des fonctions spécifiques, et même sacrifiées dans certaines situations pour le bien de l'organisme dans son ensemble. Comment ces cellules spécialisées se réunissent pour former des organes tels que le cœur, les poumons ou la peau dans des organismes comme le crapaud illustré dans Graphique 1.1.1 sera discuté plus tard.

Sensibilité ou réponse aux stimuli

Les organismes réagissent à divers stimuli. Par exemple, les plantes peuvent se pencher vers une source de lumière ou réagir au toucher (Graphique 1.1.2). Même de minuscules bactéries peuvent s'approcher ou s'éloigner des produits chimiques (un processus appelé chimiotaxie) ou de la lumière (phototaxie). Le mouvement vers un stimulus est considéré comme une réponse positive, tandis que l'éloignement d'un stimulus est considéré comme une réponse négative.

Regardez cette vidéo pour voir comment la plante sensible réagit à un stimulus tactile.

La reproduction

Les organismes unicellulaires se reproduisent en dupliquant d'abord leur ADN, qui est le matériel génétique, puis en le divisant de manière égale au fur et à mesure que la cellule se prépare à se diviser pour former deux nouvelles cellules. De nombreux organismes multicellulaires (ceux constitués de plus d'une cellule) produisent des cellules reproductrices spécialisées qui formeront de nouveaux individus. Lors de la reproduction, l'ADN contenant des gènes est transmis à la progéniture d'un organisme. Ces gènes sont la raison pour laquelle la progéniture appartiendra à la même espèce et aura des caractéristiques similaires à celles du parent, telles que la couleur de la fourrure et le groupe sanguin.

Adaptation

Tous les organismes vivants présentent une « adéquation » avec leur environnement. Les biologistes appellent cet ajustement l'adaptation et il s'agit d'une conséquence de l'évolution par sélection naturelle, qui opère dans chaque lignée d'organismes reproducteurs. Les exemples d'adaptations sont divers et uniques, des archées résistantes à la chaleur qui vivent dans des sources chaudes bouillantes à la longueur de la langue d'un papillon se nourrissant de nectar qui correspond à la taille de la fleur dont il se nourrit. Toutes les adaptations améliorent le potentiel reproducteur de l'individu qui les présente, y compris leur capacité à survivre pour se reproduire. Les adaptations ne sont pas constantes. À mesure qu'un environnement change, la sélection naturelle fait en sorte que les caractéristiques des individus d'une population suivent ces changements.

La croissance et le développement

Les organismes grandissent et se développent selon des instructions spécifiques codées par leurs gènes. Ces gènes fournissent des instructions qui dirigeront la croissance et le développement cellulaires, garantissant que les jeunes d'une espèce (figure 1.1.3) grandiront pour présenter bon nombre des mêmes caractéristiques que ses parents.

Régulation

Même les plus petits organismes sont complexes et nécessitent de multiples mécanismes de régulation pour coordonner les fonctions internes, telles que le transport des nutriments, la réponse aux stimuli et la gestion des stress environnementaux. Par exemple, les systèmes d'organes tels que les systèmes digestif ou circulatoire remplissent des fonctions spécifiques telles que le transport de l'oxygène dans tout le corps, l'élimination des déchets, la fourniture de nutriments à chaque cellule et le refroidissement du corps.

Homéostasie

Pour fonctionner correctement, les cellules nécessitent des conditions appropriées telles qu'une température, un pH et des concentrations de divers produits chimiques appropriés. Ces conditions peuvent cependant changer d'un moment à l'autre. Les organismes sont capables de maintenir des conditions internes dans une plage étroite presque constamment, malgré les changements environnementaux, grâce à un processus appelé homéostasie ou «état stable» - la capacité d'un organisme à maintenir des conditions internes constantes. Par exemple, de nombreux organismes régulent leur température corporelle dans un processus connu sous le nom de thermorégulation. Les organismes qui vivent dans les climats froids, comme l'ours polaire (figure 1.1.4), ont des structures corporelles qui les aident à résister aux basses températures et à conserver la chaleur corporelle. Dans les climats chauds, les organismes disposent de méthodes (telles que la transpiration chez l'homme ou l'halètement chez le chien) qui les aident à évacuer l'excès de chaleur corporelle.

Traitement de l'énergie

Tous les organismes (comme le condor de Californie illustré à la figure 1.1.5) utilisent une source d'énergie pour leurs activités métaboliques. Certains organismes captent l'énergie du soleil et la convertissent en énergie chimique dans les aliments ; d'autres utilisent l'énergie chimique des molécules qu'ils absorbent.

Niveaux d'organisation des êtres vivants

Les êtres vivants sont hautement organisés et structurés, suivant une hiérarchie sur une échelle de petite à grande. L'atome est l'unité la plus petite et la plus fondamentale de la matière. Il est constitué d'un noyau entouré d'électrons. Les atomes forment des molécules. Une molécule est une structure chimique constituée d'au moins deux atomes maintenus ensemble par une liaison chimique. De nombreuses molécules biologiquement importantes sont des macromolécules, de grosses molécules qui sont généralement formées en combinant des unités plus petites appelées monomères. Un exemple de macromolécule est l'acide désoxyribonucléique (ADN) (Figure 1.1.6), qui contient les instructions pour le fonctionnement de l'organisme qui le contient.

CONCEPT EN ACTION

Pour voir une animation de cette molécule d'ADN, cliquez ici.

Certaines cellules contiennent des agrégats de macromolécules entourés de membranes ; ceux-ci sont appelés organites. Les organites sont de petites structures qui existent dans les cellules et remplissent des fonctions spécialisées. Tous les êtres vivants sont constitués de cellules ; la cellule elle-même est la plus petite unité fondamentale de structure et de fonction dans les organismes vivants. (Cette exigence est la raison pour laquelle les virus ne sont pas considérés comme vivants : ils ne sont pas constitués de cellules. Pour fabriquer de nouveaux virus, ils doivent envahir et détourner une cellule vivante ; ce n'est qu'alors qu'ils peuvent obtenir les matériaux dont ils ont besoin pour se reproduire.) Certains organismes sont constitués de une seule cellule et d'autres sont multicellulaires. Les cellules sont classées comme procaryotes ou eucaryotes. Les procaryotes sont des organismes unicellulaires dépourvus d'organites entourés d'une membrane et n'ayant pas de noyau entouré de membranes nucléaires; en revanche, les cellules des eucaryotes ont des organites et des noyaux liés à la membrane.

Dans la plupart des organismes multicellulaires, les cellules se combinent pour former des tissus, qui sont des groupes de cellules similaires remplissant la même fonction. Les organes sont des ensembles de tissus regroupés autour d'une fonction commune. Les organes sont présents non seulement chez les animaux mais aussi chez les plantes. Un système organique est un niveau supérieur d'organisation qui se compose d'organes fonctionnellement liés. Par exemple, les animaux vertébrés ont de nombreux systèmes d'organes, tels que le système circulatoire qui transporte le sang dans tout le corps et vers et depuis les poumons ; il comprend des organes tels que le cœur et les vaisseaux sanguins. Les organismes sont des entités vivantes individuelles. Par exemple, chaque arbre d'une forêt est un organisme. Les procaryotes unicellulaires et les eucaryotes unicellulaires sont également considérés comme des organismes et sont généralement appelés micro-organismes.

CONNEXION ARTISTIQUE

Graphique 1.1.7 : D'un atome à la Terre entière, la biologie examine tous les aspects de la vie. (crédit « molécule » : modification d'œuvre par Jane Whitney ; crédit « organelles » : modification d'œuvre par Louisa Howard ; crédit « cellules » : modification d'œuvre par Bruce Wetzel, Harry Schaefer, National Cancer Institute ; crédit « tissu » : modification du travail par "Kilbad"/Wikimedia Commons ; crédit "organes" : modification du travail par Mariana Ruiz Villareal, Joaquim Alves Gaspar ; crédit "organismes" : modification du travail par Peter Dutton ; crédit "ecosystem" : modification du travail par "gigi4791 "/Flickr; crédit "biosphère" : modification des travaux par la NASA)

Lequel des énoncés suivants est faux?

  1. Les tissus existent dans les organes qui existent dans les systèmes organiques.
  2. Les communautés existent au sein des populations qui existent au sein des écosystèmes.
  3. Les organites existent dans les cellules qui existent dans les tissus.
  4. Les communautés existent au sein des écosystèmes qui existent dans la biosphère.

B

Tous les individus d'une espèce vivant dans une zone spécifique sont collectivement appelés une population. Par exemple, une forêt peut comprendre de nombreux pins blancs. Tous ces pins représentent la population de pins blancs de cette forêt. Différentes populations peuvent vivre dans la même zone spécifique. Par exemple, la forêt avec les pins comprend des populations de plantes à fleurs mais aussi des insectes et des populations microbiennes. Une communauté est l'ensemble des populations habitant un territoire particulier. Par exemple, tous les arbres, fleurs, insectes et autres populations d'une forêt forment la communauté de la forêt. La forêt elle-même est un écosystème. Un écosystème se compose de tous les êtres vivants d'une zone particulière ainsi que des parties abiotiques ou non vivantes de cet environnement, telles que l'azote dans le sol ou l'eau de pluie. Au plus haut niveau d'organisation (Graphique 1.1.7), la biosphère est la collection de tous les écosystèmes, et elle représente les zones de vie sur Terre. Il comprend la terre, l'eau et des parties de l'atmosphère.

La diversité de la vie

La science de la biologie a une portée très large car il y a une énorme diversité de vie sur Terre. La source de cette diversité est l'évolution, le processus de changement progressif au cours duquel de nouvelles espèces naissent à partir d'espèces plus anciennes. Les biologistes évolutionnistes étudient l'évolution des êtres vivants dans tout, du monde microscopique aux écosystèmes.

Au XVIIIe siècle, un scientifique du nom de Carl Linnaeus a proposé pour la première fois d'organiser les espèces d'organismes connues en une taxonomie hiérarchique. Dans ce système, les espèces qui se ressemblent le plus sont regroupées au sein d'un groupe appelé genre. De plus, des genres similaires (le pluriel de genre) sont regroupés au sein d'une famille. Ce regroupement se poursuit jusqu'à ce que tous les organismes soient rassemblés en groupes au plus haut niveau. Le système taxonomique actuel compte désormais huit niveaux dans sa hiérarchie, du plus bas au plus élevé, ce sont : espèce, genre, famille, ordre, classe, embranchement, royaume, domaine. Ainsi, les espèces sont regroupées au sein de genres, les genres sont regroupés au sein de familles, les familles sont regroupées au sein d'ordres, et ainsi de suite (Graphique 1.1.8).

Le niveau le plus élevé, le domaine, est un ajout relativement nouveau au système depuis les années 1990. Les scientifiques reconnaissent maintenant trois domaines de la vie, les Eucarya, les Archaea et les Bactéries. Le domaine Eukarya contient des organismes qui ont des cellules avec des noyaux. Il comprend les royaumes des champignons, des plantes, des animaux et plusieurs royaumes des protistes. Les Archaea sont des organismes unicellulaires sans noyau et comprennent de nombreux extrêmophiles qui vivent dans des environnements difficiles comme les sources chaudes. Les bactéries sont un autre groupe tout à fait différent d'organismes unicellulaires sans noyau (figure 1.1.9). Les archées et les bactéries sont des procaryotes, un nom informel pour les cellules sans noyaux. La reconnaissance dans les années 1990 que certaines «bactéries», maintenant connues sous le nom d'archées, étaient aussi différentes génétiquement et biochimiquement des autres cellules bactériennes qu'elles l'étaient des eucaryotes, a motivé la recommandation de diviser la vie en trois domaines. Ce changement dramatique dans notre connaissance de l'arbre de vie démontre que les classifications ne sont pas permanentes et changeront lorsque de nouvelles informations seront disponibles.

En plus du système taxonomique hiérarchique, Linnaeus a été le premier à nommer les organismes en utilisant deux noms uniques, maintenant appelés système de nommage binomial. Avant Linnaeus, l'utilisation de noms communs pour désigner des organismes causait de la confusion car il y avait des différences régionales dans ces noms communs. Les noms binomiaux se composent du nom de genre (en majuscule) et du nom d'espèce (tout en minuscules). Les deux noms sont mis en italique lorsqu'ils sont imprimés. Chaque espèce se voit attribuer un binôme unique qui est reconnu dans le monde entier, de sorte qu'un scientifique de n'importe quel endroit peut savoir à quel organisme il se réfère. Par exemple, le geai bleu d'Amérique du Nord est connu uniquement sous le nom de Cyanocitta cristata. Notre propre espèce est Homo sapiens.

L'ÉVOLUTION EN ACTION : Carl Woese et l'arbre phylogénétique

Les relations évolutives de diverses formes de vie sur Terre peuvent être résumées dans un arbre phylogénétique. Un arbre phylogénétique est un diagramme montrant les relations évolutives entre les espèces biologiques sur la base des similitudes et des différences dans les traits génétiques ou physiques ou les deux. Un arbre phylogénétique est composé de points de ramification, ou nœuds, et de branches. Les nœuds internes représentent les ancêtres et sont des points d'évolution lorsque, sur la base de preuves scientifiques, on pense qu'un ancêtre a divergé pour former deux nouvelles espèces. La longueur de chaque branche peut être considérée comme une estimation du temps relatif.

Dans le passé, les biologistes regroupaient les organismes vivants en cinq règnes : les animaux, les plantes, les champignons, les protistes et les bactéries. Les travaux pionniers du microbiologiste américain Carl Woese au début des années 1970 ont cependant montré que la vie sur Terre a évolué selon trois lignées, désormais appelées domaines : les bactéries, les archées et les eukaryas. Woese a proposé le domaine comme nouveau niveau taxonomique et Archaea comme nouveau domaine, pour refléter le nouvel arbre phylogénétique (Graphique 1.1.10). De nombreux organismes appartenant au domaine Archaea vivent dans des conditions extrêmes et sont appelés extrêmophiles. Pour construire son arbre, Woese a utilisé des relations génétiques plutôt que des similitudes basées sur la morphologie (forme). Divers gènes ont été utilisés dans les études phylogénétiques. L'arbre de Woese a été construit à partir du séquençage comparatif des gènes qui sont universellement distribués, trouvés sous une forme légèrement modifiée dans chaque organisme, conservés (ce qui signifie que ces gènes ne sont restés que légèrement modifiés tout au long de l'évolution) et d'une longueur appropriée.

Branches d'études biologiques

La portée de la biologie est large et contient donc de nombreuses branches et sous-disciplines. Les biologistes peuvent poursuivre l'une de ces sous-disciplines et travailler dans un domaine plus ciblé. Par exemple, la biologie moléculaire étudie les processus biologiques au niveau moléculaire, y compris les interactions entre les molécules telles que l'ADN, l'ARN et les protéines, ainsi que la façon dont ils sont régulés. La microbiologie est l'étude de la structure et de la fonction des micro-organismes. C'est une branche assez large elle-même, et selon le sujet d'étude, il y a aussi des physiologistes microbiens, des écologistes et des généticiens, entre autres.

Un autre domaine d'études biologiques, la neurobiologie, étudie la biologie du système nerveux et, bien qu'elle soit considérée comme une branche de la biologie, elle est également reconnue comme un domaine d'études interdisciplinaire connu sous le nom de neurosciences. En raison de sa nature interdisciplinaire, cette sous-discipline étudie différentes fonctions du système nerveux en utilisant des approches moléculaires, cellulaires, développementales, médicales et informatiques.

La paléontologie, une autre branche de la biologie, utilise des fossiles pour étudier l'histoire de la vie (figure 1.1.11). La zoologie et la botanique sont respectivement l'étude des animaux et des plantes. Les biologistes peuvent également se spécialiser en tant que biotechnologues, écologistes ou physiologistes, pour ne citer que quelques domaines. Les biotechnologistes appliquent les connaissances de la biologie pour créer des produits utiles. Les écologistes étudient les interactions des organismes dans leur environnement. Les physiologistes étudient le fonctionnement des cellules, des tissus et des organes. Ceci n'est qu'un petit échantillon des nombreux domaines que les biologistes peuvent explorer. De notre propre corps au monde dans lequel nous vivons, les découvertes en biologie peuvent nous affecter de manière très directe et importante. Nous dépendons de ces découvertes pour notre santé, nos sources de nourriture et les avantages fournis par notre écosystème. Pour cette raison, la connaissance de la biologie peut nous aider à prendre des décisions dans notre vie de tous les jours.

Le développement de la technologie au XXe siècle qui se poursuit aujourd'hui, en particulier la technologie pour décrire et manipuler le matériel génétique, l'ADN, a transformé la biologie. Cette transformation permettra aux biologistes de continuer à comprendre plus en détail l'histoire de la vie, le fonctionnement du corps humain, nos origines humaines et comment les humains peuvent survivre en tant qu'espèce sur cette planète malgré le stress causé par notre nombre croissant. Les biologistes continuent de déchiffrer d'énormes mystères sur la vie, suggérant que nous commençons seulement à comprendre la vie sur la planète, son histoire et notre relation avec elle. Pour cette raison et pour d'autres, la connaissance de la biologie acquise grâce à ce manuel et à d'autres médias imprimés et électroniques devrait être un avantage quel que soit le domaine dans lequel vous entrez.

CARRIÈRES EN ACTION : Scientifique judiciaire

La science médico-légale est l'application de la science pour répondre à des questions liées à la loi. Les biologistes ainsi que les chimistes et les biochimistes peuvent être des médecins légistes. Les médecins légistes fournissent des preuves scientifiques à utiliser devant les tribunaux, et leur travail consiste à examiner les traces associées aux crimes. L'intérêt pour la science médico-légale a augmenté au cours des dernières années, peut-être à cause des émissions de télévision populaires qui présentent des scientifiques légistes en cours d'emploi. En outre, le développement de techniques moléculaires et la création de bases de données ADN ont mis à jour les types de travail que les scientifiques judiciaires peuvent effectuer. Leurs activités professionnelles sont principalement liées aux crimes contre les personnes tels que le meurtre, le viol et les agressions. Leur travail consiste à analyser des échantillons tels que les cheveux, le sang et d'autres fluides corporels, ainsi qu'à traiter l'ADN (Graphique 1.1.12) que l'on trouve dans de nombreux environnements et matériaux différents.Les médecins légistes analysent également d'autres preuves biologiques laissées sur les scènes de crime, telles que des parties d'insectes ou des grains de pollen. Les étudiants qui souhaitent poursuivre une carrière en sciences médico-légales devront probablement suivre des cours de chimie et de biologie ainsi que des cours intensifs de mathématiques.

Sommaire

La biologie est la science de la vie. Tous les organismes vivants partagent plusieurs propriétés clés telles que l'ordre, la sensibilité ou la réponse aux stimuli, la reproduction, l'adaptation, la croissance et le développement, la régulation, l'homéostasie et le traitement de l'énergie. Les êtres vivants sont hautement organisés suivant une hiérarchie qui comprend des atomes, des molécules, des organites, des cellules, des tissus, des organes et des systèmes organiques. Les organismes, à leur tour, sont regroupés en populations, communautés, écosystèmes et biosphère. L'évolution est la source de la formidable diversité biologique sur Terre aujourd'hui. Un diagramme appelé arbre phylogénétique peut être utilisé pour montrer les relations évolutives entre les organismes. La biologie est très large et comprend de nombreuses branches et sous-disciplines. Les exemples incluent la biologie moléculaire, la microbiologie, la neurobiologie, la zoologie et la botanique, entre autres.

Glossaire

atome
une unité de base de la matière qui ne peut pas être décomposée par des réactions chimiques normales
la biologie
l'étude des organismes vivants et de leurs interactions les uns avec les autres et leurs environnements
biosphère
une collection de tous les écosystèmes de la Terre
cellule
la plus petite unité fondamentale de structure et de fonction chez les êtres vivants
communauté
un ensemble de populations habitant une zone particulière
écosystème
tous les êtres vivants dans une zone particulière ainsi que les parties abiotiques et non vivantes de cet environnement
eucaryote
un organisme avec des cellules qui ont des noyaux et des organites liés à la membrane
évolution
le processus de changement progressif d'une population qui peut également conduire à de nouvelles espèces issues d'espèces plus anciennes
homéostasie
la capacité d'un organisme à maintenir des conditions internes constantes
macromolécule
une grosse molécule généralement formée par l'assemblage de molécules plus petites
molécule
une structure chimique constituée d'au moins deux atomes maintenus ensemble par une liaison chimique
organe
une structure formée de tissus fonctionnant ensemble pour remplir une fonction commune
Système d'organes
le niveau supérieur d'organisation qui se compose d'organes fonctionnellement liés
organite
un compartiment ou un sac lié à une membrane à l'intérieur d'une cellule
organisme
une entité vivante individuelle
arbre phylogénétique
un diagramme montrant les relations évolutives entre les espèces biologiques sur la base des similitudes et des différences dans les traits génétiques ou physiques ou les deux
population
tous les individus d'une espèce vivant dans une zone spécifique
procaryote
un organisme unicellulaire dépourvu de noyau ou de tout autre organite lié à la membrane
tissu
un groupe de cellules similaires remplissant la même fonction

11 exemples de biologie dans la vie de tous les jours

La biologie est un domaine scientifique tout à fait intéressant qui est au centre des préoccupations depuis des siècles. Les concepts biologiques complexes taraudent tout le monde depuis des temps immémoriaux. Indépendamment des progrès réalisés dans le domaine de la science et de la technologie, de nombreux phénomènes biologiques demandent encore une explication sous-jacente raisonnable. Le mystère concernant l'origine de la vie sur terre et l'apparition de l'homme reste à élucider. C'est à cause de la biologie que nous existons. Tout ce que nous faisons implique la biologie d'une manière ou d'une autre. Même lorsque vous ne faites rien ou que vous dormez, chaque cellule de votre corps travaille pour vous. Bref, dès la naissance, c'est la biologie qui joue son rôle tu deviens enfant, tu rencontres l'adolescence, tu accueilles l'âge adulte et après, tu commences à vieillir. Tous ces processus magnifiques mais fascinants ont un principe biologique caché. Aujourd'hui, nous allons discuter de quelques exemples de la vie quotidienne où la biologie joue un rôle important.

1. Agriculture

La nourriture que nous consommons est le résultat de l'agriculture. Nous, les humains et les animaux dépendons des produits agricoles pour notre subsistance. Les fruits, les légumes, les céréales, les légumineuses, les huiles, le miel, le sucre, le thé, le café et d'autres aliments sont tous obtenus à partir des plantes. Les agriculteurs sont en mesure de produire des variétés de cultures à haut rendement et résistantes aux parasites. Les scientifiques étudient la nature complexe, l'occurrence et le cycle de vie des ravageurs et, à l'aide de techniques biotechnologiques, ils sont en mesure d'obtenir une meilleure qualité et quantité des cultures. C'est parce que la pollinisation se produit que les fleurs germent et que les graines sont obtenues. L'ensemble du processus de pollinisation n'est rendu possible que grâce aux oiseaux et aux abeilles.

2. Nourriture et boissons

Ce qui nous maintient en vie, ce sont les aliments que nous consommons. Sans nourriture, la viabilité de la vie n'est pas possible. Nos aliments proviennent de plantes et d'animaux. Les microbes aident à la formation de produits laitiers comme le caillé, le fromage et le yaourt. La bactérie Lactobacilles aide à la formation de caillé à partir du lait. De même, la levure, l'un des eucaryotes les plus simples, est utilisée dans le processus de fermentation. Le vin est obtenu à partir de raisins par un processus similaire. De plus, il existe certains microbes et autres processus biologiques qui contribuent indirectement à la production d'aliments. Les micro-organismes présents dans le sol agissent comme un agent de décomposition, qui aide à la production du compost à partir de matière organique morte et en décomposition. Ce compost agit comme un engrais efficace pour les plantes en croissance.

3. Santé et médecine

Chaque fois que nous tombons malades, nous consultons un médecin. Le médecin nous donne des médicaments et nous sommes tous prêts à partir. Comment cela a-t-il été rendu possible ? La réponse à cette question se trouve dans la biologie. Ce n'est que grâce à la biologie que l'étude de divers micro-organismes pathogènes a été rendue possible. Les chercheurs ont étudié la nature complexe des micro-organismes, leur apparition, leur cycle de vie, leur reproduction et leur propagation et, par conséquent, ont mis au point des mesures de contrôle pour prévenir la maladie. Même la formulation de médicaments pour lutter contre les micro-organismes pathogènes a été rendue possible grâce à l'étude de la biologie de ces micro-organismes.

4. Vêtements

Qu'il s'agisse d'étés torrides ou d'hivers glaçants, c'est la biologie qui vous protège. Vous portez des vêtements en coton respirant en été qui sont obtenus à partir de plantes. Les pulls épais qui vous couvrent pendant les hivers froids sont faits de laine provenant de moutons. Les teintures pour le lin, le nylon et les tissus sont dérivées des plantes et le polyester des fossiles, mais quel que soit le tissu, il doit être à base de plantes.

5. Décalage horaire

Lorsque vous voyagez autour du globe et traversez plusieurs fuseaux horaires, vous avez du mal à vous endormir dans le nouveau pays. Pas vous ? Pourquoi cela se produit-il et quelle en est la raison sous-jacente ? La réponse à cette question réside dans le fait que votre corps a son horloge interne, appelée rythme circadien. L'horloge biologique est chargée de décider de l'heure de rester éveillé et de l'heure de s'endormir. Le décalage horaire se produit parce que votre horloge biologique (rythme circadien) est synchronisée avec votre fuseau horaire d'origine. Votre horloge biologique ne tient pas compte de la distance que vous avez parcourue. Désormais, plus vous traverserez de fuseaux horaires, plus votre décalage horaire sera sévère.

6. Cellules souches

Les cellules souches sont des cellules indifférenciées. Ces cellules peuvent se répliquer rapidement. Les cellules souches sont de la plus haute importance pour nous car elles peuvent se développer en différents types de cellules, comme les cellules musculaires, les cellules nerveuses, les cellules cardiaques, etc. Nous, les humains, avons commencé notre vie en tant que cellule unique et, après des divisions cellulaires infinies, développé en organismes multicellulaires. Les cellules souches fonctionnent de manière similaire. Les cellules souches embryonnaires, cellules totalement indifférenciées, sont appelées cellules maîtres. Les cellules souches peuvent remplacer les tissus et organes endommagés, corriger le mauvais fonctionnement de certaines parties des organes, introduire des défauts génétiques pour la recherche et permettre aux scientifiques de développer de nouveaux médicaments pour le traitement des maladies. Une fois de plus, la biologie agit comme votre sauveur.

7. Mal d'altitude

Vous vous souvenez peut-être de la dernière fois que vous avez visité une station de montagne et que vous vous êtes senti mal à l'aise à des altitudes plus élevées. Quelle peut en être l'explication probable ? Maintenant, encore une fois, la réponse à cette simple question réside dans la biologie. Le mal d'altitude est un groupe de symptômes qui surviennent lorsque vous montez à une altitude plus élevée. Comme vous n'avez pas donné à votre corps le temps de s'adapter aux changements de pression et à la réduction des niveaux d'oxygène à haute altitude, les symptômes du mal de l'altitude surviennent trop rapidement. Néanmoins, votre corps fascinant réagit en augmentant le rythme respiratoire, ce qui, à son tour, augmente non seulement les niveaux d'oxygène dans le sang, mais modifie également les niveaux d'acidité du sang, la pression pulmonaire, les niveaux d'électrolytes et l'équilibre salin.

8. Environnement et écosystème

Ce n'est que grâce au domaine de la biologie que vous êtes mieux à même de comprendre la nature des interactions entre les organismes et l'environnement. Les diverses interactions qui ont lieu entre les humains sont aussi dues à leur étude au niveau biologique. Nous sommes mieux à même de comprendre la psychologie et la sociologie humaines via l'étude biologique du corps humain. Non seulement les interactions humaines, mais nous sommes, maintenant, capables de discerner d'autres interactions écologiques et l'étude des écosystèmes aussi. Cela nous aide à identifier les dangers potentiels pour l'écosystème et la terre. Une fois que nous avons identifié les dangers, nous pouvons aller de l'avant pour l'amélioration de l'environnement.

9. Alimenter la Terre

Depuis que la prise de conscience a augmenté, nous nous tournons vers les sources d'énergie renouvelables. Cependant, nous ne pouvons pas nier le fait que la majeure partie du monde fonctionne encore aux combustibles fossiles, en particulier le charbon et le pétrole. Maintenant, que sont les combustibles fossiles ? Les combustibles fossiles ne sont que des dérivés du vivant et ont une origine biologique. Les combustibles fossiles comme le pétrole et le gaz naturel sont dérivés de la matière biologique morte et en décomposition.

10. Biocarburants de nouvelle génération

Inquiet à cause de l'épuisement rapide des combustibles fossiles? Ne vous embêtez pas un peu car la biologie, encore une fois, est à votre secours. Le développement des biocarburants est en plein essor. La culture et la transformation des Jatropha curcas L. (JCL) sont en augmentation car l'huile de Jatropha est effectivement utilisée dans les moteurs et les générateurs diesel. Ce qui est plus surprenant, c'est le fait que l'huile de Jatropha peut être utilisée directement après l'extraction, même sans raffinage. L'éthanol, fabriqué à partir de sucres végétaux, est mélangé à de l'essence afin d'augmenter le rendement énergétique. Divers biocarburants actuellement utilisés sont des dérivés d'algues, de maïs, de blé, d'huile de colza et de betteraves sucrières. L'utilisation de biocarburants ouvrira une nouvelle voie de carburants pour lutter contre le problème de la pollution et des émissions de carbone.

11. Drogues : aubaine ou fléau ?

La consommation de drogues et d'alcool est en augmentation chez les jeunes, ce qui est un problème majeur pour la société. La majorité des drogues, comme les opioïdes, les cannabinoïdes et les alcaloïdes de coca, sont obtenues à partir des plantes à fleurs. D'autres médicaments comme les barbituriques, les amphétamines et les benzodiazépines ont été utilisés pour traiter les patients souffrant de maladie mentale, de dépression et d'insomnie. En plus des médicaments ci-dessus, la morphine a été utilisée comme analgésique et sédatif utile. Cependant, malheureusement, de nombreuses personnes ont commencé à abuser de ces médicaments. Lorsque ces médicaments sont pris à d'autres fins, et encore moins à des fins médicinales, ils affectent les fonctions physiques, physiologiques et psychologiques d'un individu. La consommation de substances a des effets indésirables tels que l'insuffisance respiratoire, l'insuffisance cardiaque, l'hémorragie cérébrale et peut conduire au coma et à la mort.


INTRODUCTION

Les membres de la famille des GTPases réglementaires qui comprennent les ARF, les ARF-like (ARL) et les SAR sont devenus des régulateurs clés de la signalisation cellulaire impliqués dans presque tous les aspects de la biologie cellulaire (tableaux 1 à 3, figure 1 et tableaux supplémentaires I- III) (D'Souza-Schorey et Chavrier, 2006 Donaldson et Jackson, 2011 Jackson et Bouvet, 2014). Leur importance est soulignée par les résultats montrant que des délétions ou des mutations complètes ou conditionnelles entraînent une létalité embryonnaire ou des défauts spécifiques à un organe, avec des liens avec diverses maladies (tableau 4) (Seixas et al., 2013 Zhang et al., 2013). Les GTPases de la famille ARF contrôlent les processus cellulaires clés, y compris le trafic membranaire bidirectionnel (sécrétion et endocytose), la ciliogenèse, le métabolisme des lipides, la consommation d'énergie, la motilité, la division, l'apoptose et la régulation transcriptionnelle. Comme toutes les GTPases réglementaires, les GTPases de la famille ARF fonctionnent comme des « commutateurs moléculaires » en interconvertissant entre les conformations inactives (liées au GDP) et actives (liées au GTP). Lors de la liaison au GTP, les GTPases activées modifient leurs conformations, ce qui augmente leur affinité pour les effecteurs et peut modifier leur localisation dans les cellules, dont chacune contribue à la génération d'une sortie biologique spécifique. Les GTPases de la famille ARF activées (liées au GTP) propagent leurs effets via une redistribution spécifique des effecteurs (par exemple, le recrutement à une membrane), l'activation allostérique de l'activité enzymatique de l'effecteur, des changements de conformation au sein de l'effecteur entraînant une affinité accrue pour d'autres composants cellulaires (protéines, lipides, etc.), ou une combinaison de ces changements. En conséquence, la sortie du signal de ces GTPases est étroitement contrôlée par la liaison régulée du GTP et la demi-vie de l'état activé. Celles-ci sont à leur tour contrôlées par la stimulation de la libération de GDP lié (pour permettre au GTP de se lier spontanément) par les facteurs d'échange de nucléotides guaniques (GEF) et de leur activité intrinsèque de GTPase par les protéines activatrices de GTPase (GAP) (Casanova, 2007 Inoue et Randazzo, 2007 Randazzo et al., 2007 Bui et al., 2009 Spang et al., 2010 Est et Kahn, 2011 Wright et al., 2014 Vitali et al., 2017). Ainsi, la triade GEF-GTPase-GAP peut être considérée comme un composant minimal dans les voies de signalisation qui modifient une grande partie des comportements cellulaires. Pourtant, malgré leur importance évidente en biologie cellulaire et leurs liens avec les pathologies humaines, notre compréhension des voies impliquées et des mécanismes moléculaires reste fragmentaire. Dans cette revue, nous résumons brièvement les rôles connus des GTPases de la famille ARF, leurs GEF et GAP, leur localisation dans les cellules et leurs interacteurs. Plutôt que de décrire en détail l'une des nombreuses voies dans lesquelles ils opèrent, nous soulignons plutôt le chevauchement étendu des spécificités et des actions entre les membres de la famille, car cela représente le plus grand défi pour parvenir à une compréhension approfondie de leurs mécanismes d'action. Parce que chaque voie nécessite la triade minimale GEF-GTPase-GAP, nous plaidons en faveur d'une approche systématique pour étudier chaque famille et les trois familles ensemble. Nous terminons notre examen en soulignant quelques questions et défis clés dans la signalisation ARF, et espérons qu'il inspire plus d'efforts de collaboration pour aborder le domaine vaste, complexe, mais d'une importance vitale de la signalisation ARF.

TABLEAU 1 : GTPases de la famille ARF humaine.

Les noms des gènes du National Center for Biotechnology Information (NCBI) sont répertoriés, ainsi que la localisation cellulaire, les fonctions identifiées et les intéracteurs protéiques. Les abréviations utilisées incluent CDR, volants dorsaux circulaires EE, endosomes précoces PLD, phospholipase D PM, membrane plasmique RE, endosomes de recyclage RR, bâtonnets et anneaux. Des informations supplémentaires sont incluses dans le tableau supplémentaire I.

Les noms des gènes NCBI sont répertoriés, ainsi que la localisation cellulaire, les fonctions identifiées et les intéracteurs protéiques. Les abréviations utilisées incluent PM, membrane plasmique PSD, densités postsynaptiques, RE, recyclage des endosomes TGN, trans-Réseau Golgi. Des informations supplémentaires sont incluses dans le tableau supplémentaire II.

Les noms des gènes NCBI sont répertoriés, ainsi que la localisation cellulaire, les fonctions identifiées et les intéracteurs protéiques. Les abréviations utilisées incluent CDR, volants dorsaux circulaires EE, endosomes précoces EGFR, récepteur du facteur de croissance épidermique FA, adhérences focales LD, gouttelettes lipidiques LE, endosomes tardifs PM, membrane plasmique RE, endosomes de recyclage RRs, bâtonnets et anneaux SF, fibres de stress. Des informations supplémentaires sont incluses dans le tableau supplémentaire III.

FIGURE 1 : Localisation subcellulaire des GTPases de la famille ARF, ARF GEF et ARF GAP. Une cellule schématique avec des organites (en rouge) montrant la localisation des GTPases (en bleu clair), des GEF (en violet) et des GAP (en vert). Des informations plus détaillées sur ces localisations sont fournies dans les références citées dans le texte.

TABLEAU 4 : Phénotypes de souris avec des mutations/délétions des GTPases de la famille ARF.

Sont indiquées les protéines ARF et ARL supprimées soit sous forme de knock-out du corps entier (knockout conventionnel), soit d'une manière spécifique au type cellulaire ou tissulaire, y compris les délétions inductibles (knockout conditionnel). E, jour embryonnaire ENU, N-éthyle-N-nitrosourée HGF, facteur de croissance des hépatocytes P, VLDL jour postnatal, lipoprotéines de très basse densité.


Réalité virtuelle et mixte (VMR)

Avec l'augmentation de la puissance de calcul, des technologies qui étaient coûteuses ou impossibles à mettre en œuvre dans le passé sont désormais accessibles dans les ordinateurs portables et les téléphones mobiles (Kish 2004 Waldrop 2016). Ces technologies révolutionnent aujourd'hui la manière dont nous interagissons avec le monde, dont nous apprenons et dont nous enseignons (Veletsianos 2010). La réalité virtuelle et mixte (VMR, voir Fig 1 pour la terminologie) est l'une de ces technologies qui a attiré une attention croissante dans les communautés académiques et enseignantes (Mazuryk et Gervautz 1996). En fait, au cours de la dernière décennie, il y a eu une augmentation exponentielle de la publication d'articles sur des sujets impliquant la réalité virtuelle et mixte dans l'éducation (Fig. 2a). La VMR peut être définie comme un monde alternatif rempli d'entités générées par ordinateur qui interagissent avec les systèmes sensoriels et moteurs humains pour provoquer un sentiment de « présence » (état psychologique) chez le sujet grâce à l'utilisation d'une technologie « immersive » (c'est-à-dire, la technologie qui simule un environnement qui n'est pas nécessairement réel) (Yoh 2001). La présence peut être définie comme « un état de dissociation de la réalité dans lequel les gens ressentent l'expérience subjective d'exister dans l'environnement numérique (Slater 2003). » Bien que la présence et l'immersion aient été utilisées de manière interchangeable (Barbot et Kaufman 2020), les expériences qui augmentent la présence n'augmentent pas nécessairement les sentiments immersifs, et vice versa (voir la méta-analyse de Cummings et Bailenson 2016), suggérant que, bien que ces termes fassent référence au sentiment « d'être là », ils ne sont pas nécessairement équivalents. Néanmoins, les deux sont importants dans les applications VMR. Selon le dictionnaire Oxford, la réalité virtuelle est définie comme « des images et des sons créés par un ordinateur qui semblent presque réels à l'utilisateur, qui peut interagir avec eux à l'aide de capteurs », ce qui souligne que la présence et l'immersion sont des aspects clés de la réalité virtuelle ( voir par exemple, Lombart et al. 2020).Notez qu'ici, la réalité virtuelle fait référence à la fois au matériel (c'est-à-dire aux casques) mais aussi plus largement à la technologie (dont les casques font partie). Notre définition de travail de la réalité virtuelle dans cet article se concentre sur cette dernière. Selon la taxonomie de Milgram et al. (1995), les expériences immersives sont réalisées grâce à un continuum complexe de fidélité de reproduction des environnements réels et virtuels, où les limites des approches ainsi que du matériel (par exemple, les appareils et les écrans) peuvent influencer le degré d'expérience immersive et de présence disponible pour l'utilisateur (Milgram et al. 1995). Notez, cependant, que le sentiment de présence et d'immersion n'est pas nécessairement le but ultime des technologies VMR (Milgram et al. 1995 mais voir Robinett 1992 Sheridan 1992), bien que les affichages de plus en plus réalistes puissent éventuellement entraîner une sensation d'immersion complète et présence (Naimark 1991).

Le continuum réalité-virtualité. AR—réalité augmentée AV—virtualité augmentée VR—réalité virtuelle [basé sur (Milgram et al. 1995)]. Dans un article très influent, Milgram, Takemura, Utsumi et Kishino (1995) ont proposé le continuum réalité-virtualité pour classer les technologies de réalité virtuelle, augmentée et mixte. D'un côté du spectre se trouve le monde réel (réalité) et, de l'autre côté du spectre, le monde entièrement virtuel (virtualité) où réside la réalité virtuelle (VR) au sens strict. Entre les extrêmes, se trouve la réalité augmentée (RA), qui repose principalement sur des éléments du monde réel, mais avec l'ajout d'entités virtuelles, l'exemple le plus connu (et controversé) de la RA a été Pokemon Go ! (Serino et al. 2016 Zsila et al. 2018) - et la Virtualité Augmentée (AV) avec le contraire de la RA, c'est-à-dire principalement un monde virtuel mais avec l'ajout d'entités « réelles ». AR et AV sont des cas de réalité mixte (MR), où des éléments réels et virtuels sont entrelacés au sein de l'application. Pour les besoins de cet article et pour des raisons de simplicité, nous nous référons à AR, AV et VR comme réalité virtuelle et mixte (VMR) car elles ont toutes un certain degré de composants virtuels introduits dans l'application

L'importance croissante de la VMR dans le contexte académique et éducatif. une Web of Science Topic requête de publications (à gauche) et de citations (à droite) impliquant VMR et éducation (orange) et VMR et biologie (rouge). Les recherches WoS ont été menées le 12 mai 2020 avec des requêtes de terme de recherche « réalité (virtuelle ET augmentée) ET éducation » ou « réalité (virtuelle ET augmentée) ET biologie ». Pour chaque recherche, les comptes rendus et actes de conférences ont été exclus. Au total, 6443 et 133 articles correspondaient respectivement aux critères de sélection. b Aperçu schématique du potentiel d'impact de la VMR sur la biologie. D'une part, VMR a été de plus en plus utilisé pour l'enseignement d'une variété de sujets au sein de la biologie. À mesure que la technologie progresse, il peut être possible de combiner d'autres technologies de pointe telles que l'apprentissage automatique et l'intelligence artificielle pour créer un monde virtuel évolutif autonome (BioVR) qui nous permet de mieux comprendre les processus biologiques.

Le VMR existe depuis des décennies et on pense qu'il a son origine dans les années 1960 lorsque Morton Heilig a créé l'un des premiers simulateurs multisensoriels immersifs qui incluaient des stimuli tels que le son, l'odeur, le vent et les vibrations (appelé « Sensorama ») ( Heilig 1962 Mazuryk et Gervautz 1996). Depuis lors, la technologie VR a considérablement progressé au point qu'aujourd'hui, de nombreuses plates-formes existent pour créer et expérimenter des applications VMR (par exemple, Jerald et al. 2014 Ledermann et Schmalstieg 2005 Wexelblat 2014). Au cours de la dernière décennie, l'utilisation de la VMR dans l'enseignement et l'apprentissage a considérablement augmenté et couvre une variété de sujets (Davies et al. 2019 Hoffman et Vu 1997 Makransky et al. 2016 Mikropoulos et Natsis 2011), y compris la biologie (Makransky et al. 2016 Shim et al. 2003 Shim et al. 2000). Une méta-analyse de seize études a montré que les simulateurs chirurgicaux VMR réduisent le temps nécessaire pour terminer les interventions chirurgicales, suggérant une acquisition plus efficace des compétences chirurgicales (Haque et Srinivasan 2006). De même, la VMR a été utilisée comme technologie de formation et de simulation des interventions en cas de catastrophe, améliorant ainsi le domaine de la médecine de catastrophe (Gout et al. 2020). Cette adoption réussie de la VMR en médecine émerge probablement en raison de l'impossibilité de reproduire des situations réelles (par exemple, réponse aux ouragans en médecine de catastrophe) ainsi que des situations à haut risque (par exemple, des chirurgies délicates) qui mettent la vie du patient en danger. et nécessitent une formation sans précédent pour le clinicien dans des contextes de formation à moindre enjeu (c'est-à-dire des simulations plutôt que la vie réelle). De plus, la VMR améliore l'apprentissage des tâches qui nécessitent une mémoire spatiale et visuelle, l'observation, ainsi que le contrôle des réponses émotionnelles dans des conditions stressantes (Jensen et Konradsen 2018). Il est important de noter que les enfants autistes ont été décrits comme ayant un engagement positif avec les applications VMR dans les milieux éducatifs (Kandalaft et al. 2013 Strickland et al. 1996), suggérant que VMR peut être utilisé dans un large éventail de contextes et fonctionner comme un outil inclusif pour le l'éducation des élèves avec et sans besoins particuliers (mais voir la discussion sur les « Mauvais usages potentiels de la VMR » ci-dessous). Par conséquent, VMR a le potentiel de devenir un outil éducatif important et inclusif dans notre siècle (Hoffman et Vu 1997). En fait, le VMR a récemment été utilisé pour l'enseignement et l'apprentissage de la biologie, avec des résultats positifs.


3. Approches explicatives du développement

Les explications en biologie du développement sont généralement causales, bien que contrairement à l'explication mécaniste standard, il y ait une acquisition constante de nouvelles capacités causales (en termes d'entités constitutives, d'activités et de leur organisation) à travers le développement (McManus 2012 Parkkinen 2014). Bien qu'il reste beaucoup de travail pour caractériser différents aspects de l'explication en biologie du développement, il ne fait aucun doute qu'une conception de la causalité faisant la différence ou manipulable (voir l'entrée sur la causalité et la manipulabilité) fournit un élément central du raisonnement (Woodward 2003 Strevens 2009 Waters 2007a ). Les explications génétiques du développement (section 3.1), similaires à ce que l'on voit en génétique moléculaire, fonctionnent en identifiant les changements dans l'expression des gènes et les interactions entre leurs produits ARN et protéiques qui conduisent à des changements dans les propriétés des caractéristiques morphologiques au cours de l'ontogenèse (par exemple, forme ou la taille), tout en maintenant une variété de variables contextuelles fixes. Plus récemment, il y a eu un intérêt croissant pour les explications physiques du développement (Section 3.2) qui impliquent des appels aux forces mécaniques dues aux arrangements géométriques des matériaux à moyenne échelle, tels que l'écoulement des fluides (Forgacs et Newman 2005). Les chercheurs s'accordent sur les phénomènes à expliquer (Section 1.2 et Section 2.2), mais diffèrent sur le fait que les règles physiques ou les facteurs génétiques soient plus ou moins explicatifs (Keller 2002). [8] L'existence de deux types différents d'explications causales des phénomènes de développement pose une question supplémentaire sur la manière dont ils pourraient être combinés dans un cadre explicatif plus intégré (section 3.3).

3.1 Génétique

De nombreux philosophes se sont tournés vers les explications du développement au cours des deux dernières décennies dans un effort pour estimer ou dégonfler les affirmations concernant le pouvoir causal des gènes (Keller 2002 Neumann-Held et Rehmann-Sutter 2006 Rosenberg 2006 Robert 2004 Waters 2007a). [9] Les explications génétiques touchent le thème philosophique du réductionnisme et semblent constituer l'essentiel du succès empirique de la biologie du développement au cours des dernières décennies. [10] Les déclarations de biologistes du développement renforcent cette perspective :

La biologie du développement &hellip traite du processus par lequel les gènes de l'œuf fécondé contrôlent le comportement des cellules de l'embryon et déterminent ainsi son modèle, sa forme et une grande partie de son comportement & l'activité génétique différentielle de hellip contrôle le développement. (Wolpert et al. 1998 : v, 15)

Ces types de déclarations sont parfois amplifiés dans les appels à un programme Pour le developpement.

[Les éléments du génome] contiennent le code spécifique à la séquence pour le développement et ils déterminent le résultat particulier des processus de développement, et donc la forme de l'animal produit par chaque embryon. &hellip Le développement est l'exécution du programme génétique pour la construction d'une espèce donnée d'organisme (Davidson 2006 : 2, 16). [11]

À d'autres moments, les déclarations se concentrent sur la génétique en tant que principal locus de causalité dans l'ontogenèse : &ldquoLa complexité du développement est le résultat direct de l'expression spatialement spécifique d'ensembles de gènes particuliers et c'est à ce niveau que nous pouvons aborder la causalité dans le développement» (Davidson et Peter 2015 : 2). La question de savoir si ces déclarations peuvent être fondées a fait l'objet d'un intense débat. [12] Les affirmations les plus fortes sur les programmes génétiques ou le contrôle génétique du développement ont des inconvénients empiriques et conceptuels qui incluent une inattention à la plasticité et au rôle de l'environnement, une ambiguïté sur le lieu de l'agence causale et une dépendance à des métaphores tirées de l'ordinateur. science (Gilbert et Epel 2009 Keller 2002 Moss 2002 Robert 2004). Cependant, cela laisse intact le principe de différence de l'explication génétique présenté dans la génétique moléculaire (Waters 2007a), qui donne des allégations causales plus étroites et précises dans des conditions expérimentales contrôlées, et est applicable à diverses entités moléculaires qui jouent des rôles causaux au cours du développement, telles que comme ARN régulateurs, protéines et signaux environnementaux. Nous pouvons l'observer brièvement en reprenant l'exemple de la cardiogenèse des vertébrés (section 1.2).

Y a-t-il des problèmes à prétendre que les gènes contiennent toutes les informations (voir l'entrée sur les informations biologiques) pour former le cœur des vertébrés ? Existe-t-il un programme génétique dans l'ADN contrôlant le développement cardiaque ? Les gènes sont-ils le principal fournisseur et organisateur de ressources matérielles pour le développement cardiaque, déterminant en grande partie le résultat phénotypique ? Des études existantes sur le développement cardiaque ont identifié un rôle pour les forces fluides dans la spécification de la forme interne du cœur (Hove et al. 2003) et son asymétrie gauche/droite (Nonaka et al. 2002). Les gradients biochimiques de calcium extracellulaire sont responsables de l'activation de l'expression asymétrique du gène régulateur Nodal (Raya et al. 2004) et l'inhibition des gradients de tension brouille l'établissement d'une asymétrie normale (Levin et al. 2002). Les indices mécaniques tels que la rigidité microenvironnementale sont cruciaux pour les transitions clés des cellules migratrices vers les feuilles organisées pendant la formation du cœur (Jackson et al. 2017). Un certain nombre de gènes font clairement la différence dans ces processus (Asp et al. 2019 Srivastava 2006 Brand 2003 Olson 2006), mais la conclusion que les gènes transportent toutes les informations nécessaires pour générer les caractéristiques de la forme du cœur semble injustifiée. Bien qu'il puisse être justifié empiriquement dans certains cas de privilégier les différences de séquences d'ADN comme facteurs causaux dans des processus spécifiques d'ontogenèse (Waters 2007a), tels que les réseaux organisés hiérarchiquement de fabricants de différences génétiques expliquant la spécification des tissus (Peter et Davidson 2011), la diversité des entités en génétique moléculaire et l'étendue de leurs rôles individuels et conjoints dans la spécification des résultats du développement implique que les débats sur la signification, la portée et la puissance des explications génétiques se poursuivront (Griffiths et Stotz 2013). Cependant, un passage des programmes génétiques et du déterminisme génétique à l'ADN, l'ARN et les protéines en tant que facteurs de différence qui fonctionnent conjointement suggère que nous conceptualisons d'autres facteurs causaux de la même manière.

3.2 Physique

L'écoulement des fluides, en tant que force physique, est également un facteur de différence au cours du développement du cœur, et de l'ontogenèse plus généralement, et les biologistes du développement font appel à des faiseurs de différence physiques, qui sont compris comme des facteurs de production des propriétés morphologiques des phénomènes de développement (Forgacs et Newman 2005). Une approche de causalité physique était exposée dans les travaux de Wilhelm His à la fin du XIXe siècle (Hopwood 1999, 2000 Pearson 2018) et particulièrement visible dans les travaux du début du XXe siècle de D&rsquoArcy Thompson et d'autres (Thompson 1992 [1942] Keller 2002 : ch. 2 Olby 1986). Cela s'est produit dans un contexte d'attention croissante à la théorie chromosomique de l'hérédité et aux tentatives d'explorer les phénomènes de développement via des méthodes génétiques classiques (Morgan 1923, 1926, 1934). Thompson a fait appel à des taux de croissance différentiels et aux contraintes des relations géométriques pour expliquer l'origine de la morphologie des organismes. Des représentations visuelles d'analogues mécaniques abiotiques ont fourni la plausibilité, telles que la forme d'éclaboussures de liquide ou de gouttes suspendues pour les configurations de tasse et de cloche du stade sexuel libre des méduses. Si les forces physiques génèrent des morphologies spécifiques dans les matériaux viscoélastiques, alors des morphologies analogues chez les espèces vivantes doivent être expliquées en termes de forces physiques agissant sur les matériaux viscoélastiques de l'embryon en développement. Pourtant, les processus morphogénétiques qui produisent la forme et la structure de la morphologie ont été observés principalement, sinon exclusivement, en termes de génétique au cours du dernier demi-siècle. Les approches physiques sont passées à l'arrière-plan alors que les approches de génétique moléculaire se sont renforcées (Fraser et Harland 2000).

La molécularisation de l'embryologie expérimentale est l'une des réussites les plus frappantes de la biologie contemporaine, car les gènes et les interactions génétiques (par exemple, dans les réseaux transcriptionnels et les voies de signalisation, voir la section 1.3) ont été découverts pour sous-tendre des détails spécifiques de la différenciation, de la morphogenèse, de la formation de motifs et de la croissance. quand la structure prend naissance au cours du développement. Les approches génétiques prédominent dans la biologie du développement contemporaine et les modes physiques de causalité sont souvent négligés. La frustration parmi les chercheurs intéressés par la causalité physique au cours de l'embryogenèse a été palpable.

Pour les types moléculaires, une cause est une molécule ou un gène. Expliquer un phénomène, c'est identifier des gènes et caractériser des protéines sans lesquelles le phénomène échouera ou sera anormal. Une molécule est une explication : une force est une description d'argumenter le contraire apporte au mieux de la pitié (Albert Harris à John Trinkaus, 12 mars 1996 Source : Archives de la bibliothèque du Laboratoire de biologie marine).

Malgré cette prédominance des approches explicatives génétiques et la frustration des chercheurs utilisant d'autres approches, une vague d'intérêt s'est formée autour des explications physiques du développement, en particulier en termes de leur intégration avec les explications génétiques (Miller et Davidson 2013 Newman 2015). Certains philosophes ont soutenu que la modélisation biomécanique des facteurs de causalité physiques constitue un rejet de certaines formes d'explication réductrice en biologie (Green et Batterman 2017).

3.3 Approches d'intégration : génétique et physique

Thompson a soutenu que les forces physiques étaient explicatives mais inadéquates isolément pour expliquer l'origine du développement de la morphologie, l'hérédité (génétique) était également un facteur causal nécessaire. [13] Pourtant, Thompson n'a pas tardé à souligner que les modes de causalité mécaniques pourraient être négligés au milieu de l'attention croissante portée à l'hérédité (génétique) :

ce n'est pas moins exagéré si nous tendons à négliger complètement ces modes de causalité physiques et mécaniques directs, et à ne voir dans les caractères d'un os que les résultats de la variation et de l'hérédité. (Thompson 1992 [1942] : 1023)

Malgré cette dernière forme d'exagération qui s'est manifestée pendant une bonne partie du 20 e siècle, un programme visant à combiner ou à intégrer les deux approches est désormais explicite. [14]

Il n'y a pas de controverse quant à savoir si les modes de causalité génétique et physique sont à l'œuvre simultanément :

les voies de signalisation physiques et biochimiques de l'embryon contribuent à la forme de l'organisme. (Von Dassow et al. 2010 : 1)

Ce ne sont pas des explications causales concurrentes du même phénomène. Les explications doivent saisir comment leurs interactions productives produisent des résultats sur le plan du développement :

un nombre croissant d'exemples montre l'existence d'une interaction réciproque entre l'expression de certains gènes du développement et les forces mécaniques associées aux mouvements morphogénétiques. (Brouzéacutes et Farge 2004 : 372)

Les causes génétiques peuvent entraîner une causalité physique et vice versa. La causalité physique entraîne une causalité génétique par mécanotransduction. L'étirement, la contraction, la compression, la contrainte de cisaillement du fluide et d'autres dynamiques physiques sont détectés par différents composants moléculaires à l'intérieur et à l'extérieur des cellules qui traduisent ces changements environnementaux en signaux biochimiques (Hoffman et al. 2011 Wozniak et Chen 2009). La causalité génétique entraîne une causalité physique en créant différentes propriétés physiques des cellules et des tissus par la présence, l'absence ou le changement de fréquence de protéines particulières. Par exemple, différents modèles d'expression pour les molécules d'adhésion cellulaire (par exemple, les cadhérines) peuvent conduire à une adhésion différentielle à travers les feuilles épithéliales de tissu et ainsi générer des séparations de phases ou des compartiments via la variation de la tension de surface (Newman et Bhat 2008). Si ces modes de causalité ne sont pas concurrents, alors comment pourrait-on combiner les facteurs de différence génétiques et physiques dans une explication causale intégrée ? Quelle unité explicative peut-on atteindre pour cette &ldquoréciprocité&rdquo ?

Trouver des modèles philosophiques pour l'intégration explicative de la génétique et de la physique reste une question ouverte (Love 2017b). La répartition de la responsabilité causale dans le sens de la détermination des contributions relatives (par exemple, la composition des grandeurs causales entre les différentes forces physiques en mécanique newtonienne) est problématique car cela nécessite une commensurabilité par rapport à la façon dont les causes produisent leurs effets (Sober 1988). Dans le contexte de causalité compris en termes de faiseurs de différence, la difficulté d'intégration est une variation sur un problème de raisonnement causal identifié par John Stuart Mill et étiqueté le « mélange d'effets », qui implique de multiples causes contribuant de manière mixte à produire un résultat.

Cette difficulté est surtout frappante dans le cas des phénomènes physiologiques, car il est rarement possible de séparer les différentes instances qui composent collectivement un corps organisé, sans détruire les phénomènes mêmes que nous avons pour objet d'étudier. (Mill 1843 [1974] : 456 [livre 3, chapitre 11, section 1, paragraphe 7])

Une méthodologie statistique minutieuse dans les expériences peut déterminer si un type de facteur de différence explique davantage la variation de la variable d'effet pour une population particulière. Mais un classement des facteurs de causalité par rapport à la différence qu'ils ont apportée n'est pas la même chose que de combiner deux modes de causalité dans un compte intégré. Une autre réponse consiste à dissoudre le problème d'intégration en réduisant l'ensemble des interactions causales à l'un des deux modes distincts, réalisant ainsi une sorte d'unité explicative (Rosenberg 2006). Cependant, cette approche est évitée par les biologistes en activité qui considèrent à la fois les modes de causalité génétiques et physiques comme significatifs et non réductibles l'un à l'autre.

Une stratégie différente est le pluralisme intégratif (Mitchell 2002). Cela implique une procédure en deux étapes pour expliquer des phénomènes complexes dont les caractéristiques sont le résultat de causes multiples : (a) formuler des modèles idéalisés où des facteurs causaux particuliers opèrent de manière isolée (&ldquotmodélisation théorique&rdquo) et, (b) intégrer des modèles idéalisés pour expliquer à quel point, des phénomènes concrets naissent de ces causes combinées. Ce modèle est suggestif, mais présente également des inconvénients clés, notamment le fait que le raisonnement causal génétique en biologie du développement n'implique généralement pas de modélisation théorique et que la nature précise de l'intégration est sous-spécifiée. L'intégration des générateurs de différences génétiques et physiques dans un mécanisme unique offre une autre possibilité (Darden 2006 Craver 2007). Bien que cela souligne de manière précieuse la continuité productive entre les faiseurs de différence à travers les étapes d'une séquence (c'est-à-dire leur interaction réciproque), cela présente également des handicaps. Ceux-ci inclus:

Approches divergentes de la mesure du temps. Au lieu du temps &ldquoin le mécanisme,» le temps est mesuré avec des étapes standardisées externes (voir ci-dessous, Section 5.2). Les stades facilitent l'étude de différents types de mécanismes de développement, avec différents taux et durées caractéristiques pour leurs stades, dans un cadre commun pour un organisme modèle (par exemple, Drosophile), tout en permettant également d'étudier les mécanismes moléculaires conservés chez différentes espèces car la description du mécanisme correspondant n'est pas ancrée dans la séquence temporelle de l'organisme modèle.

Une attente selon laquelle le mécanisme décrit &ldquobottom-out&rdquo dans les activités de niveau le plus bas des entités moléculaires (Darden 2006). Dans le cas de la combinaison des facteurs de différence génétiques et physiques, l'interaction réciproque signifie qu'il y a un évitement studieux de toucher le fond dans l'un ou l'autre mode de causalité.

L'exigence d'une organisation compositionnelle stable pour les mécanismes :

Les explications mécanistes sont des explications constitutives ou componentielles : elles expliquent le comportement du mécanisme dans son ensemble en termes d'activités organisées et d'interaction de ses composants. (Craver 2007 : 128)

Mais ces descriptions de mécanismes sont souvent intégrées dans différents contextes de développement (à différents moments de l'ontogenèse) avec des relations de composition distinctes (au sein et entre les espèces). L'interaction réciproque entre les générateurs de différences génétiques et physiques n'est pas maintenue précisément parce que ces différences de composition modifient les relations de causalité physique (flux de fluide, tension, etc. voir Section 1.3). Les biologistes du développement ont pu généraliser assez largement les relations de causalité génétique (en termes de mécanismes génétiques, voir la section 1.3) entre les espèces, mais la tentative de les combiner avec la causalité physique a nécessité de réduire la portée des allégations causales.

Des modèles philosophiques adéquats de la dépendance systématique entre les créateurs de différences génétiques et physiques dans l'ontogenèse doivent tenir compte de la façon dont les relations temporelles nécessaires pour faire des réclamations causales sont ancrées dans une périodisation externe utilisée par les biologistes du développement. L'imposition de différentes échelles temporelles peut conduire à ce que des facteurs distincts soient significatifs ou saillants, ce qui est important pour déterminer comment différents types de causes peuvent être combinés dans des explications intégrées. Une possibilité consiste à juxtaposer ces facteurs de différence à des étapes distinctes via une vérification expérimentale de sorte qu'ils présentent une continuité productive dans les contraintes de la périodisation externe (Love 2017b). Cela facilite la représentation de la symétrie entre les facteurs causaux, car les fabricants de différences génétiques peuvent être placés avant ou après les fabricants de différences physiques (et vice versa). Bien que cela ne fournisse pas un moyen de combiner les grandeurs causales (comme dans l'addition vectorielle de la mécanique newtonienne), il offre une stratégie explicite pour attribuer la responsabilité entre différents types de causes par le biais d'une organisation temporelle qui va au-delà du classement des facteurs de différence. La périodisation sert de modèle à partir des pratiques des biologistes du développement pour fournir l'intégralité ou l'unité aux différents modes de causalité pour donner une sorte d'explication intégrée de la morphologie qui résulte d'une séquence de processus de développement.

Tous les types d'explication causale n'impliquent pas une périodisation externe et il existe d'autres façons de combiner les causes afin de produire des cadres explicatifs plus intégrés. Un domaine où les explications combinées des phénomènes de développement sont analysées concerne les descriptions de mécanismes et la modélisation mathématique en biologie des systèmes (Brigandt 2013 Fagan 2013). Par exemple, Fagan (2013 : ch. 9) montre comment une explication intégrée émerge d'une procédure par étapes qui commence par une description détaillée d'un mécanisme moléculaire suivie de la formulation d'un schéma de câblage abstrait des interactions des composants, qui est ensuite traduit dans un système d'équations qui peut tenir compte des changements dans les interactions des composants au fil du temps. Des solutions à ces systèmes d'équations et une cartographie des solutions pour les interactions entre les composants du système sur le comportement du système global au sein d'une représentation de paysage partagée explique plus systématiquement la différenciation cellulaire.


Pourquoi la biologie est-elle importante dans la vie de tous les jours ?

La biologie est importante dans la vie de tous les jours car elle permet aux humains de mieux comprendre leur corps, leurs ressources et les menaces potentielles dans l'environnement. La biologie est l'étude de tous les êtres vivants, elle aide donc les gens à comprendre chaque organisme vivant, des plus petites bactéries aux séquoias de Californie et aux rorquals bleus. Les biologistes professionnels se concentrent souvent sur un petit sous-ensemble d'organismes vivants, tels que les oiseaux, les plantes ou les bactéries.

L'étude de la biologie a aidé les humains à comprendre les similitudes entre toutes les formes de vie. Par exemple, le code génétique qui aide à construire tous les organismes vivants est très similaire dans toutes les formes de vie. Le matériel génétique est stocké sous forme d'ADN pour toutes les plantes, les animaux, les bactéries et les champignons. En étudiant l'ADN de toutes ces différentes formes de vie, les biologistes ont déterminé que toutes les créatures vivantes sont liées les unes aux autres.

La biologie a également aidé les médecins à apprendre à garder les gens en bonne santé et à combattre les maladies. Les biologistes ont appris que des choses appelées agents pathogènes, qui sont elles-mêmes d'autres entités vivantes, provoquent des maladies. En comprenant le fonctionnement de ces organismes dangereux, les scientifiques peuvent les combattre. En raison de la biologie, de nombreuses personnes ont vécu longtemps car elles ont pu éviter les maladies.


Résultats

Présentation de la méthode PseudotimeDE

La méthode statistique de PseudotimeDE se compose de quatre étapes principales : le sous-échantillonnage, l'inférence de pseudo-temps, l'ajustement du modèle et le test d'hypothèse (Fig. 1). Les deux premières étapes sont effectuées au niveau cellulaire et incluent tous les gènes informatifs (dont la sélection dépend de la méthode d'inférence pseudo-temporelle, par exemple, Slingshot et Monocle3-PI), tandis que les deux dernières étapes sont effectuées sur chaque gène potentiellement DE.

Dans l'étape de sous-échantillonnage, PseudotimeDE sous-échantillonne 80% des cellules de l'ensemble de données d'origine pour capturer l'incertitude de l'inférence de pseudo-temps, la même technique que celle utilisée dans [9, 11, 30].

Une illustration de la méthode PseudotimeDE (Créé avec BioRender.com). Le cœur de PseudotimeDE est d'obtenir une distribution nulle valide de la statistique du test du gène DE Sj pour chaque gène j. Pour y parvenir, PseudotimeDE sous-échantillonne 80% des cellules des données scRNA-seq originales. Ensuite, sur chaque sous-échantillon, PseudotimeDE effectue une inférence de pseudo-temps (à l'aide d'une méthode spécifiée par l'utilisateur telle que Slingshot et Monocle3-PI) et permute le pseudo-temps déduit à travers les cellules. Ensuite, PseudotimeDE ajuste un modèle (NB-GAM ou ZINB-GAM) aux sous-échantillons permutés pour obtenir les valeurs de Sj sous l'hypothèse nulle et utilise ces valeurs pour approximer la distribution nulle de Sj. En parallèle, PseudotimeDE adapte le même modèle à l'ensemble de données d'origine et calcule la valeur observée de Sj. Enfin, PseudotimeDE dérive le p-valeur à partir de la valeur observée et de la distribution nulle de Sj. Les détails sont décrits dans la section « Méthodes »

Dans l'étape d'inférence de pseudo-temps, PseudotimeDE applique une méthode d'inférence de pseudo-temps spécifiée par l'utilisateur à l'ensemble de données d'origine et à chaque sous-échantillon, de sorte que chaque cellule reçoive son pseudo-temps inféré dans l'ensemble de données d'origine et tous les sous-échantillons qui l'incluent. Pour construire des cas nuls où les gènes sont non-DE pour des tests d'hypothèses ultérieurs, PseudotimeDE permute le pseudo-temps déduit dans chaque sous-échantillon, indépendamment des autres sous-échantillons.

Dans l'étape d'ajustement du modèle, PseudotimeDE adapte NB-GAM ou GAM binomial négatif gonflé à zéro (ZINB-GAM) à chaque gène de l'ensemble de données d'origine pour obtenir une statistique de test qui indique la taille de l'effet du pseudo-temps inféré sur l'expression du gène.

Dans l'étape de test d'hypothèse, pour chaque gène, Pseudotime adapte le même modèle utilisé pour l'ensemble de données d'origine aux sous-échantillons permutés pour obtenir des valeurs nulles approximatives de la statistique de test du gène (les valeurs nulles sont approximatives car les sous-échantillons n'ont pas le même nombre de cellules comme dans l'ensemble de données d'origine). Pour économiser le nombre de sous-échantillons nécessaires et améliorer la p-value resolution, Pseudotime ajuste une distribution Gamma ou un mélange de deux distributions Gamma à ces valeurs nulles. Il utilise ensuite la distribution paramétrique ajustée comme distribution nulle approximative de la statistique de test. Enfin, PseudotimeDE calcule une queue droite p-valeur du gène à partir de la statistique de test du gène dans l'ensemble de données d'origine et de la distribution nulle approximative.

De plus amples détails sur PseudotimeDE sont décrits dans la section « Méthodes ».

Les simulations vérifient que PseudotimeDE surpasse les méthodes existantes dans la validité de p-les valeurs et le pouvoir d'identification

Nous utilisons un simulateur dyntoy largement utilisé [9, 16] pour générer quatre ensembles de données synthétiques scRNA-seq, parmi lesquels trois sont des ensembles de données à lignée unique avec des niveaux de dispersion faible, moyen et élevé, et l'autre est un ensemble de données de bifurcation . Étant donné que l'ensemble de données à haute dispersion à lignée unique ressemble le mieux aux données scRNA-seq réelles (Fichier supplémentaire 1 : Fig. S1), nous l'utilisons comme cas principal. Nous appliquons deux méthodes d'inférence de pseudo-temps - Slingshot et Monocle3-PI - à chaque ensemble de données synthétiques pour déduire le pseudo-temps de cellule.

Premièrement, nous constatons que PseudotimeDE capture avec succès l'incertitude sous-jacente du pseudo-temps inféré. La première couche - « l'incertitude linéaire » - reflète le caractère aléatoire du pseudo-temps de cellule inféré au sein d'une lignée cellulaire (Fig. 2a, & c). La figure 2b, & d montre les distributions du pseudo-temps inféré des cellules individuelles par Slingshot et Monocle3-PI, respectivement, sur 1000 ensembles de données sous-échantillonnés, confirmant que l'incertitude linéaire est spécifique aux méthodes d'inférence de pseudo-temps. Entre les deux méthodes, Monocle3-PI démontre une plus grande incertitude linéaire. La deuxième couche, « l'incertitude de la topologie », reflète le caractère aléatoire de la construction de la lignée. L'ensemble de données de bifurcation synthétique contient deux lignées cellulaires. Slingshot construit correctement la topologie de bifurcation à partir du jeu de données d'origine et des 1000 jeux de données sous-échantillonnés. Alors que Monocle3-PI capture la topologie de bifurcation à partir de l'ensemble de données d'origine (Fig. 2e), il ne parvient pas à capturer la topologie de plus de 50% des sous-échantillons (Fig. 2f montre 10 sous-échantillons choisis au hasard), démontrant sa plus grande incertitude de topologie que celle de Slingshot.

PseudotimeDE capture l'incertitude dans l'inférence de pseudo-temps. une Visualisation de cellules synthétiques à lignée unique marquées avec un pseudo-temps inféré par Slingshot (en utilisant PCA). La courbe noire indique la lignée inférée. b Les distributions du pseudo-temps inféré des cellules individuelles par Slingshot à travers les sous-échantillons. Sur l'axe vertical, les cellules sont classées par leur temps réel dans la lignée utilisée dans la simulation pour chaque cellule (une coordonnée verticale), les points noirs ont des coordonnées horizontales correspondant au pseudo-temps déduit de la cellule dans les sous-échantillons qui incluent la cellule. Plus les points noirs sont étalés horizontalement, plus l'incertitude de l'inférence de pseudo-temps est grande. c Visualisation de cellules synthétiques à lignée unique marquées avec un pseudo-temps inféré par Monocle3-PI (en utilisant UMAP). La courbe noire indique la lignée inférée. Par rapport à (a), la lignée inférée est plus agitée. Les distributions du pseudo-temps inféré des cellules individuelles par Monocle3-PI à travers les sous-échantillons. Comparé à (b), l'incertitude dans l'inférence de pseudo-temps est plus grande. e Visualisation de cellules bifurquantes synthétiques marquées avec un pseudo-temps inféré par Monocle3-PI (en utilisant UMAP). Monocle3-PI récupère la topologie de bifurcation. F Visualisation de dix sous-échantillons des cellules dans (e), marqué d'un pseudo-temps inféré par Monocle3-PI (en utilisant UMAP) sur chaque sous-échantillon. Quatre des dix sous-échantillons n'ont pas la topologie de bifurcation correctement déduite (étiquetée avec un "F" rouge), révélant l'incertitude dans l'inférence de pseudo-temps par Monocle3-PI. En panneaux une, c, e, et F, le pseudo-temps inféré est représenté par une échelle de couleurs de 0 (le premier pseudo-temps) à 1 (le dernier pseudo-temps)

Après avoir confirmé l'incertitude de l'inférence du pseudo-temps, nous comparons PseudotimeDE à quatre méthodes d'identification du gène DE : tradeSeq, Monocle3-DE, NBAMSeq et ImpulseDE2. Les deux premières méthodes, tradeSeq et Monocle3-DE, sont à la pointe de la technologie pour l'analyse des données scRNA-seq et constituent ainsi les principaux concurrents de PseudotimeDE. Dans notre benchmark, nous évaluons d'abord ces méthodes en fonction de la validité de leur p-valeurs, qui devraient être uniformément distribuées entre 0 et 1 sous l'hypothèse nulle (c'est-à-dire qu'un gène n'est pas DE). Nos résultats montrent que, parmi les cinq méthodes, PseudotimeDE génère la meilleure p-valeurs qui suivent le plus étroitement la distribution uniforme attendue (Fig. 3a, & f et fichier supplémentaire 1 : Figs. S3–S5a & f). Parmi les quatre méthodes existantes, seul Monocle3-DE fournit des p-values, tandis que tradeSeq, NBAMSeq et ImpulseDE2 sont sortis p-valeurs très éloignées de la distribution uniforme attendue. Cette observation est confirmée par le test de Kolmogorov-Smirnov, qui évalue la proximité p-les valeurs suivent la distribution uniforme. Étant donné que l'identification des gènes DE repose sur un petit p-valeur seuil, le plus petit p- les valeurs sont plus importantes que les plus grandes. Par conséquent, nous retraçons le p-valeurs sur l'échelle − log10 pour examiner de près l'étalonnage des petits p-valeurs (Fig. 3b, & g et Fichier supplémentaire 1 : Figs. S3–S5b & g). Encore une fois, PseudotimeDE renvoie le mieux calibré p-valeurs, tandis que les quatre autres méthodes génèrent des valeurs trop faibles p-valeurs qui gonfleraient les fausses découvertes. Cela se reflète dans nos résultats : à un seuil FDR cible de 5 %, PseudotimeDE conduit au meilleur contrôle FDR parmi toutes les méthodes (Fig. 3c, & h et fichier supplémentaire 1 : Figs. S3–S5c & h).

PseudotimeDE surpasse quatre méthodes de pointe (tradeSeq, Monocle3-DE, NBAMSeq et ImpulseDE2) pour identifier les gènes DE le long du pseudo-temps cellulaire. Panneaux de gauche unee sont basés sur le pseudo-temps inféré par les panneaux de droite de Slingshot Fj sont basées sur le pseudo-temps déduit par Monocle3-PI. une, F Distributions des gènes non-DE observées p-valeurs par cinq méthodes DE avec pseudo-temps inféré. En haut : graphiques quantile-quantile qui comparent les quantiles empiriques des p-valeurs par rapport aux quantiles attendus de la distribution uniforme [0,1]. En bas : histogrammes des observés p-valeurs. Les pLes valeurs indiquées au-dessus des histogrammes proviennent du test de Kolmogorov-Smirnov sous l'hypothèse nulle que la distribution est uniforme [0,1]. Plus le p-valeur, plus la distribution est uniforme. Parmi les cinq méthodes DE, les PseudotimeDE ont observé p- les valeurs suivent le plus étroitement la distribution uniforme [0,1] attendue. b, g Graphiques quantile-quantile du même p-valeurs comme dans une et F sur l'échelle log10 négative. PseudotimeDE renvoie des petits mieux calibrés p-valeurs que les quatre autres méthodes. c, h FDP des cinq méthodes DE avec la cible FDR 0,05 (BH ajusté- p0,05). PseudotimeDE donne le FDP le plus proche de 0,05. , je Courbes ROC et valeurs AUROC des cinq méthodes DE. PseudotimeDE atteint l'AUROC le plus élevé. e, j Puissance des cinq méthodes DE sous le FDP = seuil de 0,05. PseudotimeDE atteint la puissance la plus élevée

Ensuite, nous comparons ces méthodes en fonction de leur capacité à distinguer les gènes DE des gènes non-DE, capacité mesurée par l'aire sous les valeurs de la courbe caractéristique de fonctionnement du récepteur (AUROC) (Fig. 3d, & i et fichier supplémentaire 1 : Figs. S3–S5d & i). PseudotimeDE atteint les valeurs AUROC les plus élevées. Parmi les quatre autres méthodes, tradeSeq et NBAMSeq ont des valeurs AUROC légèrement inférieures à celles de PseudotimeDE, et Monocle3-DE et ImpulseDE2 ont des valeurs AUROC beaucoup plus faibles que les trois autres méthodes. La raison en est que PseudotimeDE, tradeSeq et NBAMSeq utilisent tous le modèle flexible NB-GAM, tandis que Monocle3-DE et ImpulseDE2 utilisent des modèles beaucoup plus restrictifs, ce qui limite leur puissance.

Réalisant que le mal calibré p-les valeurs des quatre méthodes existantes invalident leur contrôle FDR, nous comparons les cinq méthodes en termes de puissance sous une proportion réelle de 5 % de fausses découvertes (FDP, définie comme la proportion de fausses découvertes parmi les découvertes dans un ensemble de données synthétiques) au lieu de le FDR nominal de 5 %. Nos résultats montrent que PseudotimeDE atteint la puissance la plus élevée sur tous les ensembles de données, à l'exception de l'ensemble de données de bifurcation, où PseudotimeDE a une puissance légèrement inférieure à celle de tradeSeq (Fig. 3e, & j et fichier supplémentaire 1 : Figs.S3–S5e & j). Ces résultats démontrent la puissance élevée de PseudotimeDE et son contrôle efficace du FDR, qui fait défaut dans les méthodes existantes.

En résumé, nos résultats de simulation vérifient que PseudotimeDE surpasse les méthodes existantes en termes de génération bien calibrée p-valeurs, qui sont essentielles pour le contrôle du FDR, et l'identification des gènes DE à haute puissance. Notamment, les deux méthodes RNA-seq en vrac, NBAMSeq et ImpulseDE2, donnent des résultats pires que les trois méthodes scRNA-seq. Par conséquent, nous nous concentrons uniquement sur les méthodes scRNA-seq dans les trois applications de données réelles suivantes.

Exemple de données réelles 1 : cellules dendritiques stimulées avec un lipopolysaccharide

Dans la première application, nous comparons PseudotimeDE avec tradeSeq et Monocle3-DE sur un ensemble de données de cellules dendritiques (CD) de souris après stimulation par un lipopolysaccharide (LPS, un composant des bactéries gram-négatives) [31]. Dans cet ensemble de données, les changements d'expression génique devraient être associés au processus de réponse immunitaire. Nous appliquons d'abord Slingshot et Monocle3-PI à cet ensemble de données pour déduire le pseudo-temps de la cellule, puis, nous saisissons le pseudo-temps déduit dans PseudotimeDE, tradeSeq et Monocle3-DE pour l'identification du gène DE. En accord avec nos résultats de simulation, le p-les valeurs de tradeSeq sont mal calibrées : leurs distributions bimodales indiquent qu'elles ne suivent pas la distribution uniforme sous l'hypothèse nulle à la place, beaucoup d'entre elles sont gonflées, et cette inflation conduirait à une perte de puissance dans l'identification du gène DE (Fig. 4a, & e). En effet, à un Benjamini-Hochberg (BH) nominal ajusté p-valeur ≤0,01 seuil (qui correspond au contrôle du FDR ≤1% lorsque p-valeurs sont valides), tradeSeq identifie le plus petit nombre de gènes DE, tandis que PseudotimeDE identifie le plus de gènes DE, suivi de Monocle3-DE. Notamment, la plupart des gènes DE identifiés par tradeSeq sont également identifiés par PseudotimeDE (Fig. 4b, & f), un résultat cohérent avec le caractère trop conservateur de tradeSeq en raison de son p-valeurs. Contrairement à tradeSeq, Monocle3-DE ne présente pas le gonflé p-valeur cependant, il utilise un modèle plus restrictif que PseudotimeDE et tradeSeq. Par conséquent, nous utilisons des analyses fonctionnelles pour déterminer si Monocle3-DE manque certains gènes DE en raison de sa modélisation restrictive. Nous étudions également si les gènes DE supplémentaires trouvés par PseudotimeDE mais manqués par tradeSeq ou Monocle3-DE sont biologiquement significatifs.

Application de PseudotimeDE, tradeSeq et Monocle3-DE à l'ensemble de données des cellules dendritiques LPS. Panneaux de gauche une sont basés sur le pseudo-temps inféré par les panneaux de droite de Slingshot eh sont basées sur le pseudo-temps déduit par Monocle3-PI. une, e Histogrammes de tous les gènes p-valeurs par les trois méthodes DE. Les distributions bimodales de tradeSeq p-les valeurs suggèrent une violation de l'exigence selon laquelle p-les valeurs suivent la distribution uniforme [0,1] sous l'hypothèse nulle. b, F Graphiques de Venn montrant les chevauchements des gènes DE significatifs (BH ajusté- p0,01) identifié par les trois méthodes DE. Les gènes DE de pseudotimeDE incluent presque ceux de tradeSeq. c, g Nombres de termes GO enrichis (p<0.01) dans les gènes DE significatifs spécifiquement trouvés par PseudotimeDE ou tradeSeq/Monocle3-DE dans des comparaisons par paires entre PseudotimeDE et tradeSeq/Monocle3-DE dans b et F. Beaucoup plus de termes GO sont enrichis dans les gènes DE spécifiques à PseudotimeDE que dans ceux spécifiques à tradeSeq ou Monocle3-DE. , h Exemple de termes GO enrichis en gènes DE Pseudotime-spécifiques dans c et g. Beaucoup de ces termes sont liés au LPS, au processus immunitaire et à la défense contre la bactérie

Notre première stratégie consiste à effectuer une analyse d'ontologie génique (GO) sur les gènes DE identifiés par chaque méthode et à comparer les termes GO enrichis. Nous constatons que plus de termes GO sont enrichis (avec enrichissement p-valeurs <0.01) dans les gènes DE identifiés par PseudotimeDE (Fichier supplémentaire 1 : Fig. S6a & c) et que les termes GO spécifiques à PseudotimeDE sont liés aux réponses immunitaires (Fichier supplémentaire 1 : Fig. S6b & d). Cependant, la comparaison des termes GO enrichis ne reflète pas directement la différence des gènes DE identifiés par différentes méthodes. Par conséquent, notre deuxième stratégie consiste à sonder les fonctions des gènes DE qui sont identifiés de manière unique par une méthode dans des comparaisons par paires de PseudotimeDE vs tradeSeq et PseudotimeDE vs Monocle3-DE. Nous effectuons d'abord une analyse GO sur chaque ensemble de gènes DE identifiés de manière unique. Pour une comparaison équitable des deux méthodes, nous supprimons les gènes DE qui se chevauchent trouvés par les deux méthodes de la liste des gènes de fond dans l'analyse GO. Nos résultats montrent que beaucoup plus de termes GO sont enrichis (avec enrichissement p-valeurs <0.01) dans les gènes DE Pseudotime-spécifiques que dans les gènes DE-spécifiques de tradeSeq- ou Monocle3-DE (Fig. 4c, & g). De plus, bon nombre de ces termes GO spécifiques à PseudotimeDE sont directement liés aux réponses immunitaires des DC à la stimulation du LPS, y compris les termes GO « réponse cellulaire au lipopolysaccharide » et « réponse de défense à la bactérie Gram-négative » (Fig. 4d, & h Fiche complémentaire 2 : Tableau S1). Pour nous concentrer davantage sur les réponses immunitaires, nous effectuons ensuite une analyse d'enrichissement en utilisant les signatures immunologiques (C7) dans la base de données de signatures moléculaires (MSigDB) [32]. Nos résultats montrent que seuls les gènes DE spécifiques à PseudotimeDE ont enrichi les termes MSigDB C7 (avec BH ajusté p-valeurs <0.01), tandis que les gènes DE spécifiques à tradeSeq et Monocle3-DE n'ont presque aucun enrichissement (Fichier supplémentaire 1 : Fig. S7a & c). Plus important encore, de nombreux termes enrichis dans les gènes DE spécifiques à PseudotimeDE ont été trouvés par des études antérieures sur les DC stimulées par le LPS (voir les exemples dans le fichier supplémentaire 1 : Fig. S7b & d Fichier supplémentaire 2 : tableau S1) c'est une preuve directe qui soutient la validité de gènes DE spécifiques de PseudotimeDE. À des fins d'illustration, nous visualisons les niveaux d'expression de certains gènes DE connus et nouveaux identifiés par PseudotimeDE à l'aide d'UMAP, et des modèles DE clairs sont observés (Fichier supplémentaire 1 : Fig. S8–S9). En conclusion, nos analyses fonctionnelles vérifient que PseudotimeDE identifie les gènes DE biologiquement significatifs manqués par tradeSeq et Monocle3-DE, confirmant que PseudotimeDE a une puissance élevée en plus de ses propriétés bien calibrées. p-valeurs.

Exemple de données réelles 2 : maturation des cellules bêta du pancréas

Dans la deuxième application, nous comparons PseudotimeDE avec tradeSeq et Monocle3-DE sur un ensemble de données du processus de maturation des cellules bêta de souris [33]. Nous appliquons d'abord Slingshot et Monocle3-PI à cet ensemble de données pour déduire le pseudo-temps de la cellule, puis, nous saisissons le pseudo-temps déduit dans PseudotimeDE, tradeSeq et Monocle3-DE pour l'identification du gène DE. Conformément aux résultats précédents, le p-les valeurs de tradeSeq suivent une distribution bimodale, suggérant que beaucoup d'entre elles sont incorrectement gonflées (Fig. 5a, & f). Au BH nominal ajusté p-valeur ≤ 0,01 niveau, PseudotimeDE identifie le deuxième plus grand nombre de gènes DE, moins que les gènes DE identifiés de Monocle3-DE et bien plus que ceux de tradeSeq (Fig. 5b, & g). Comme le nombre de gènes DE identifiés ne peut pas refléter les performances de ces méthodes, nous utilisons trois approches pour évaluer les gènes DE identifiés par chaque méthode.

Application de PseudotimeDE, tradeSeq et Monocle3-DE à l'ensemble de données de maturation des cellules bêta pancréatiques. Panneaux de gauche unee sont basés sur le pseudo-temps inféré par les panneaux de droite de Slingshot Fj sont basées sur le pseudo-temps déduit par Monocle3-PI. une, F Histogrammes de tous les gènes p-valeurs par les trois méthodes DE. Les distributions bimodales de tradeSeq p-les valeurs suggèrent une violation de l'exigence selon laquelle p-les valeurs suivent la distribution uniforme [0,1] sous l'hypothèse nulle. b, g Graphiques de Venn montrant les chevauchements des gènes DE significatifs (BH ajusté- p0,01) identifié par les trois méthodes DE. Les gènes DE de pseudotimeDE incluent presque ceux de tradeSeq. c, h Nombres de termes GO enrichis (p<0.01) dans les gènes DE significatifs spécifiquement trouvés par PseudotimeDE ou tradeSeq/Monocle3-DE dans des comparaisons par paires entre PseudotimeDE et tradeSeq/Monocle3-DE dans b et g. Beaucoup plus de termes GO sont enrichis dans les gènes DE spécifiques à PseudotimeDE que dans ceux spécifiques à tradeSeq ou Monocle3-DE. , je Exemple de termes GO enrichis en gènes DE Pseudotime-spécifiques dans c et h. Beaucoup de ces termes sont liés à l'insuline, à la régulation des cellules bêta et au développement du pancréas. e, j Deux exemples de gènes : Slc39a10 (DE) et Acier inoxydable (non-DE). Pour Slc39a10, à la fois PseudotimeDE et Monocle3-DE donnent de petits p-valeurs (p<1e−6), alors que tradeSeq ne le fait pas (p>0.1). Pour Acier inoxydable, PseudotimeDE donne une plus grande p-valeurs que tradeSeq et Monocle3-DE. Les lignes bleues en pointillés sont les courbes ajustées par NB-GAM

Nous effectuons d'abord une analyse GO sur chaque ensemble de gènes DE identifiés de manière unique, en utilisant les mêmes comparaisons par paires de PseudotimeDE vs tradeSeq et PseudotimeDE vs Monocle3-DE que pour les données LPS-dendritiques. Nos résultats montrent que plus de termes GO sont enrichis (avec enrichissement p-valeurs <0,01) dans les gènes DE spécifiques de PseudotimeDE que dans les gènes DE spécifiques de tradeSeq ou Monocle3-DE (Fig. 5c, & h). De plus, bon nombre de ces termes GO spécifiques à PseudotimeDE sont directement liés au développement des cellules bêta du pancréas, par exemple « régulation positive/négative de la voie de signalisation Notch » [34] et « développement du pancréas endocrinien » (Fig. 5c, & h Fichier supplémentaire 3 : Tableau S2). Comme résultat complémentaire, nous effectuons également une analyse GO sur les gènes DE identifiés par chaque méthode. Nous constatons que les termes GO, qui ne sont enrichis que dans les gènes DE identifiés par PseudotimeDE, sont liés au développement des cellules bêta et donc plus biologiquement significatifs que les termes GO qui ne sont enrichis que dans les gènes DE identifiés par tradeSeq ou Monocle3-DE ( Fichier supplémentaire 1 : Fig. S10b & d).

Deuxièmement, nous utilisons les gènes DE identifiés à partir des données RNA-seq en vrac dans l'article original [33] pour évaluer les classements des gènes DE établis par PseudotimeDE, tradeSeq et Monocle3-DE à partir des données scRNA-seq. En prenant les gènes DE en vrac comme un ensemble de gènes, nous effectuons l'analyse d'enrichissement de l'ensemble de gènes (GSEA) [32] sur tous les gènes' - log10p-valeurs sorties par PseudotimeDE, tradeSeq et Monocle3-DE. Parmi les trois méthodes, PseudotimeDE conduit au score d'enrichissement normalisé (NES) le plus élevé (Fichier supplémentaire 3 : tableau S2), suggérant que les gènes DE en vrac sont les plus enrichis dans les gènes DE les mieux classés trouvés par PseudotimeDE.

Troisièmement, nous examinons un gène DE hautement crédible Slc39a10 [33, 35] et un gène non-DE vérifié Acier inoxydable [33] comme exemples représentatifs. Pour Slc39a10, à la fois PseudotimeDE et Monocle3-DE donnent de petits p-values ​​(<10 −6 ), tandis que tradeSeq génère un p-value >0.1 et le manque donc (Fig. 5e, & g). Pour Acier inoxydable, PseudotimeDE donne le plus grand p-value (>0.001), tandis que tradeSeq et Monocle3-DE produisent un rendement extrêmement faible p-values ​​(<10 −10 ) et l'a donc confondu avec un gène DE. Ainsi, PseudotimeDE a les meilleures performances sur ces deux gènes représentatifs.

À des fins d'illustration, nous visualisons les niveaux d'expression de certains gènes DE connus et nouveaux identifiés par PseudotimeDE à l'aide d'UMAP, et des modèles DE clairs sont observés (Fichier supplémentaire 1 : Figs. S11-S12).

Exemple de données réelles 3 : différenciation de la moelle osseuse

Dans la troisième application, nous comparons PseudotimeDE avec tradeSeq et Monocle3-DE sur un ensemble de données de différenciation de la moelle osseuse de souris [36]. Nous appliquons Slingshot avec UMAP pour la réduction de la dimensionnalité afin de déduire le pseudo-temps de cellule comme décrit dans l'article de tradeSeq [16]. Slingshot construit la topologie de bifurcation rapportée (dans l'article tradeSeq) sur l'ensemble de données d'origine (Fig. 6a), mais il déduit la topologie de trifurcation, au lieu de la topologie de bifurcation, sur 40% des sous-échantillons (Fig. 6b montre dix sous-échantillons choisis au hasard). Notez que la troisième lignée constituée du mégacaryocyte de type cellulaire (MK) a été signalée dans l'article Monocle2 ([12]), suggérant que l'incertitude de la topologie observée peut être biologiquement significative.

Application de PseudotimeDE, tradeSeq et Monocle3-DE à l'ensemble de données sur la moelle osseuse de souris. une Visualisation UMAP et pseudo-temps inféré par Slingshot. Les types de cellules prédéfinis sont marqués par des couleurs. Slingshot renvoie une topologie de bifurcation, désignée par la lignée 1 (à gauche) et la lignée 2 (à droite). b Visualisation UMAP et pseudo-temps inféré par Slingshot sur dix sous-échantillons aléatoires. Quatre sous-échantillons sur dix ne donnent pas une topologie de bifurcation mais une topologie de trifurcation, où la troisième lignée contient principalement le type cellulaire « MK » et a été rapportée dans [12]. c Histogrammes de tous les gènes p-valeurs calculées par les trois méthodes DE dans la première lignée. Histogrammes de tous les gènes p-valeurs calculées par les trois méthodes DE dans la deuxième lignée. e Diagramme de Venn montrant les chevauchements des gènes DE significatifs (BH ajusté- p≤0,01) identifié par les trois méthodes DE dans la lignée 1. PseudotimeDE et tradeSeq partagent 77,6% (indice Jaccard) des gènes DE. (F) Nombre d'ensembles de gènes enrichis (q<0.25) par la GSEA en utilisant le p-valeurs dans la lignée 1 par les trois méthodes DE. Bien que les gènes DE soient similaires dans e, PseudotimeDE donne 270 ensembles de gènes enrichis, tandis que tradeSeq n'en donne que 9. g Diagramme de Venn montrant les chevauchements des gènes DE significatifs (BH ajusté- p≤0,01) identifié par les trois méthodes DE dans la lignée 2. Similaire à la lignée 1 dans g, PseudotimeDE et tradeSeq partagent 77,2 % (indice Jaccard) des gènes DE. h Nombre d'ensembles de gènes enrichis (q<0.25) par la GSEA en utilisant le p-valeurs dans la lignée 2 par les trois méthodes DE. PseudotimeDE et Monocle3-DE produisent des centaines d'ensembles de gènes enrichis, tandis que tradeSeq ne produit aucun ensemble de gènes enrichi

Pour une comparaison équitable, nous ne faisons que PseudotimeDE utiliser les sous-échantillons avec la topologie de bifurcation déduite, car tradeSeq et Monocle3-DE utilisent tous deux la topologie de bifurcation déduite des données d'origine pour identifier les gènes DE. Conformément aux résultats précédents, le tradeSeq p-les valeurs suivent une distribution bimodale qui est inattendue pour bien calibré p-valeurs. À un BH nominal ajusté p-valeur ≤ 0,01 seuil, les trois méthodes identifient des gènes DE très similaires (Fig. 6e, & g). Par exemple, PseudotimeDE et tradeSeq partagent environ 80% de leurs gènes DE identifiés (index Jaccard). À partir des quelques gènes DE spécifiques à la méthode, les analyses fonctionnelles ne peuvent pas indiquer quelle méthode est la plus performante. Par conséquent, nous utilisons plutôt la GSEA pour évaluer les méthodes. p-valeurs. Étonnamment, bien que les trois méthodes identifient des gènes DE très similaires, leur p- les valeurs conduisent à des résultats GSEA très différents. Au qAu niveau <0.25, PseudotimeDE et Monocle3-DE produisent des centaines d'ensembles de gènes enrichis, tandis que tradeSeq ne produit que peu ou pas d'ensembles de gènes enrichis (Fig. 6f, & h Fichier supplémentaire 4 : tableau S3). Ce résultat indique qu'outre le classement des p-valeurs, les valeurs nominales de p- les valeurs sont également cruciales pour les analyses en aval telles que GSEA. Par conséquent, le bien calibré p-Les valeurs rendent PseudotimeDE supérieur aux méthodes existantes pour l'identification des gènes DE et les analyses en aval.

Exemple de données réelles 4 : sous-types de cellules T tueuses naturelles

Dans la quatrième application, nous comparons PseudotimeDE avec tradeSeq et Monocle3-DE sur un ensemble de données de sous-types de cellules T tueuses naturelles (cellules NKT) [37]. Nous appliquons Slingshot avec PCA pour la réduction de la dimensionnalité afin de déduire le pseudo-temps cellulaire et de construire la topologie de trifurcation (Fig. 7a) rapportée dans l'étude originale. Nous appliquons les trois méthodes DE pour identifier les gènes DE dans chacune des trois lignées. En accord avec les résultats précédents, le p-les valeurs de tradeSeq suivent une distribution bimodale, suggérant que beaucoup d'entre elles sont incorrectement gonflées (Fig. 7b).

Application de PseudotimeDE, tradeSeq et Monocle3-DE à l'ensemble de données des lymphocytes T tueurs naturels. une Visualisation PCA et pseudo-temps inféré par Slingshot. Les sous-types NKT prédéfinis sont marqués par des couleurs. Slingshot renvoie une topologie de trifurcation, où les trois lignées sont NKT0 à NKT1, NKT0 à NKT17 et NKT0 à NKT2. b Histogrammes de tous les gènes p-valeurs dans les trois lignées calculées par les trois méthodes DE. c Cartes thermiques des scores d'enrichissement normalisés (NES, marqués par des couleurs) et leurs correspondants p-valeurs (en chiffres) de la GSEA. Chaque valeur NES et son correspondant p-valeur sont calculées pour chaque méthode DE et chaque lignée, sur la base de la p-valeurs d'une méthode DE pour une lignée et les gènes DE de cette lignée trouvés à partir des données RNA-seq en vrac, désignés par "NKT1 bulk", "NKT17 bulk" ou "NKT2 bulk" [37]. Notez que parmi les trois méthodes DE, les sorties PseudotimeDE p-valeurs qui concordent le mieux avec les gènes DE spécifiques à la lignée à partir de données globales et distinguent ainsi le plus les trois lignées. Par exemple, pour la lignée NKT1, le petit p-les valeurs sont enrichies dans le jeu de gènes « NKT1 en vrac » uniquement, tandis que tradeSeq et Monocle3-DE ont de petites p-valeurs enrichies dans au moins deux ensembles de gènes DE spécifiques à la lignée

À des fins de validation, nous utilisons les gènes DE spécifiques à la lignée identifiés à partir des données RNA-seq en vrac dans l'étude originale [37] pour évaluer les classements des gènes DE établis par PseudotimeDE, tradeSeq et Monocle3-DE à partir des données scRNA-seq. Plus précisément, nous effectuons la GSEA en utilisant les ensembles de gènes DE en vrac de la même manière que pour l'ensemble de données de maturation des cellules bêta pancréatiques. La GSEA montre que les PseudotimeDE p- les valeurs correspondent le mieux aux gènes DE spécifiques à la lignée à partir des données globales et distinguent ainsi le plus les trois lignées. Par exemple, pour la lignée NKT1, le petit p-les valeurs sont exclusivement enrichies dans le jeu de gènes « NKT1 en vrac », tandis que tradeSeq et Monocle3-DE ont de petites p-valeurs enrichies dans au moins deux ensembles de gènes DE spécifiques à la lignée (Fig. 7c). Ce résultat confirme que, par rapport aux gènes DE identifiés par les deux autres méthodes DE, les principaux gènes DE identifiés par PseudotimeDE sont biologiquement plus significatifs.

Exemple de données réelles 5 : phases du cycle cellulaire

Dans la cinquième application, nous comparons PseudotimeDE avec tradeSeq et Monocle3-DE sur un ensemble de données de cellules souches pluripotentes induites humaines (iPSCs) mesurées avec des phases du cycle cellulaire (marqueurs FUCCI) [38].L'étude originale a rapporté 101 gènes cycliques dont les niveaux d'expression ont de grandes proportions de variance expliquées (PVE) par les étiquettes FUCCI des cellules [38] c'est-à-dire que les étiquettes FUCCI des cellules sont considérées comme le prédicteur, les niveaux d'expression d'un gène dans les mêmes cellules sont considéré comme la réponse, et un PVE est calculé à partir d'un ajustement de lissage non paramétrique. Par conséquent, plus le PVE est grand, mieux les niveaux d'expression du gène peuvent être prédits par les phases du cycle cellulaire. L'étude originale a également développé un package R peco pour déduire les phases du cycle cellulaire à partir des données scRNA-seq.

Dans notre étude, nous construisons d'abord un ensemble de données de référence en traitant les 101 gènes cycliques comme de vrais gènes DE et en utilisant les mêmes gènes avec des niveaux d'expression mélangés au hasard à travers les cellules comme les vrais gènes non-DE. Par conséquent, nos ensembles positifs et négatifs contiennent tous les deux 101 gènes. . Ensuite, nous appliquons le package R peco à cet ensemble de données pour déduire la phase de cycle de chaque cellule, ce qui équivaut au pseudo-temps, c'est-à-dire que nous utilisons peco comme méthode d'inférence de pseudo-temps. Enfin, nous appliquons les trois méthodes DE.

Nos résultats montrent que, pour les vrais gènes non-DE, seul PseudotimeDE génère p-valeurs qui suivent approximativement la distribution uniforme [0,1] (Fig. 8a, & c). Pour les vrais gènes DE, les PseudotimeDE (− log10 transformé) p- les valeurs, une par gène, ont la corrélation la plus élevée avec la PVE de ces gènes, indiquant que PseudotimeDE identifie avec succès les principaux gènes DE comme ceux ayant les tendances cycliques les plus fortes (Fig. 8b). Le pseudotimeDE donne également un contrôle FDR réussi, la valeur AUROC la plus élevée et la puissance la plus élevée parmi les trois méthodes DE (Fig. 8d-f). Par conséquent, nous concluons que PseudotimeDE surpasse tradeSeq et Monocle3-DE pour identifier les gènes liés au cycle cellulaire à partir de cet ensemble de données iPSC scRNA-seq.

Application de PseudotimeDE, tradeSeq et Monocle3-DE à l'ensemble de données de la phase du cycle cellulaire. une Distributions des gènes non-DE’ p-valeurs par trois méthodes DE avec pseudo-temps inféré. En haut : graphiques quantile-quantile qui comparent les quantiles empiriques des gènes non-DE’ p-valeurs par rapport aux quantiles attendus de la distribution uniforme [0,1]. En bas : histogrammes des gènes non-DE’ p-valeurs. Les pLes valeurs indiquées au-dessus des histogrammes proviennent du test de Kolmogorov-Smirnov sous l'hypothèse nulle que la distribution est uniforme [0,1]. Plus le p-valeur, plus la distribution est uniforme. Parmi les trois méthodes DE, les PseudotimeDE p- les valeurs suivent le plus étroitement la distribution uniforme [0,1] attendue. b Distributions des gènes DE p-valeurs par trois méthodes DE avec pseudo-temps inféré. En haut : nuages ​​de points des gènes DE » p-valeurs par rapport aux proportions de la variance expliquée (PVE), qui mesurent les forces des tendances cycliques inférées des gènes dans l'étude originale [38]. PseudotimeDE p-valeurs (− log10 transformé) ont la corrélation la plus élevée avec le PVE, indiquant que PseudotimeDE identifie les gènes avec les tendances cycliques les plus fortes comme les principaux gènes DE. En bas : histogrammes de tous les gènes p-valeurs. Les couleurs bleu et rouge représentent le p-valeurs des gènes DE et des gènes non-DE (identiques à (a) en bas), respectivement. PseudotimeDE donne la meilleure séparation des deux groupes de gènes p-valeurs. c Graphiques quantile-quantile du même p-valeurs comme dans une sur l'échelle log10 négative. PseudotimeDE renvoie le mieux calibré p-valeurs. FDP des trois méthodes DE avec la cible FDR 0,05 (BH ajusté- p≤0.05). e Courbes ROC et valeurs AUROC des trois méthodes DE. PseudotimeDE atteint l'AUROC le plus élevé. F Puissance des trois méthodes DE sous le FDP = seuil de 0,05. PseudotimeDE atteint la puissance la plus élevée

PseudotimeDE permet aux utilisateurs d'inspecter l'incertitude du pseudo-temps de cellule inféré

Outre l'identification des gènes DE, PseudotimeDE offre une fonctionnalité pour inspecter l'incertitude de l'inférence de pseudo-temps via son étape de sous-échantillonnage intermédiaire. Dans les Fig. 2e, f et 6a, b, PseudotimeDE révèle l'incertitude des lignées cellulaires inférées. Les utilisateurs souhaitent généralement corriger la topologie de lignage, par exemple une topologie de bifurcation, pour une analyse en aval, cependant, la topologie peut varier d'un sous-échantillon à l'autre. Par conséquent, nous recommandons aux utilisateurs de vérifier si la topologie déduite des données d'origine peut également être déduite de plus de la moitié des sous-échantillons. Sinon, les utilisateurs peuvent envisager d'utiliser une autre méthode d'inférence de pseudo-temps avec moins d'incertitude ou d'ajouter des contraintes supplémentaires sur la topologie inférée. Sinon, la grande incertitude de la lignée cellulaire inférée nuirait à la fiabilité des analyses en aval.

Ensuite, en conditionnant sur une topologie de lignée donnée, PseudotimeDE permet aux utilisateurs de visualiser l'incertitude du pseudo-temps au sein d'une lignée (Fig. 2a-d), guidant également le choix des méthodes d'inférence de pseudo-temps en termes d'incertitude.

Temps de calcul

La seule façon possible d'accommoder toutes les méthodes d'inférence de pseudo-temps et de tenir compte de leur incertitude dans l'identification du gène DE est d'utiliser le sous-échantillonnage et la permutation, l'approche adoptée par PseudotimeDE. Cependant, une préoccupation commune des méthodes basées sur la permutation est qu'elles sont gourmandes en calculs. Certes, PseudotimeDE est plus lent que les méthodes existantes non basées sur la permutation, mais son temps de calcul est néanmoins acceptable pour les utilisateurs de serveurs. Par exemple, avec 24 cœurs (processeur Intel « Cascade Lake »), 36 Go de RAM et 1 000 sous-échantillons, PseudotimeDE prend 3 à 8 h pour analyser chacun des trois premiers ensembles de données scRNA-seq de notre étude. Plus précisément, l'ensemble de données sur les cellules dendritiques LPS (4016 gènes, 390 cellules) prend 3 h, l'ensemble de données de maturation des cellules bêta pancréatiques (6121 gènes, 497 cellules) prend 3,5 h, et l'ensemble de données sur la moelle osseuse (3004 gènes, 2660 cellules, deux lignées ) prend 8h. Le temps de calcul est proportionnel au nombre de gènes, au nombre de lignées et au nombre de sous-échantillons. Bien entendu, il est inversement proportionnel au nombre de cœurs disponibles.

Pour réduire le temps de calcul de PseudotimeDE, les utilisateurs ont deux options. Premièrement, les utilisateurs peuvent réduire le nombre de gènes à tester. Par exemple, il est recommandé de filtrer les gènes faiblement exprimés, tels que ceux avec plus de 90 % de comptages nuls, car ils présentent généralement moins d'intérêt pour les biologistes. Deuxièmement, les utilisateurs peuvent réduire le nombre de sous-échantillons. En raison de son estimation paramétrique de la distribution nulle de la statistique de test, PseudotimeDE ne nécessite pas un nombre énorme de sous-échantillons. Nous constatons que PseudotimeDE avec seulement 100 sous-échantillons génère des p-valeurs à celles basées sur 1000 sous-échantillons (Fichier supplémentaire 1 : Fig. S20). Si vous utilisez 100 sous-échantillons, le temps de calcul est inférieur à 0,5 h pour chacun des trois premiers ensembles de données.

Dans un scénario indésirable où les ressources de calcul sont trop limitées, les utilisateurs doivent abandonner la prise en compte de l'incertitude du pseudo-temps et traiter le pseudo-temps inféré comme fixe. Ensuite, ils n'ont pas besoin de la procédure de sous-échantillonnage, et PseudotimeDE calculera p-valeurs de la distribution nulle asymptotique de la statistique de test [39], avec un temps de calcul court similaire aux méthodes non basées sur la permutation.


  • Disponible aux niveaux standard (SL) et supérieurs (HL)
  • Le nombre d'heures minimum prescrit est de 150 pour SL et 240 pour HL
  • Les étudiants sont évalués à la fois en externe et en interne
  • Les étudiants en biologie des niveaux SL et HL suivent un programme de base commun et un système d'évaluation interne (IA) commun.
  • Bien qu'il existe des compétences et des activités de base communes aux étudiants NS et NS, les étudiants NS sont tenus d'étudier les options et certains sujets de manière plus approfondie ainsi que certains sujets supplémentaires. La distinction entre SL et HL est une de largeur et de profondeur.
  • Une approche pratique de la prestation des cours est soulignée par le projet interdisciplinaire du groupe 4 et un mélange d'expériences et d'enquêtes à court et à long terme.
  • L'évaluation interne représente 20 % de l'évaluation finale et celle-ci est évaluée au moyen d'une enquête individuelle unique. Cette enquête peut impliquer une approche pratique, l'utilisation de bases de données, la modélisation, la simulation ou un hybride. Le travail des élèves est évalué en interne par l'enseignant et modéré en externe par l'IB.

L'évaluation externe de la biologie se compose de trois articles écrits. Dans l'épreuve 1, il y a 30 (à SL) ou 40 (à NS) questions à choix multiples. Le document 2 contient des questions à réponse courte et à réponse étendue sur le matériel de base (et le matériel de niveau supérieur supplémentaire (AHL) à HL). L'article 3 comporte deux sections. La section A contient une question basée sur des données et plusieurs questions à réponse courte sur les travaux expérimentaux sur le noyau (et le matériel AHL à HL). La section B contient des questions à réponse courte et à réponse étendue pour chacune des quatre options.

Une grande partie de ces informations sont extraites directement du guide des matières de biologie, disponible pour tous les enseignants de l'IB sur le centre de ressources du programme.


Biologie moléculaire de la cellule

Chimie organique

Chimie Physique pour les Sciences de la Vie

Guide d'étude pour la biologie de Campbell

Chimie

Biochimie

Tester des idées commerciales

Le manuel d'innovation des services

Conception de proposition de valeur

Livre de coloriage Harry Potter

Chimie organique

Procédures de Pfenninger et Fowler pour les soins primaires

Cancer de DeVita, Hellman et Rosenberg : principes et pratique de l'oncologie

Chimie organique comme langue seconde

Introduction à la géologie environnementale

La biologie

La biologie

Chimie

Anatomie humaine et physiologie

Pratiquer la biologie


Le concept de caractère en biologie évolutive



Ce site utilise des cookies et Google Analytics (voir nos conditions générales pour plus de détails concernant les implications en matière de confidentialité).

L'utilisation de ce site est soumise aux conditions générales.
Tous droits réservés par la Fondation PhilPapers

Page générée mercredi 30 juin 11:30:15 2021 sur philpapers-web-b76fb567b-jxzfk Informations de débogage

statistiques du cache : hit=1286, miss=1375, save=
gestionnaire automatique : 318 ms
composante appelée : 303 ms
entrée : 303 ms
entry_basics : 91 ms
en-tête d'entrée : 73 ms
menu : 69 ms
similar_entries : 64 ms
citations-citations : 49 ms
chapitres_entrées : 27 ms
statistiques d'entrée : 27 ms
get_entry : 12 ms
prepCit : 9 ms
liens d'entrée : 7 ms
entrée-chats : 7 ms
côté entrée : 6 ms
amazone : 4 ms
writeLog : 3 ms
citations-références : 3 ms
search_quotes : 2 ms
entry_stats_query : 2 ms
récupérer l'objet cache : 0 ms
init renderer : 0 ms
enregistrer l'objet du cache : 0 ms
configuration : 0 ms
authentification : 0 ms
stat_db : 0 ms
boutons d'entrée : 0 ms


Voir la vidéo: EXMD 1719 Biologie 6 Evolution Théorie 1ère partie (Janvier 2022).