Caractérisation structurale d'un produit de gène métabolique auxiliaire viral du sol
MaisonMaison > Nouvelles > Caractérisation structurale d'un produit de gène métabolique auxiliaire viral du sol

Caractérisation structurale d'un produit de gène métabolique auxiliaire viral du sol

May 15, 2023

Nature Communications volume 13, Numéro d'article : 5485 (2022) Citer cet article

3456 accès

4 Citations

159 Altmétrique

Détails des métriques

La métagénomique dévoile le monde auparavant caché des virus du sol. De nombreuses séquences virales du sol dans les métagénomes contiennent des gènes métaboliques auxiliaires putatifs (AMG) qui ne sont pas associés à la réplication virale. Ici, nous établissons que les AMG sur les virus du sol produisent en fait des protéines fonctionnelles et actives. Nous nous concentrons sur les AMG qui codent potentiellement les enzymes chitosanase qui métabolisent la chitine - un polymère de carbone commun. Nous exprimons et criblons fonctionnellement plusieurs gènes de chitosanase identifiés à partir de métagénomes environnementaux. Une protéine exprimée présentant une activité endo-chitosanase (V-Csn) est cristallisée et structurellement caractérisée à ultra-haute résolution, représentant ainsi la structure d'un produit AMG viral du sol. Cette structure fournit des détails sur le site actif et, associée aux modèles de structure déterminés à l'aide d'AlphaFold, facilite la compréhension de la spécificité du substrat et du mécanisme enzymatique. Nos résultats appuient l'hypothèse selon laquelle les virus du sol apportent des fonctions auxiliaires à leurs hôtes.

Des enquêtes métagénomiques récentes ont révélé une grande diversité de virus à ADN dans une gamme d'habitats du sol, y compris le pergélisol1,2, le pergélisol dégelé3 et les prairies4. La majorité de ces virus sont des bactériophages3,4, bien que plusieurs virus eucaryotes aient également été détectés1,2. Une question fondamentale et largement sans réponse concerne les rôles fonctionnels de ces virus dans l'habitat du sol. Il est reconnu que les bactériophages du sol jouent un rôle majeur dans la régulation de la dynamique de l'hôte5. Curieusement, les virus du sol peuvent également contribuer directement aux processus biogéochimiques du sol par l'expression de gènes qui codent potentiellement des fonctions non directement nécessaires à la reproduction virale. Les gènes qui correspondent à des fonctions virales non essentielles sont appelés gènes métaboliques auxiliaires (AMG). Les fonctions potentielles codées par les AMG comprennent le métabolisme du carbone, la sporulation et la génération d'énergie6,7. Cependant, un seul AMG viral du sol a été exprimé et caractérisé fonctionnellement à ce jour3 et il n'existe aucune structure cristalline existante pour les AMG virales du sol.

L'étude des AMG dans les virus du sol est en retard par rapport à celle des environnements marins, en raison de la grande diversité et de la complexité des habitats du sol qui ont confondu la découverte virale. Dans les écosystèmes marins, les AMG virales qui codent pour les protéines photosynthétiques ont été largement étudiées8,9. Par exemple, il a été démontré que certains virus marins expriment des gènes psbA, les transcrits augmentant au cours de l'infection des hôtes10,11. Au niveau protéique, la structure d'une protéine plastocyanine codée par un phage cyanobactérien (cyanophage) a été modélisée sur la base d'une structure de référence apparentée de Synechococcus sp. PCC79428. Par comparaison avec la structure modélisée de manière similaire de la plastocyanine hôte, il a été possible de prédire des modifications spécifiques au cyanophage de la structure et du potentiel électrostatique de la plastocyanine codée par le cyanophage. De plus, la structure d'une rhodopsine virale a récemment été caractérisée à une résolution de 1,4 Å. La structure a révélé que les rhodopsines virales sont des canaux photosensibles uniques qui ont un rôle prédit dans le soutien de la photosynthèse des algues12. Ces découvertes récentes sur les virus marins mettent en évidence l'importance écologique des AMG qui maximisent potentiellement l'aptitude des phages et des hôtes dans l'environnement.

Les premiers AMG qui ont été décrits dans les virus du sol étaient des gènes codant pour des enzymes de dégradation de divers composés organiques. Par exemple, 14 gènes de glycoside hydrolase ont été détectés dans les métagénomes du pergélisol dégelé. L'un d'eux, un gène viral codant pour une enzyme glycosyl hydrolase du groupe 5 (GH5), a été cloné, exprimé et s'est avéré représenter une endomannanase3 fonctionnelle. La grande majorité des AMG viraux du sol prédits se sont vu attribuer des fonctions potentielles uniquement sur la base de leurs similitudes de séquence avec les gènes annotés dans les bases de données génomiques microbiennes4,5. Cette approche est cependant limitée dans sa capacité à déterminer si l'AMG est réellement exprimée et si la protéine est fonctionnelle.

Des AMG ont été trouvés sur des virus du sol qui codent potentiellement des gènes impliqués dans la décomposition de la chitine4,13, le deuxième polymère carboné le plus abondant sur la planète après la cellulose14. En haute mer, les picocyanobactéries utilisent la chitine qui est principalement produite par les arthropodes comme source essentielle de nutriments15. La chitine peut également s'accumuler dans les sols car elle est un composant des parois cellulaires fongiques et des exosquelettes d'insectes. Suite à la désacétylation du polymère de chitine en chitosane par les chitines désacétylases, les chitosanases clivent le chitosane en sous-unités plus petites qui peuvent être davantage dégradées, fournissant ainsi des sources de carbone et d'azote pour d'autres membres du microbiote15 Les gènes de la chitosanase ont déjà été annotés dans le génome d'un virus géant, Le chlorovirus, qui infecte les microalgues vertes dans les eaux terrestres16 et les chitosanases virales détectées ont été caractérisés comme appartenant au groupe glycosyl hydrolase 46 (GH46). Les AMG de type chitosanase transportés par les virus du sol appartiennent principalement à un autre groupe précédemment classé comme les chitosanases fongiques GH75 (pfam07335) qui clivent les bêta-1,4-chitosanes avec une activité d'endo-splitting.

Ici, nous caractérisons et validons la fonction et la structure d'un produit AMG de chitosanase virale du sol. Nous confirmons que la chitosanase est bien fonctionnelle en clonant et en exprimant le gène et en effectuant des tests d'activité. Nous obtenons une structure cristalline ultra-haute résolution de l'enzyme, qui fournit des détails sur le site actif potentiel de la famille de chitosanases GH75.

Les contigs viraux qui portaient des AMG de chitosanase GH75 ont été extraits de la base de données Integrated Microbial Genomes and Virome (IMG/VR) (v3.0). Un total de 142 AMG qualifiés de type chitosanase GH75 ont été identifiés à partir de contigs viraux avec des longueurs allant de 8 à 202 kb. La majorité des séquences provenaient de bactériophages avec une taxonomie non classée. Deux des contigs viraux étaient des génomes complets et circularisés de haute qualité (tableau supplémentaire 1).

Un arbre protéique a été construit à partir des données de séquence pour délimiter la parenté des chitosanases virales avec d'autres chitosanases microbiennes déposées dans des bases de données publiques. Les chitosanases virales étaient phylogénétiquement distinctes des chitosanases archéennes, fongiques et bactériennes GH75 (Fig. 1). Les chitosanases GH75 se sont principalement regroupées en clades distincts en fonction de leurs affectations taxonomiques, à l'exception des chitosanases archées, qui pourraient être dues à un manque de représentants archéens dans la base de données actuelle du NCBI. La majorité des chitosanases virales détectées formaient des clades serrés liés aux chitosanases bactériennes (Fig. 1). Le placement phylogénétique des chitosanases virales suggère qu'elles proviennent de bactéries via un échange génomique et ont été modifiées en versions spécifiques au virus au cours des processus de dérive génétique et de diversification17. Cette hypothèse est en outre étayée par la découverte que les contigs viraux contenant des chitosanases GH75 ont été classés comme bactériophages (tableau supplémentaire 1).

a L'arbre phylogénétique avec les chitosanases virales, fongiques (vert), bactériennes (rose) et archées (noir) est enraciné par un lysozyme bactériophage (YP_006987285.1, nœud rouge). Les feuilles des arbres représentant les chitosanases virales sont colorées par habitat : aquatique (bleu), modifié (orange), terrestre (marron). Les quatre résidus clés dans le site actif proposé sont codés par couleur et représentés dans les anneaux circulaires séquentiellement avec le résidu le plus proche de la position N-terminale dans l'anneau le plus interne. Les chitosanases virales sélectionnées pour la validation de la fonction enzymatique sont mises en évidence par des astérisques. La chitosanase virale utilisée pour la cristallisation est marquée par deux astérisques. b Les fréquences relatives de chaque résidu sur les quatre sites conservés ont été calculées et présentées dans le tableau. c Les structures protéiques des chitosanases représentatives ont été prédites par AlphaFold20 et sont colorées selon les groupes phylogénétiques : bactérien (rose), fongique (vert), viral (marron).

Un alignement de séquences multiples a été construit pour déterminer si les chitosanases virales contenaient quatre résidus conservés résidant dans un site actif présumé pour les séquences bactériennes et fongiques de la chitosanase GH7518,19 (Données supplémentaires 1). Les chitosanases virales GH75 conservent généralement les quatre mêmes résidus clés pour les sites actifs prédits, DDDE, bien que certaines des séquences aient des substitutions. La majorité des chitosanases GH75 ont de l'aspartate à la première des quatre positions, avec quelques exemples de substitutions de cystéine ou d'asparagine (anneau le plus interne sur la figure 1). Comme les substitutions dans les résidus clés peuvent affecter la fonction prédite, nous avons ensuite divisé ces chitosanases virales en sous-groupes, car il semble que les incidences des variants de résidus de sites actifs décrits ci-dessus ont tendance à se regrouper. Les chitosanases virales identifiées ont été regroupées en trois clades principaux («Clade 1», «Clade 2» et «Clade 3» sur la figure 1). Les substitutions de cystéine (fréquence relative 14,79%, Fig. 1) et d'asparagine (fréquence relative 7,75%, Fig. 1) à la première position ("D34") n'ont été observées que dans les chitosanases virales des Clade 1 et 3, respectivement. Les chitosanases virales du clade 2 et du groupe 2 contenaient les mêmes résidus que la majorité des chitosanases bactériennes et fongiques. Les chitosanases virales du Clade 1 avec et sans substitutions de cystéine ont été nommées Groupe 1.1 et Groupe 1.2, respectivement, et celles du Clade 3 avec et sans substitutions d'asparagine ont été nommées Groupe 3.1 et Groupe 3.2, respectivement. Certaines des chitosanases virales sont regroupées selon l'origine de l'échantillon, les virus du sol étant regroupés séparément des virus aquatiques. Les séquences spécifiques au sol appartenaient principalement au groupe 1.2 et au clade 3.

Des représentants des différents clades (Fig. 1) ont été sélectionnés pour la prédiction structurelle à l'aide du logiciel AlphaFold20 de prédiction de la structure des protéines basé sur l'intelligence artificielle récemment introduit. Les structures de plusieurs chitosanases GH75 bactériennes et fongiques qui avaient été précédemment décrites et caractérisées dans la littérature ont également été prédites. Deux régions caractéristiques de séquence partagées par tous les membres de GH75 ont formé un pli de domaine glycosyl hydrolase observé dans d'autres familles, par exemple GH45. Ces régions partagées encadrent un domaine non caractérisé, une région variable contenant des insertions dissemblables de longueurs variables (Fig. 1 supplémentaire). Dans plusieurs structures prédites de produits AMG viraux, cette insertion se replie sous la forme d'un domaine non caractérisé d'environ 70 acides aminés qui forme un côté d'une fente proéminente au milieu de la structure entière. Certains membres bactériens de GH75 semblent contenir une insertion homologue (Fig. 1 supplémentaire). D'autres séquences AMG de type chitosanase virale et toutes les séquences bactériennes et fongiques prédites manquent de cette insertion plus longue et ne semblent pas former un domaine substantiel. Dans la mesure où ces séquences ont des régions de séquence non homologues, ces prédictions de structure peuvent être utiles dans l'analyse comparative des différents groupes.

Les séquences d'ADN codant pour 10 des 142 AMG de type chitosanase GH75 ont été optimisées en codons pour l'expression recombinante dans Escherichia coli (les séquences sélectionnées sont indiquées par des astérisques sur la figure 1). L'expression a été observée pour neuf des 10 protéines, mais la protéine a été observée principalement dans les fractions insolubles dans toutes les cibles initiales sauf deux. Pour les deux autres cibles, suffisamment de protéines ont été exprimées et purifiées pour doser l'activité de l'endo-chitosanase. Une seule protéine exprimée, ci-après appelée V-Csn (pour Viral Chitosanase), a montré une activité et cette activité était maximale vers pH 5 (Fig. 2a). La séquence correspondante provient du groupe 3.1 et est indiquée par deux astérisques sur la figure 1, avec les résidus de site actif DDDE prédits. Cette séquence spécifique provient d'un métagénome de sol forestier (tableau supplémentaire 1). Il a été prédit que le virus qui portait V-Csn était un phage Proteobacteria (tableau supplémentaire 1). L'activité endo-chitosanase pour V-Csn a été corroborée par deux substitutions à un seul résidu à des positions proposées pour faire partie du site actif de la chitosanase. Il a été précédemment postulé, sur la base d'études biochimiques, cinétiques et mutationnelles sur les chitosanases fongiques GH75 d'Aspergillus fumigatus21 et Fusarium solani19, que deux résidus (D160 et E169 chez A. fumigatus, et D175 et E188 chez F. solani) étaient des catalyseurs essentiels. résidus. L'analyse de séquence d'une chitosanase bactérienne GH75 de Streptomyces avermitilis a montré que ces résidus étaient également conservés dans cette enzyme18. Sur la base d'un alignement partiel des séquences V-Csn, A. fumigatus, F. solani et S. avermitilis (Fig. 2b), les résidus correspondants dans V-Csn sont D148 et E157. Deux constructions V-Csn hébergeant soit une substitution D148N soit une substitution E157Q ont été générées et les activités des enzymes mutantes respectives ont été mesurées. L'activité a été réduite de cinq fois pour D148N et presque éliminée pour E157Q (Fig. 2c). Les deux constructions ont été éluées avec des temps de rétention de chromatographie par filtration sur gel identiques à ceux du V-Csn natif, et les spectres de dichroïsme circulaire ont indiqué que les deux constructions étaient repliées. Des essais de cristallisation sur V-Csn et les deux enzymes mutantes ont ensuite été entrepris.

a L'activité de V-Csn a été dosée en surveillant l'absorbance d'azurine à 590 nm après sa libération sous forme de fragments solubles d'azurine-sucre à partir d'un substrat de chitosan réticulé d'azurine insoluble (AZCL-chitosan). Les réactions ont été effectuées à température ambiante sur une gamme de valeurs de pH dans un tampon acétate. Les données représentent la moyenne des expériences répétées (n = 3) avec l'écart type indiqué par les barres d'erreur. Les données source sont fournies sous la forme d'un fichier de données source. b Alignement partiel de la séquence de V-Csn avec trois enzymes chitosanase d'Aspergillus fumigatus, Fusarium solani et Streptomyces avermitilis. La structure secondaire de V-Csn est indiquée au-dessus de l'alignement. Quatre résidus acides conservés potentiellement impliqués dans la catalyse sont colorés en bleu et rouge. L'alignement des séquences disponibles des enzymes de la famille GH75 montre que seules six positions sont universellement conservées, ces quatre résidus acides et deux résidus glycine, comme indiqué par les astérisques sous l'alignement. c Libération d'azurine par V-Csn de type sauvage et deux constructions contenant une substitution D148N ou E157Q, dans un tampon acétate à pH 5,1. Les données représentent la moyenne des expériences répétées (n = 3) avec l'écart type indiqué par les barres d'erreur. Les données source sont fournies sous la forme d'un fichier de données source. d Représentation en ruban de la forme apo1 de l'enzyme V-Csn avec les deux domaines structuraux colorés en vert clair (domaine-1) et rose (domaine-2). La nomenclature de la structure secondaire est donnée, ainsi que les emplacements des extrémités N et C. e Superposition d'un dimère construit à partir de V-Csn apo1 (molécule 1, ruban jaune) et d'un partenaire de symétrie cristallographique (molécule 2, ruban bleu), et de l'homodimère V-Csn apo2 (rubans gris). Les éléments de structure secondaire qui composent l'interface dimère sont indiqués. Les éléments de structure secondaires marqués d'un prime représentent la molécule apo1 liée à la symétrie. f Le dimère V-Csn apo2 montrant la molécule 1 sous forme de surface moléculaire jaune et la molécule 2 sous forme de ruban bleu. La zone de contact entre les deux molécules est représentée en bleu clair sur la surface jaune de la molécule 1. Les données source sont disponibles sous forme de fichier de données source.

La structure V-Csn a été résolue sous deux formes cristallines ; apo1 contenant une seule molécule dans l'unité asymétrique, et apo2 contenant un dimère dans l'unité asymétrique. La structure apo1 a été résolue par des méthodes de diffraction anormale simple (SAD) en utilisant le signal des ions bromure trempés dans des cristaux de la forme apo1. La structure a été construite automatiquement avec phenix.autobuild22 et complétée avec COOT (v0.9.8.2)23. Le signal anormal de bromure s'est étendu à une résolution d'environ 1,5 Å et la structure a été initialement affinée dans ces données. Le raffinement a été complété avec phenix.refine24 par rapport à un ensemble de données apo1 haute résolution s'étendant jusqu'à une résolution de 0,89 Å. Le modèle final comprenait 1811 atomes de protéines dans une seule chaîne, 398 molécules d'eau, trois glycérol et un anion sulfate. Les Rwork et Rfree finaux étaient de 0,1198 et 0,1307 pour 174 427 réflexions totales. La forme cristalline apo2 a été résolue par remplacement moléculaire en utilisant la structure apo1 raffinée comme modèle de recherche, et affinée avec phenix.refine.

Une seule molécule V-Csn était située dans l'unité asymétrique apo1. La structure était constituée de deux domaines structurels non contigus (Fig. 2d). La partie N-terminale du Domaine-1 (résidus 1-36) est repliée en premier et le polypeptide replie ensuite l'ensemble du Domaine-2 (résidus 37-108) avant de retraverser pour compléter le Domaine-1 (résidus 109-224). Au cours des premières étapes du raffinement, une densité résiduelle a été observée à l'extrémité N-terminale équivalente à au moins trois résidus supplémentaires. L'inspection de la séquence du vecteur d'expression a suggéré que trois résidus (G, H et S) du lieur étaient attachés à la méthionine N-terminale et ces résidus ont été ajoutés au modèle. La structure apo2 a deux molécules V-Csn indépendantes dans l'unité asymétrique et les deux molécules forment un dimère non cristallographique (Fig. 2e). La superposition des deux molécules du dimère apo2 sur la structure apo1 donne un écart quadratique moyen (RMSD) de 0,45 Å pour les deux molécules. Dans la forme cristalline apo1, le même dimère est observé bien que généré par la symétrie cristallographique du groupe d'espace C2 (Fig. 2e). Ceci est cohérent avec l'observation selon laquelle V-Csn existe sous forme de dimère en solution sur la base de la chromatographie d'exclusion stérique, bien qu'il n'y ait aucune preuve que la dimérisation soit nécessaire pour l'activité enzymatique. La formation du dimère enterre 1830 Å2 (∼9%) de la surface par monomère. Les régions de contact impliquent la boucle entre les brins β β4 et β5 (dans le domaine 2) dans une molécule se situant entre les hélices α3 et α4 dans la seconde molécule (Fig. 2f), liées via une liaison hydrogène et des interactions hydrophobes avec des résidus du deux hélices et le brin β8.

Le domaine-1 est composé d'un feuillet β torsadé antiparallèle central à six brins composé des brins β1, β2, β3, β7, β8 et β10 (Fig. 3a, b). Deux brins courts (β6 et β9) se tassent contre la face concave de la feuille β centrale, et deux hélices (α4 et α5) s'enroulent sur la face convexe de la feuille. Une recherche Dali25 utilisant le domaine-1 isolé donne plus de 1000 résultats avec un score Z supérieur à 5. Une première analyse des meilleurs résultats montre que le domaine-1 présente une similitude structurelle avec une gamme variée de protéines qui ont toutes un domaine central commun comprenant un double-psi β-barrel (DPBB) composé des brins β3, β6, β7, β8, β9 et β10. Ces protéines comprennent les protéines de défense des plantes kiwellin26,27, barwin28 et carwin29, la phytotoxine fongique cérato-platanine30, l'inhibiteur de la papaïne de Streptomyces (SPI)31, le domaine 1 des expansines (protéines qui desserrent les parois des cellules végétales)32,33, la le domaine régulateur de l'ubiquitine de l'ASPL34 et les endoglucanases hydrolysant les glucides35,36,37. Barwin, carwin et les endoglucanases sont classées comme membres de la famille des glycosyl hydrolases GH45 (https://pfam.xfam.org/family/PF02015), et la comparaison avec V-Csn montre que les enzymes GH45 et GH75 portent une forte similarité structurelle. Les deux familles, cependant, n'ont aucune similitude structurelle avec les enzymes GH46, dont la plupart sont annotées comme chitosanases mais qui ont une architecture en hélice α à deux domaines rappelant le lysozyme T438.

un domaine-1 de la structure apo1 orienté pour regarder vers le bas le motif structurel double-psi β-barrel (DPBB). Les brins composant le DPBB sont surlignés en vert vif. b Diagramme de topologie du Domaine-1 mettant en évidence le pli du motif DPBB (vert vif). c Les deux motifs psi (vert et cyan) de la structure V-Csn apo1, représentés approximativement dans la même orientation, de sorte que leur similitude structurelle est évidente. d Les deux motifs psi dans le contexte de la structure V-Csn apo1. Le motif psi vert est approximativement dans la même orientation qu'en c et le motif psi cyan est tourné d'environ 180° autour d'un axe dans la page. Ensemble, ils constituent le motif structurel double-psi β-barrel (DPBB). e Superposition du domaine V-Csn-1 (vert clair) et de la kiwelline d'Actinidia chinensis (code PDB 4PMK ; ruban orange). Loop1 et Loop2 dans kiwellin coïncident approximativement avec des parties du domaine-2 (ruban rose) de V-Csn. f Superposition de V-Csn Domain-1 (vert clair) et d'endoglucanase V d'Humicola insolens (PDB code 4ENG ; ruban jaune). Les boucles 1 et 2 de l'endoglucanase V correspondent approximativement au domaine-2 (ruban rose) de V-Csn. g Superposition de V-Csn Domain-1 (vert clair) et d'expansine de Clavibacter michiganensis (code PDB 4JCW ; ruban violet clair). La boucle 1 de l'expansine correspond à une partie du domaine V-Csn-2 (ruban rose), cependant, le domaine C-terminal de l'expansine (domaine C) ne présente aucune similitude structurelle avec V-Csn.

Le domaine DPBB, comprenant deux motifs psi imbriqués, a été décrit pour la première fois pour l'aspartate-α-décarboxylase, l'endoglucanase V, la DMSO réductase et barwin39. Dans V-Csn, chaque motif psi est composé de deux longs brins antiparallèles, l'un plié à près de 90 ° de sorte que la moitié N-terminale soit presque orthogonale à la moitié C-terminale, et un seul brin court parallèle à la C-terminal partie du long brin (Fig. 3c). Les deux motifs psi (psi1 ; β3, β9 et β10 et psi2 ; β6, β7 et β8) sont orientés l'un par rapport à l'autre de sorte que les deux brins courts (β6 et β9) forment une paire antiparallèle avec un axe pseudo-double entre eux, mappant psi1 sur psi2 (Fig. 3d). La superposition de plusieurs des principaux résultats contenant du DPBB de Dali démontre la topologie conservée des deux motifs psi dans ces protéines non apparentées (Fig. 3e – g). Plusieurs extensions de boucle décorent les domaines DPBB de ces protéines. En ce qui concerne la numérotation des brins V-Csn, ce sont : (i) Loop1, entre le brin β3 du motif psi1 et le brin β6 du motif psi2, (ii) Loop2 entre β8 de psi2 et β9 de psi1, et (iii) Boucle3 entre les brins β6 et β10 du motif psi1. Dans V-Csn, l'extension Loop1 encapsule tout le domaine-2, et dans d'autres protéines, cette boucle varie en longueur et en structure (Fig. 3e – g).

Le domaine V-Csn-2 est très inhabituel en ce qu'il affiche un manque distinct de structure secondaire et, à première vue, semble être essentiellement non structuré (Fig. 2d). Une analyse de tracé de Ramachandran des angles phi / psi du domaine-2 (Fig. 4a) montre un regroupement des angles de torsion de la chaîne principale dans les régions α et β favorisées, comme on pourrait s'y attendre pour une protéine bien repliée. Cependant, contrairement à une structure protéique typique, le domaine-2 semble manquer de longues étendues continues de structure α-hélicoïdale ou β-brin. Le calcul des caractéristiques de la structure secondaire à l'aide de plusieurs algorithmes, y compris DSSP (tel qu'implémenté dans PROCHECK et PyMOL) et le serveur STRIDE40 identifient tous deux hélices 310 à un seul tour (α1 et α2) et deux brins courts (β4 et β5), ainsi que quatre résidus individuels annotés en ponts β (résidus G56, W63, V68 et P74). Les deux courts brins β sont antiparallèles l'un à l'autre et sont reliés par trois liaisons hydrogène (Fig. 4b). Les quatre résidus de pont β sont localisés sur un morceau de polypeptide entre l'hélice α1 et le brin β4 qui est replié en deux tours en épingle à cheveux et maintenus ensemble par des interactions de liaison hydrogène entre les atomes de la chaîne principale de ces résidus de pont β, ainsi que plusieurs chaînes latérales/ liaisons hydrogène de la chaîne principale. (Fig. 4c). Une prédiction AlphaFold de V-Csn, faite après l'achèvement de la structure cristalline, était remarquablement proche sur toute la séquence (0,6 Å RMSD pour 222 atomes Cα correspondants), y compris le domaine 2 non caractérisé (0,8 Å RMSD pour 67 atomes Cα correspondants). ) (Fig. 4d).

un graphique de Ramachandran pour le domaine-2 de V-Csn apo1. Les angles de torsion de la chaîne principale (phi et psi) sont représentés par des triangles bleu clair (glycine), des carrés bleu clair (proline) et des cercles bleus (tous les autres résidus). Les trois régions privilégiées pour les feuillets β, les hélices α et les hélices gauchers sont colorées en rose. Les régions supplémentaires autorisées sont colorées en jaune pâle. b Interactions de liaison hydrogène entre les deux courts brins β, β4 et β5, dans le domaine-2. c Interactions de liaison hydrogène dans la région à 20 résidus du domaine 2 entre l'hélice α1 (une hélice 310) et le brin β5 (représentés par des bâtons gris pour les atomes de la chaîne principale uniquement). Cette région contient quatre résidus désignés sous le nom de ponts ß, G56, W63, V68 et P74 (colorés en magenta). Ces résidus sont impliqués dans des liaisons hydrogène chaîne principale-chaîne principale avec d'autres résidus de pont β et des résidus qui leur sont adjacents. La région de 20 résidus est repliée en deux boucles en épingle à cheveux, avec un résidu acide (D57 et D69) dans chaque boucle stabilisant chaque épingle à cheveux par des interactions de liaison hydrogène avec des atomes d'azote d'amide de la chaîne principale. d Superposition de la structure AlphaFold V-Csn prédite (ruban gris) et de la structure cristalline V-Csn apo1 (rubans verts et roses représentant respectivement le domaine-1 et le domaine-2).

L'inspection de la structure apo1 montre que les deux résidus identifiés comme résidus de sites actifs putatifs (D148 et E157) sont situés dans une fente entre les deux domaines structuraux (Fig. 5a). Deux résidus acides supplémentaires (D34 et D36) sont également situés dans cette fente adjacente à D148, et ces résidus ont également été conservés dans les autres chitosanases GH75 (Fig. 2b). Dans V-Csn, la chaîne latérale de D148 établit des interactions de liaison hydrogène avec l'azote amide de la chaîne principale de A92 et les chaînes latérales de D34 et D36 (Fig. 5b). Bien que le regroupement de résidus acides comme celui-ci soit inhabituel, il n'est pas sans précédent et se produit soit dans les métalloprotéines où les chaînes latérales acides sont rapprochées par leur rôle dans la liaison des métaux, soit dans les sites actifs enzymatiques où elles partagent des protons41. Au pH de cristallisation (4,6), on s'attendrait à ce que la plupart de ces résidus acides soient protonés et donc essentiellement neutres, et le calcul de la surface électrostatique dans la fente du site actif à ce pH montre très peu de charge négative (Fig. 5c ). Au pH optimal de l'enzyme (5,1 à 5,5), cependant, les résidus d'aspartate seraient un peu moins protonés et il y a une charge négative significative dans la fente (Fig. 5d), ce qui peut être important pour attirer le substrat de chitosan dans la poche. .

une représentation de surface accessible au solvant de la structure V-Csn apo1 avec quatre résidus acides conservés (bâtons jaunes et rouges) regroupés dans la fente inter-domaine. Surface colorée comme pour la Fig. 2d : Domaine-1, vert ; Domaine-2, rose. b Gros plan du site actif putatif mettant en évidence les quatre résidus acides conservés. Les liaisons hydrogène sont représentées par des lignes noires en pointillés et les molécules d'eau sous forme de sphères rouges. c Surface électrostatique de V-Csn apo1 calculée à pH 4,6. La surface est profilée de −5 kT/e (rouge) à +5 kT/e (bleu). d Surface électrostatique de V-Csn apo1 calculée à pH 5,5. La surface est profilée de −5 kT/e (rouge) à +5 kT/e (bleu). e Représentation de la surface accessible au solvant du complexe chitohexaose-V-Csn montrant l'emplacement de la fraction trisaccharide (sphères CPK jaunes, bleues et rouges) dans la fente du site actif. L'orientation de la molécule en vue de dessus est approximativement la même qu'en a, et la vue de dessous est tournée de 90° pour montrer la vue de côté. Enzyme colorée par les domaines structuraux (Domaine-1, vert ; Domaine-2, rose). f Densité électronique Fo-Fc résiduelle (maille rose) pour le substrat lié profilé à 2,5 σ. La carte de densité électronique a été calculée après le remplacement moléculaire et avant l'incorporation du substrat. La molécule de trisaccharide raffinée finale (GlcN-1, GlcN-2 et GlcN-3) est représentée sous forme de bâtonnets cyan. g Représentation en ruban du complexe chitohexaose-V-Csn avec un trisaccharide (bâtonnets cyan) lié dans le site actif. Liaisons hydrogène indiquées par des lignes noires en pointillés et des molécules d'eau sous forme de petites sphères rouges (Domaine-1, vert ; Domaine-2, rose). h Représentation de la surface accessible au solvant du complexe cellohexaose de Humicola isolens endoglucanase V (Cel45) : domaine DPBB, jaune ; deux boucles pour les petits sous-domaines, marron (inférieur) et orange (supérieur). La molécule de cellohexaose (magenta) est liée dans un tunnel étroit entre le domaine DPBB et les deux boucles. La vue sur le côté droit du panneau est tournée de 90° pour montrer le site actif en forme de tunnel, contrairement au site actif ouvert dans V-Csn. i Représentation de la surface accessible au solvant de l'endoglucanase CaCel de Cryptopygus antarcticus : domaine DPBB, bleu clair ; deux boucles sont colorées en bleu (inférieur) et cyan (supérieur). Emplacement de la fente de liaison du substrat et du tunnel indiqué par la molécule de cellohexaose (bâtons magenta) dérivée du complexe Cel45 en h.

Des mutants dirigés D148 et E157 ont été construits. Dans les deux cas, le carboxylate a été converti en amide correspondant, générant les protéines mutantes D148N et E157Q. Les deux protéines mutantes V-Csn ont été cristallisées dans les mêmes conditions que la protéine de type sauvage, et leurs structures ont été déterminées par remplacement moléculaire à haute résolution. La superposition des deux structures mutantes sur la structure apo1 de type sauvage a donné des RMSD de 0, 11 et 0, 07 Å, respectivement, pour toutes les positions Cα, suggérant de très petites différences de conformation entre le mutant et les structures de type sauvage. La co-cristallisation des deux protéines mutantes avec du chitohexaose (un polymère à liaison β-(1-4) de six résidus D-glucosamine (GlcN)) a donné un complexe avec le mutant E157Q uniquement. Le substrat était situé dans la fente interdomaine (Fig. 5e), avec trois des six résidus GlcN (ci-après nommés GlcN-1, GlcN-2 et GlcN-3) visibles dans la densité électronique Fo-Fc (Fig. 5f), orientés tel que GlcN-1 est l'extrémité réductrice. Les résidus GlcN-2 et GlcN-3 sont dans une conformation de chaise standard, cependant, la densité du premier résidu observé (GlcN-1) a suggéré une conformation de bateau déformée.

Le résidu GlcN-1 est ancré par une simple liaison hydrogène entre l'atome O6 et la chaîne latérale de Q157 (Fig. 5f). Le résidu GlcN central (GlcN-2) établit des interactions de liaison hydrogène avec les chaînes latérales de D148 et D36 via son amine libre, ainsi qu'un tiers avec l'oxygène carbonyle du squelette de A90 du domaine-2. Le résidu GlcN-3 établit une interaction de liaison hydrogène avec l'oxygène carbonyle de T91 via l'atome O6, et une autre avec une molécule d'eau. Bien qu'une certaine densité Fo-Fc supplémentaire ait été observée à l'extrémité non réductrice de GlcN-3 (l'atome O4), la rareté de la densité n'a pas permis de modéliser un quatrième GlcN. La localisation du fragment trisaccharidique et les interactions qu'il établit avec la protéine suggèrent que les résidus D36 et D148 forment le sous-site -242 et jouent un rôle clé dans la liaison et l'orientation du substrat (ici via le résidu GlcN-2). Le résidu E157 représente le sous-site -1 et peut servir de groupe nucléophile responsable du clivage de la liaison, en supposant que l'hydrolyse s'est produite à l'extrémité réductrice de GlcN-1.

Bien que la fonction de V-Csn Domain-2 ne soit pas entièrement comprise, plusieurs éléments de preuve indiquent qu'il est impliqué dans la formation du site actif et dans la liaison au substrat. Comparaison de la structure V-Csn avec les structures des enzymes de la famille GH45, l'endoglucanase V (Cel45) de Humicola insolens (PDB code 3ENG)35,36 et l'endo-β−1,4-glucanase (CaCel45) de Cryptopygus antarcticus (PDB code 5H4U )37 montre que le site actif fendu dans ces glycosyl hydrolases est constitué d'un côté par le domaine DPBB et les boucles qui portent les résidus acides catalytiquement importants, et de l'autre par Loop-1 (une longue boucle sinueuse dans les enzymes GH45 et équivalent à l'ensemble du domaine-2 dans V-Csn) et Loop-3 (un faisceau à trois hélices dans les enzymes GH45) (Figs. 3e, 5h, i). L'analyse des sous-sites individuels dans le complexe cellohexose de Cel45 (code PDB 4ENG) montre que les sous-sites -1 et +2 sont formés partiellement par des résidus de Loop1 et Loop3 respectivement, et ces sous-sites qui flanquent le site de clivage +1/-1 être important pour l'orientation correcte du substrat de cellulose avant l'hydrolyse. En fait, dans Cel45 et CaCel45, les parois de fente du site actif forment un tunnel à travers lequel le substrat de cellulose est enfilé (Fig. 5h, i).

Comme indiqué précédemment, une boucle dans le domaine V-Csn-2 (résidus Ala90 et Thr91) est impliquée dans la formation des sous-sites -2 et -3 (Fig. 5g) et devrait orienter correctement cette extrémité du substrat de chitosane pour positionnement optimal du site de clivage -1/+1. De plus, la superposition du complexe cellohexoase-Cel45 sur le complexe chitotriose-V-Csn et la modélisation de la fraction cellohexose dans la fente du site actif V-Csn (Fig. 6a, b) montrent que les résidus Asp50 et Asn54 du domaine-2 pourraient former le +1 sous-site, ancrant efficacement cette extrémité du substrat, les sous-sites +2 et +3 étant très probablement confinés au domaine-1. La superposition des modèles prédits AlphaFold pour les neuf chitosanases virales choisies pour la validation de la fonction enzymatique (Fig. 1) sur V-Csn montre qu'elles ont toutes un aspartate spatialement équivalent à Asp50 dans V-Csn, et quatre des neuf ont soit un Asn ou Asp dans un emplacement équivalent à Asn54. Bien que la fente formée entre le domaine-1 et le domaine-2 dans V-Csn (Fig. 5e) soit plus large que le tunnel dans les enzymes GH45, les similitudes structurelles entre V-Csn et les enzymes GH45 indiquent que le domaine-2 joue un rôle clé. rôle dans la reconnaissance, la liaison et l'orientation optimale du substrat de chitosane dans V-Csn.

a Représentation de surface moléculaire du mutant E157Q-V-Csn (domaines verts et roses) avec du cellohexaose (bâtonnets magenta) modélisé dans la fente du site actif basée sur la superposition du complexe chitohexaose-Cel45 (code PDB 4ENG). Les trois résidus GlcN observés dans le complexe E157Q-VCsn sont représentés sous forme de bâtonnets cyan. b Le site de reconnaissance putatif GlcN + 1 dans V-Csn basé sur la superposition du complexe chitohexaose-Cel45. c Alignement partiel de la séquence basée sur la structure de V-Csn avec plusieurs enzymes contenant des domaines DPBB. L'alignement a été déterminé à partir de superpositions des enzymes contre V-Csn sur la base de leurs motifs DPBB. Les quatre résidus acides conservés observés dans le site actif V-Csn sont colorés en bleu et rouge. Les résidus correspondants dans les enzymes GH45 et d'autres protéines contenant du DPBB sont colorés de manière similaire lorsqu'ils sont structurellement équivalents. Les séquences utilisées sont les suivantes : Cel45, endoglucanase V de Humicola isolens (Genbank P43316.1) ; CaCel, endoglucanase de Cryptopygus antarcticus (Genbank ACV50415.1); MaEG, endoglucanase de Melanocarpus albomyces (Genbank CAD56665.1); TtCel45A, endoglucanase de Thielavia terrestris (Genbank 1182607135); EXLX1, expansine de Bacillus subtilis (Genbank O34918); SPI, inhibiteur de papaïne de Steptomyces de Streptomyces mobaraensis (Genbank WP_004951535.1); carwin de Carica papaya (Genbank 4JP6_A); kiwelline d'Actinidia chinenesis (Genbank AGC39168.1). d Superposition de V-Csn (rubans verts et roses, bâtons verts et roses et étiquettes noires en gras), Cel45 (ruban jaune, bâtons fins jaunes et étiquettes italiques orange, code PDB 3ENG) et expansin EXLX1 (ruban bleu clair, bâtons bleu clair et étiquettes cyan italique, code PDB 4FFT). Les structures ont été superposées en faisant correspondre les motifs DPBB. e Représentation schématique de la réaction de clivage de la liaison glycoside proposée catalysée par V-Csn. Glu157 agit en tant que donneur de proton catalytique et Asp36 agit en tant que base catalytique qui accepte un proton d'une molécule d'eau.

Comme indiqué précédemment, des études biochimiques et enzymologiques sur certaines chitosanases GH75 connues ont impliqué deux résidus acides (équivalents à D148 et E157 dans V-Csn) comme étant impliqués de manière critique dans la catalyse18,19,21. Il a été établi que les enzymes GH75 sont des endoglucanases18 qui inversent la stéréochimie au niveau du carbone anomérique, produisant l'anomère α des produits oligosaccharidiques19,21, il est donc probable que V-Csn soit également une enzyme inverseuse. Il est à noter que dans les enzymes DPBB annotées comme enzymes de liaison et/ou d'hydrolyse des glucides, le résidu acide à une position équivalente à E157 dans V-Csn est universellement conservé (soit un glutamate, soit un aspartate), basé sur la superposition de V-Csn avec ces DPBB et la génération ultérieure d'un alignement de séquence partiel basé sur la structure (Fig. 6c). Les données structurelles de Cel4535,36 et CaCel4537 suggèrent que ce résidu acide est le donneur catalytique de protons dans les enzymes GH45, et étant donné la similitude structurelle des domaines DPBB dans les enzymes GH45 et GH75, il est fort probable que E157 soit le donneur catalytique de protons. dans V-Csn. Il convient de noter que les enzymes GH45 sont classées parmi les endoglucanases qui conduisent également à une inversion de configuration au niveau du carbone anomérique de la liaison glycosidique clivée43.

L'identité de la base catalytique est moins claire, bien que basée sur la même superposition et le même alignement de séquence (Fig. 6c), Cel45 et CaCel ont des résidus acides près de l'extrémité N-terminale des enzymes respectives (D10 dans Cel45 et D13 dans CaCel) qui ont été identifiées comme la base générale acceptant le proton lors de l'hydrolyse de la liaison glycosidique β(1,4)35,37. Ces résidus sont structurellement équivalents à D36 dans V-Csn (Fig. 6d), ce qui suggère que ce résidu peut également agir comme base catalytique dans l'enzyme virale. Une représentation schématique du mécanisme de réaction putatif pour V-Csn est donnée sur la figure 6e. Comme indiqué précédemment, les enzymes fongiques et bactériennes GH75 ont un résidu aspartate à ce même emplacement (Fig. 2b). Inversement, d'autres enzymes DPBB provisoirement annotées comme enzymes de liaison aux glucides et/ou hydrolytiques manquent d'un résidu acide équivalent à D34 ou D36 (Fig. 6c) à l'exception de la protéine inhibitrice de la papaïne de Streptomyces (code PDB 5NTB)31 et de la kiwelline (code PDB 4PMK )26, mais ils ont un aspartate structurellement équivalent à D148 qui peut agir comme base catalytique dans ces enzymes. Bien que la fonction de chacun des quatre résidus acides dans le site actif V-Csn ne soit pas encore entièrement comprise, leur regroupement dans la fente et les preuves corroborantes des enzymes GH45 et GH75 suggèrent qu'il est très probable qu'ils auront des rôles dans la liaison au substrat (D34 et D148) et le mécanisme catalytique (D36 et D157). La validation de l'attribution de la fonction doit attendre d'autres études de mutation et de liaison au substrat.

Pour résumer, il y a plusieurs implications écologiques de cette étude. Nous avons identifié des AMG putatifs à partir de séquences virales du sol en appliquant des critères de dépistage rigoureux et des inspections des régions codantes en amont/aval, et avons démontré de manière concluante qu'au moins certains AMG portés par des virus du sol sont fonctionnels. Nos analyses rigoureuses ont non seulement abouti à une structure cristalline d'un produit AMG viral du sol, mais nous ont également permis de proposer le mode d'action de cette enzyme chitosanase jusque-là non caractérisée dans la famille GH75 des glycosyl hydrolases. Les séquences de chitosanase qui ont été incluses et comparées ont révélé une distinction phylogénétique entre les chitosanases virales et celles précédemment décrites chez les bactéries et les champignons. Cependant, comme les chitosanases virales étaient des sous-groupes au sein de clades bactériens et que les virus détectés avec les AMG de chitosanase étaient des bactériophages, cela suggère qu'ils provenaient de bactéries. Les chitosanases virales du sol formaient également des sous-groupes distincts de leurs homologues des systèmes aquatiques. L'enzyme V-Csn que nous avons caractérisée fonctionnellement et structurellement provient d'une séquence d'un sol forestier (DOI 10.46936/10.25585/60000627, tableau supplémentaire 1). Les sols forestiers sont souvent caractérisés comme ayant plus de champignons que les autres types de sols44. Cela peut être une raison pour la sélection de virus qui ont la capacité d'aider à décomposer la chitine - un composant majeur des parois cellulaires fongiques et une source importante de carbone et d'azote. La raison de la sélection d'un virus qui porte cette capacité indépendamment de son hôte est actuellement inconnue. Par analogie avec les systèmes marins où les virus transportent des AMG qui aident à soutenir la production d'énergie via la photosynthèse chez leurs hôtes respectifs8,9,45, les virus du sol peuvent également aider leurs hôtes à décomposer les ressources en carbone disponibles dans le sol au fur et à mesure qu'elles deviennent disponibles.

La base de données Integrated Microbial Genomes and Virome (IMG/VR) (v3.0)46 a été criblée pour les séquences correspondant aux gènes prédits de la chitosanase. Les contigs viraux avec des gènes annotés par un HMM de chitosanase (pfam07335) ont d'abord été identifiés en appliquant un pipeline de détection virale JGI47. Pour une attribution fonctionnelle plus conservatrice, les séquences de chitosanase virale ont été vérifiées par rapport à des bases de données d'annotations, notamment EggNOG48, la base de données d'enzymes actives sur les glucides (CAZY)49 et les attributions d'ontologies fonctionnelles pour la base de données de métagénomes (FOAM)50 à l'aide de hmmsearch (Hmmer v3.1b2) 51 et recherche de similarités de séquence avec les chitosanases NCBI à l'aide de blastp (v2.9.0+)52. Les chitosanases virales putatives ont ensuite été criblées par rapport à un profil de HMM de lysozyme pour éliminer les lysozymes mal annotés (PF13702, PF00959, PF04965, PF18013, PF00062 et un lysozyme HMM4 auto-conservé en utilisant les séquences de lysozyme déposées sur les virus NCBI (consultées le 16 novembre 2020).

Pour une attribution sûre des gènes de chitosanase en tant qu'AMG viraux, le contenu génomique des contigs viraux portant des gènes de chitosanase sélectionnés à partir des étapes ci-dessus a été inspecté. Les gènes des contigs viraux ont été prédits et traduits à l'aide de Prodigal (v2.6.3)53. Les séquences protéiques ont été annotées par les bases de données bactériennes et archéennes EggNOG et trois bases de données virales4,54, en plus des 7185 HMM spécifiques microbiens et 8773 spécifiques viraux mis en œuvre dans checkV (v0.7.0)55. Les candidats chitosanase AMG ont été classés en cinq catégories selon leurs positions géniques sur les contigs viraux et la présence ou l'absence de gènes caractéristiques viraux4 : Catégorie 0, gènes caractéristiques viraux (c'est-à-dire les gènes codant pour les protéines structurales virales, les terminases et les intégrases) en amont et en aval ; Catégorie 1, gènes spécifiques au virus en amont et en aval, plus gènes caractéristiques viraux en amont ou en aval ; Catégorie 2, gènes spécifiques au virus à la fois en amont et en aval, mais sans gènes caractéristiques viraux ; Catégorie 3, gènes spécifiques au virus en amont ou en aval, mais sans gènes caractéristiques viraux ; Catégorie 4, située en bordure du contig viral. Seuls les contigs viraux avec des scores de confiance élevés (catégories 0-2) pour les AMG de chitosanase ont été retenus pour les analyses ultérieures (tableau supplémentaire 1).

Les contigs viraux avec des AMG de chitosanase ont été regroupés avec des génomes Viral RefSeq (v201) sur la base d'une matrice de partage de protéines notées. Un réseau de clustering comprenant des interactions par paires a été généré en appliquant vConTACT en utilisant les paramètres par défaut (v2.0.9.10)56. Les contigs viraux du sol ne partageaient pas suffisamment de gènes avec des virus de référence précédemment déposés pour permettre une attribution taxonomique sûre.

Les hôtes putatifs des contigs viraux qui transportaient les AMG de chitosanase ont été prédits à l'aide de trois outils bioinformatiques publiés : 1) WIsH57 (v1.0, meilleur résultat), 2) VirHostMatcher58 (v1.0.0, meilleur résultat) et 3) Hôte du virus procaryote Prédicteur (PHP)59 ("consensus"). La taxonomie finale de l'hôte d'un contig viral a été attribuée lorsque les résultats d'au moins deux des trois outils ont atteint un consensus.

Pour délimiter la parenté phylogénétique des chitosanases virales détectées avec les chitosanases GH75 dans d'autres taxons, un arbre phylogénétique a été construit sur la base d'alignements de séquences multiples de séquences protéiques de chitosanases archaïques, bactériennes, fongiques et virales. L'arbre a été ré-enraciné à l'aide d'un lysozyme bactériophage (YP_006987285.1). Afin de couvrir l'espace génétique diversifié dans tous les domaines de la vie, nous avons d'abord interrogé la «chitosanase» de la base de données de protéines NCBI (https://www.ncbi.nlm.nih.gov/protein, consultée le 11 octobre 2021) et plus loin criblé par le GH75 chitosanase pfam (PF07335). Les séquences des chitosanases bactériennes et fongiques GH75 utilisées pour identifier les résidus clés dans les sites actifs ont également été incluses dans les références. 18, 19. Les séquences de référence ont ensuite été regroupées à 70 % d'identité d'acides aminés pour éliminer la redondance à l'aide de CD-HIT (v4.8.1)60 et la séquence représentative de chaque cluster d'une longueur supérieure à 150 acides aminés a été incluse dans l'ensemble de référence final. , résultant en deux séquences d'archaea, 230 de bactéries et 180 de champignons. Les chitosanases virales dérépliquées et les séquences de référence ont été alignées à l'aide de MAFFT avec les paramètres par défaut (v7)61. Les alignements de séquences multiples (MSA) ont été inspectés manuellement et ajustés en fonction des positions des quatre résidus clés du site actif prédit sur les séquences virales et de référence. La région dans l'alignement va du premier résidu conservé (site actif prédit) au dernier résidu conservé. De plus, nous avons conservé des résidus adjacents bien alignés où <10 % des séquences présentaient un écart (Données supplémentaires 1). L'arbre phylogénétique a été construit à l'aide de RAxML (v1.0.1) avec le modèle spécifié LG+ G8+ F et 500 bootstraps62.

Le gène codant pour une séquence putative de chitosanase virale du sol (Ga0126380_1000012531 : noté avec un double astérisque sur la figure 1) a été synthétisé chimiquement (Twist Bioscience, San Francisco, CA) et inséré dans le site NdeI de pET28a incluant une extension de 20 résidus. à l'extrémité N-terminale (MGSSHHHHHHSSGLVPRGSH) contenant une étiquette d'affinité métallique poly-histidine (gras) et un site de clivage de la thrombine protéase (souligné) dans la séquence d'acides aminés primaire de la protéine exprimée. Le plasmide recombinant a été utilisé pour transformer Escherichia coli chimiquement compétent BL21(DE3) (Invitrogen, Carlsbad, CA) à partir duquel ∼1 mL ∼15% de stocks de glycérol (milieu LB, OD600nm = ∼0,8) ont été préparés à partir d'une seule colonie et congelés ( −80 °C) pour une utilisation future. Ce stock de glycérol a été utilisé pour ensemencer 25 ml de milieu LB qui a été cultivé jusqu'à une DO600nm d'environ 0,8, puis transféré dans 750 ml de milieu LB d'auto-induction63 (flacons de 2 L, agitateur 200 tr/min, 0,34 ug/uL de kanamycine, 37 °C) . Après avoir atteint une DO600nm d'environ 1, la température a été abaissée à 30°C. Les cellules ont été récoltées environ 16 h plus tard (le lendemain) par centrifugation douce puis congelées (-80 ° C). Les cellules ont été lysées en décongelant le culot congelé suivi d'une sonication (~ 1 min) avant et après trois passages à travers une presse française (SLM Aminco, Rochester, NY). Après centrifugation, la protéine de la fraction soluble a été purifiée à l'aide d'un protocole de purification classique en deux étapes : chromatographie d'affinité sur chélate métallique sur une colonne Ni-Agarose 6 FastFlow de 20 mL (GE Healthcare, Piscataway, NJ) suivie d'une chromatographie par filtration sur gel sur une Colonne Superdex HiLoad 26/60 (GE Healthcare, Piscataway, NJ)64. Les fractions contenant la protéine cible après la dernière étape de la colonne ont été concentrées à 2–5 mg/mL (Tampon protéique : 100 mM NaCl, 20 mM Tris, 1 mM DTT, pH 7) et conservées à 4 °C jusqu'à leur utilisation pour la cristallisation ou l'enzyme dosages. Des rendements de 2 à 4 mg de protéine purifiée ont été obtenus par litre de milieu LB. Le même protocole a été appliqué pour préparer deux protéines modifiées contenant chacune la substitution ponctuelle D148N ou E157Q. La mutagenèse a été réalisée comme suit65 : En bref, le premier brin du plasmide matrice contenant le gène de type sauvage a été coupé avec Nt.BbvCI et digéré avec les exonucléases I et III. Des oligonucléotides (Thermo Fisher, Pleasanton, CA) ont été conçus pour introduire des mutations ponctuelles aux emplacements souhaités et ajoutés dans un rapport de 1:20 avec l'ADN matrice simple brin. Les séquences d'amorçage ont été étendues avec la polymérase Phusion. Après avoir résolu les coupures avec l'ADN ligase Taq, le deuxième brin de type sauvage a été coupé avec Nb.BbvCI, digéré avec l'exonucléase I et régénéré par amorçage à partir d'un deuxième oligonucléotide pour créer une molécule d'ADNdb mutagénisée complète. Toutes les enzymes ont été obtenues auprès de NEB, Ipswich, MA. La séquence des constructions assemblées a été vérifiée (Pacific Biosciences Sequel IIe, PacBio, Menlo Park, CA).

Le V-Csn de type sauvage et les deux protéines modifiées ont été testés pour l'activité de l'endo-chitosanase à l'aide d'un substrat de chitosane réticulé à l'azurine (AZCL) (AZCL-chitosan ; Megazyme, Wicklow, Irlande)66. Des solutions mères (1200 μg/mL) de chaque protéine ont été préparées dans du tampon protéique avec des suspensions AZCL-chitosan (2500 μg/mL) à pH 4,3, 5,1 et 6,5 dans de l'acétate de sodium 40 mM, 100 mM NaCl, 1 mM DTT. Les réactions ont été réalisées en triple exemplaire, à température ambiante, en ajoutant 17 μL de protéine (20 μg) à 100 μL d'AZCL-chitosan dans un tube Eppendorf de 500 μL. Les tubes ont été agités par rotation (40 rpm) dans un Multi-Purpose Tube Rotator (Fisher Scientific). L'activité a été contrôlée en granulant le substrat avec une brève centrifugation et en mesurant l'absorbance du produit lié à l'azurine libéré à 590 nm (NanoDrop 2000c; Thermo Scientific) en utilisant une aliquote de 2 μL. Les réactions à blanc n'ont montré aucune libération de produit lié à l'azurine en l'absence de mesures de protéines et de pH avant et après que la réaction ait varié de moins de 0,1 unité de pH.

Les conditions de cristallisation initiales pour V-Csn ont été obtenues en utilisant la méthode de la goutte suspendue utilisant l'écran Top96 (Anatrace). Des cristaux ont été observés dans de multiples conditions. Les cristaux de plusieurs conditions ont été récoltés et refroidis par flash dans de l'azote liquide dans leurs conditions de cristallisation respectives augmentées avec 20 % d'éthylène glycol. Les cristaux ont été envoyés au SSRL pour un criblage par diffraction sur la ligne de lumière BL9-2. Trois conditions ont donné des cristaux qui diffractaient à haute résolution; condition #45 (sulfate d'ammonium 0,2 M, acétate de sodium 0,1 M pH 4,6, 30 % MMePEG2000) dans le groupe d'espace C2 avec des dimensions de cellule unitaire a = 108,84 Å, b = 47,63 Å, c = 45,55 Å, β = 97,8°, avec un monomère dans l'unité asymétrique (AU); condition n ° 38 (citrate 0, 1 M pH 5, 5, 20% PEG3000) dans le groupe d'espace C2 avec des dimensions de cellule unitaire a = 163, 30 Å, b = 46, 00 Å, c = 73, 56 Å, β = 92, 3 °, avec deux monomères dans l'UA; et condition #20 (sulfate d'ammonium 0,2 M, bis-tris 0,1 M pH 5,5, 25 % PEG3350) dans le groupe d'espace C2 avec des dimensions de cellule unitaire a = 80,47 Å, b = 35,76 Å, c = 80,66 Å, β = 118,5°, avec un monomère dans l'UA.

Les ensembles de données ont été collectés à partir de monocristaux dans les conditions #45 et #38. Pour le cristal de condition n ° 45 (désigné apo1), 1800 images à 0, 2 ° ont été collectées sur BL12-2 en utilisant des rayons X à 17 000 eV (0, 72929 Å) et un détecteur Pilatus 6 M PAD fonctionnant en mode sans obturateur. Les images ont été traitées avec XDS (v. 5 février 2021)67 et mises à l'échelle à l'aide d'AIMLESS68. L'ensemble de données final comprenait 174574 réflexions uniques à une résolution de 0,89 Å. Pour le cristal de condition #38 (apo2), 1800 images à 0,2° ont été collectées sur BL9-2 en utilisant des rayons X à 12658 eV (0,97946 Å) et un détecteur Pilatus 6 M PAD fonctionnant en mode sans obturateur. Les images ont été traitées avec XDS67 et mises à l'échelle à l'aide d'AIMLESS68, et l'ensemble de données final comprenait 117982 réflexions uniques à une résolution de 1,35 Å. Des statistiques supplémentaires de collecte de données et de traitement pour les deux formes cristallines sont présentées dans le tableau 1.

Pour le phasage expérimental, une solution de trempage de KBr a été préparée en dissolvant du KBr solide dans un tampon de cristallisation de condition n° 45 augmenté de 25 % de glycérol jusqu'à l'obtention d'une solution saturée (comme déterminé visuellement au microscope). Cette solution a été diluée avec un tampon frais pour former une solution de trempage de cristaux saturés au 1/8. Plusieurs cristaux d'apo1 ont été agités rapidement dans cette solution et refroidis rapidement dans de l'azote liquide. Les ensembles de données de diffraction ont été collectés à partir de cristaux d'apo1 imbibés de KBr sur la ligne de faisceau BL12-2 au bord du bromure (13 481 eV, 0, 91967 Å). Un total de 3600 images ont été collectées avec un angle de rotation de 0,2°/image, en utilisant la méthode du faisceau inverse et des coins de 20°. Les images ont été traitées avec XDS67 et mises à l'échelle avec AIMLESS (v0.7.7)68. Des statistiques supplémentaires sont données dans le tableau 1. L'analyse initiale des données a indiqué un fort signal anormal provenant du bromure s'étendant jusqu'à une résolution d'environ 1,7 Å.

La structure V-Csn a été résolue par les méthodes Br-SAD (bromide single anomalous diffraction) implémentées dans PHENIX22. Suite à l'aplatissement du solvant et à la modification de la densité, le facteur de mérite global (FOM) était de 0,363 pour 16 sites de bromure. Autobuilding in PHENIX (v1.20.1-4487) a généré un modèle comprenant 221 des 224 résidus attendus. Le raffinement initial avec phenix.refine24 a donné un Rwork et un Rfree de 0,158 et 0,187, respectivement. Le modèle a été complété à l'aide de COOT23 et affiné avec phenix.refine en utilisant les données apo1 à une résolution de 0,89 Å. Des molécules d'eau ont été ajoutées à des positions structurellement et chimiquement pertinentes, et les paramètres de déplacement atomique pour tous les atomes de la structure ont été affinés de manière isotrope. La structure apo2 a été résolue par remplacement moléculaire à l'aide du programme MOLREP (v11.9.02)69 de la suite CCP470, en utilisant la structure apo1 raffinée comme modèle de recherche. Les statistiques finales de raffinement pour les deux structures apo-V-Csn sont données dans le tableau 2.

Les mutants V-Csn D148N et E157Q ont été criblés pour la cristallisation en utilisant les conditions #20, #38 et #45, et des cristaux ont été observés dans les trois. Les ensembles de données de diffraction ont été collectés à partir de cristaux uniques D148N et E157Q de la condition #45. Pour les cristaux D148N, 1 800 images (rotation/image de 0,2°) ont été collectées sur BL12-2, et les données ont été traitées et mises à l'échelle avec XDS67 et AIMLESS68. Pour le cristal E157Q, 1850 images ont été collectées sur BL12-2, et les données traitées et mises à l'échelle avec XDS67 et AIMLESS68. Les statistiques de collecte de données sont présentées dans le tableau 3. Les deux structures ont été résolues par remplacement moléculaire avec MOLREP69 en utilisant la structure V-Csn de type sauvage raffinée comme modèle de départ, avec toutes les molécules d'eau éliminées. Les structures D148N et E157Q ont été affinées avec phenix.refine24, et les statistiques finales sont également données dans le tableau 3.

Le complexe E157Q-substrat a été préparé en dissolvant 0,06 mg de chitohexaose (Biosynth) dans 10 µL de E157Q à 3,3 mg/ml, donnant une concentration finale en chitohexaose d'environ 5 mM. Le complexe a été incubé à 4 ° C pendant 1 h avant de mettre en place des gouttes assises contre la condition de cristallisation # 45. Les gouttes de cristallisation ont été ensemencées en stries plusieurs heures après la mise en place et des cristaux du complexe ont été observés dans toutes les gouttes pendant la nuit. Les cristaux étaient morphologiquement similaires aux cristaux de type sauvage et mutants cultivés dans les mêmes conditions. Les cristaux ont été transférés dans un tampon de cristallisation additionné de 25 % de glycérol et refroidis par flash dans de l'azote liquide. Les données de diffraction ont été recueillies à BL12-2. Au total, 1800 images ont été collectées, et les données ont été traitées et mises à l'échelle avec XDS67 et AIMLESS68. La structure complexe du substrat E157Q a été résolue par remplacement moléculaire par MOLREP69 en utilisant la structure V-Csn de type sauvage raffinée avec toutes les molécules d'eau supprimées comme modèle de départ, et raffinée avec phenix.refine24. Les statistiques de collecte et de raffinement des données sont présentées dans le tableau 3.

Les prédictions de structure AlphaFold ont été exécutées à l'aide d'une version installée localement du logiciel récupéré à partir du référentiel officiel GitHub (https://github.com/deepmind/alphafold) ou du bloc-notes collaboratif Google AlphaFold (https://colab.research. google.com/github/sokrypton/ColabFold/blob/main/AlphaFold2.ipynb). Les surfaces accessibles au solvant ont été calculées avec PyMOL (v2.5.2) (Schrodinger) et ICM-Pro (v3.8-6a) (Molsoft), en utilisant un rayon de sonde de 1,4 Å (équivalent au rayon d'une seule molécule d'eau). Les surfaces électrostatiques ont été générées avec le plugin Adaptive Poisson-Boltzmann Solver (APBS) pour PyMOL (v2.5.2).

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.

Les données à l'appui de cette étude sont disponibles auprès des auteurs correspondants sur demande raisonnable. Les données de séquence virale utilisées pour la figure 1 sont accessibles au public sur le site Web de JGI [https://img.jgi.doe.gov/cgi-bin/vr/main.cgi] sans restriction d'utilisation conformément à la politique de données de JGI. Les coordonnées atomiques et les facteurs de structure des structures protéiques ont été soumis à la banque de données protéiques RSCB (PDB) sous les codes d'accession 7TVL (V-Csn apo1), 7TVM (V-Csn apo2), 7TVN (V-Csn-D148N), 7TVO (V-Csn-E157Q) et 7TVP (complexe chitohexaose V-Csn-E157Q). Les données source sous-jacentes aux Fig. 2a, c sont fournies sous forme de fichiers de données source. Les données sources sont fournies avec ce document.

Christo-Foroux, E. et al. Caractérisation du Mollivirus kamchatka, le premier représentant moderne de la famille proposée des molliviridae de virus géants. J. Virol. 94, e01997–01919 (2020).

Article PubMed PubMed Central Google Scholar

Legendre, M. et al. Étude approfondie du Mollivirus sibericum, un nouveau virus géant vieux de 30 000 ans infectant Acanthamoeba. Proc. Natl Acad. Sci. 112, E5327–E5335 (2015).

Article CAS PubMed PubMed Central Google Scholar

Emerson, JB et al. Écologie virale du sol liée à l'hôte le long d'un gradient de dégel du pergélisol. Nat. Microbiol. 3, 870–880 (2018).

Article CAS PubMed PubMed Central Google Scholar

Wu, R. et al. La diversité virale, l'abondance et le potentiel fonctionnel de l'ADN varient selon les sols des prairies avec une gamme de régimes d'humidité historiques. mBio. 12, e0259521 (2021).

Article PubMed Google Scholar

Trubl, G. et al. Interactions virus-hôte actives à des températures inférieures au point de congélation dans un sol tourbeux arctique. Microbiome 9, 208 (2021).

Article CAS PubMed PubMed Central Google Scholar

Breitbart, M. Virus marins : action ou vérité. Ann. Rév. Mar. Sci. 4, 425–448 (2012).

Article PubMed Google Scholar

Trubl, G. et al. Les virus du sol sont des acteurs sous-explorés dans le traitement du carbone des écosystèmes. MSystems 3, e00076–00018 (2018).

Article CAS PubMed PubMed Central Google Scholar

Puxty, RJ, Millard, AD, Evans, DJ & Scanlan, DJ Un nouvel éclairage sur la photosynthèse virale. Photosynth Res. 126, 71-97 (2015).

Article CAS PubMed Google Scholar

Crummett, LT, Puxty, RJ, Weihe, C., Marston, MF & Martiny, JBH Le contenu génomique et le contexte des gènes métaboliques auxiliaires dans les cyanomyovirus marins. Virologie 499, 219-229 (2016).

Article CAS PubMed Google Scholar

Lindell, D., Jaffe, JD, Johnson, ZI, Church, GM et Chisholm, SW Les gènes de la photosynthèse dans les virus marins produisent des protéines lors de l'infection de l'hôte. Nature 438, 86–89 (2005).

Article ADS CAS PubMed Google Scholar

Clokie, MRJ et al. Transcription d'un phage « photosynthétique » de type T4 lors de l'infection d'une cyanobactérie marine. Environ. Microbiol. 8, 827–835 (2006).

Article CAS PubMed Google Scholar

Zabelskii, D. et al. Les rhodopsines virales 1 sont une famille unique de canaux cationiques photosensibles. Nat. Comm. 11, 5707 (2020).

Article ADS CAS Google Scholar

Jin, M. et al. Diversités et impacts biogéochimiques potentiels des virus des sols de mangrove. Microbiome 7, 58 (2019).

Article PubMed PubMed Central Google Scholar

El Knidri, H., Belaabed, R., Addaou, A., Laajeb, A. & Lahsini, A. Extraction, modification chimique et caractérisation de la chitine et du chitosan. Int J. Biol. Macromol. 120, 1181-1189 (2018).

Article CAS PubMed Google Scholar

Capovilla, G. et al. Utilisation de la chitine par les picocyanobactéries marines et évolution d'un mode de vie planctonique. Préimpression sur https://www.biorxiv.org/content/10.1101/2022.06.23.497379v2 (2022).

Jeanniard, A. et al. Vers la définition des chlorovirus : un voyage génomique à travers un genre de grands virus à ADN. Génomique BMC. 14, 158 (2013).

Article CAS PubMed PubMed Central Google Scholar

Sanjuan, R. & Domingo-Calap P. Diversité génétique et évolution des populations virales. Encyclopédie Virol. 1, 53–61 (2021).

Heggset, EB et al. Mode d'action d'une chitosanase de la famille 75 de Streptomyces avermitilis. Biomacromol 13, 1733–1741 (2012).

Article CAS Google Scholar

Shimosaka, M., Sato, K., Nishiwaki, N., Miyazawa, T. & Okazaki, M. Analyse des résidus d'acides aminés carboxyliques essentiels pour l'activité catalytique des chitosanases fongiques par mutagenèse dirigée. J. Biosci. Bioeng. 100, 545–550 (2005).

Article CAS PubMed Google Scholar

Jumper, J. et al. Prédiction très précise de la structure des protéines avec AlphaFold. Nature 596, 583–589 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Cheng, C.-Y., Chang, C.-H., Wu, Y.-J. & Li, Y.-K. Exploration de la famille 75 des glycosyl hydrolases, une chitosanase d'Aspergillus fumigatus. J. Biol. Chim. 281, 3137–3144 (2005).

Article PubMed CAS Google Scholar

Adams, PD et al. PHENIX : Un système complet basé sur Python pour la solution de structure macromoléculaire. Acta Crystallogr. D66, 213–221 (2010).

Google Scholar

Emsley, P., Lohkamp, ​​B., Scott, WG & Cowtan, K. Caractéristiques et développement de Foulque. Acta Crystallogr. D66, 486-501 (2010).

Google Scholar

Afonine, PV et al. Vers un raffinement de structure cristallographique automatisé avec phenix.refine. Acta Crystallogr. D68, 352–367 (2012).

Google Scholar

Holm, L. Utilisation de Dali pour la comparaison de la structure des protéines. Méthodes Mol. Biol. 2112, 29–42 (2020).

Article CAS PubMed Google Scholar

Hamiaux, C. et al. Structure cristalline de la kiwelline, une protéine majeure de la paroi cellulaire du kiwi. J. Structure. Biol. 187, 276-281 (2014).

Article CAS PubMed Google Scholar

Offermann, LR et al. Caractéristiques structurelles, fonctionnelles et immunologiques insaisissables de l'acte d 5, la kiwelline verte du kiwi. J. Agric Food Chem. 63, 6567–6576 (2015).

Article CAS PubMed Google Scholar

Ludvigsen, S. & Poulsen, FM Structure tridimensionnelle en solution de barwin, une protéine de graine d'orge. Biochimie 31, 8783–8789 (1992).

Article CAS PubMed Google Scholar

Huet, J. et al. Structure haute résolution d'une protéine de type barwin de défense des plantes de papaye résolue par une phase de soufre-SAD interne. Acta Crystallogr. D69, 2017-2026 (2013).

Google Scholar

de Oliveira, AL et al. La structure de l'éliciteur cérato-platanine (CP), le premier membre de la famille des protéines fongiques CP, révèle un double pli psi en tonneau bêta et une liaison glucidique. J. Biol. Chim. 286, 17560–17568 (2011).

Article PubMed PubMed Central CAS Google Scholar

Juettner, NE et al. Structure éclairante et sites donneurs d'acyle d'un substrat physiologique de transglutaminase de Streptomyces mobaraensis. Protéine Sci. 27, 910–922 (2018).

Article CAS PubMed PubMed Central Google Scholar

Georgelis, N., Yennawar, NH & Cosgrove, DJ Base structurelle de la liaison de la cellulose basée sur l'entropie par un module de liaison à la cellulose de type A (CBM) et une expansine bactérienne. Proc. Natl Acad. Sci. 109, 14830–14835 (2012).

Article ADS CAS PubMed PubMed Central Google Scholar

Yennawar, NH, Li, LC, Dudzinski, DM, Tabuchi, A. & Cosgrove, DJ Structure cristalline et activités de EXPB1 (Zea m 1), une β-expansine et un allergène de pollen de groupe 1 du maïs. Proc. Natl Acad. Sci. 103, 14664–14671 (2006).

Article ADS CAS PubMed PubMed Central Google Scholar

Arumughan, A. et al. La cartographie quantitative des interactions révèle un domaine UBX étendu dans l'ASPL qui perturbe les hexamères p97 fonctionnels. Nat. Commun. 7, 13047–13047 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Davies, GJ et al. Détermination de la structure et raffinement de l'endoglucanase V d'Humicola insolens à une résolution de 1,5 A. Acta Crystallogr. D52, 7–17 (1996).

CAS Google Scholar

Davies, GJ et al. Structure et fonction de l'endoglucanase V. Nature 365, 362–364 (1996).

Annonces d'article Google Scholar

Song, JM et al. Caractérisation génétique et structurale d'une endo-β−1,4-glucanase thermotolérante, active au froid et acide du collembole antarctique, Cryptopygus antarcticus. J. Agric Food Chem. 65, 1630-1640 (2017).

Article CAS PubMed Google Scholar

Marcotte, EM, Monzingo, AF, Ernst, SR, Brzezinski, R. & Robertas, JD Structure aux rayons X d'une chitosanase antifongique de Streptomyces N174. Nat. Structure. Biol. 3, 155–162 (1996).

Article CAS PubMed Google Scholar

Castillo, RM et al. Un barillet bêta double psi à six brins est partagé par plusieurs superfamilles de protéines. Structure 7, 227-236 (1999).

Article CAS PubMed Google Scholar

Heinig, M. & Frishman, D. STRIDE : un serveur Web pour l'attribution de structures secondaires à partir de coordonnées atomiques connues de protéines. Nucl. Acides Rés. 32, W500–W502 (2004).

Article CAS PubMed PubMed Central Google Scholar

Flocco, MM & Mowbray, SL Étranges compagnons de lit : interactions entre les chaînes latérales acides dans les protéines. J. Mol. Biol. 254, 96-105 (1995).

Article CAS PubMed Google Scholar

Davies, GJ, Wilson, KS & Henrissat, B. Nomenclature des sous-sites de liaison au sucre dans les glycosyl hydrolases. Biochimie. J. 321, 557–559 (1997).

Article CAS PubMed PubMed Central Google Scholar

Schou, C., Rasmussen, G., Kaltoft, M. & Henrissat, B. Schülein M. Stéréochimie, spécificité et cinétique de l'hydrolyse de cellodextrines réduites par neuf cellulases. EUR. J. Biochem. 217, 947–953 (1993).

Article CAS PubMed Google Scholar

Pollierer, MM, Dyckmans, J., Scheu, S. & Haubert, D. Flux de carbone à travers les champignons et les bactéries dans le réseau trophique animal du sol forestier, comme indiqué par l'analyse des acides gras 13C spécifiques au composé. Fonct. Écol. 26, 978–990 (2012).

Article Google Scholar

Wang, M. et al. Analyse génomique du phage S-B43 de Synechococcus et son adaptation au milieu côtier. Virus Rés. 289, 198155 (2020).

Article CAS PubMed Google Scholar

Roux, S. et al. IMG/VR v3 : Un cadre écologique et évolutif intégré pour interroger les génomes de virus non cultivés. Nucl. Acides Rés. 49, D764–D775 (2021).

Article CAS PubMed Google Scholar

Paez-Espino, D., Pavlopoulos, GA, Ivanova, NN & Kyrpides, NC Pipeline de découverte de séquences virales non ciblées et regroupement de virus pour les données métagénomiques. Nat. Protocole 12, 1673-1682 (2017).

Article CAS PubMed Google Scholar

Huerta-Cepas, J. et al. EggNOG 4.5 : Un cadre d'orthologie hiérarchique avec des annotations fonctionnelles améliorées pour les séquences eucaryotes, procaryotes et virales. Nucl. Acides Rés. 44, D286–D293 (2016).

Article CAS PubMed Google Scholar

Cantarel, BL et al. La base de données Carbohydrate-Active EnZymes (CAZy): Une ressource experte pour la glycogénomique. Nucl. Acides Rés. 37, D233–D238 (2009).

Article CAS PubMed Google Scholar

Prestat, E. et al. FOAM (Functional Ontology Assignments for Metagenomes) : une base de données de modèle de Markov caché (HMM) axée sur l'environnement. Nucl. Acides Rés. 42, e145 (2014).

Article PubMed PubMed Central CAS Google Scholar

Eddy, SR Recherches accélérées de profils HMM. PLoS Comput Biol. 7, 1002195 (2011).

Article ADS MathSciNet CAS Google Scholar

Johnson, M. et al. NCBI BLAST : Une meilleure interface Web. Nucl. Acides Rés. 36, W5–W9 (2008).

Article CAS PubMed PubMed Central Google Scholar

Hyatt, D. et al. Prodigue : Reconnaissance des gènes procaryotes et identification du site d'initiation de la traduction. BMC Bioinform. 11, 119 (2010).

Article CAS Google Scholar

Wu, R. et al. L'humidité module les réservoirs du sol de virus actifs à ADN et à ARN. Commun. Biol. 4 992 (2021).

Article CAS PubMed PubMed Central Google Scholar

Nayfach, S. et al. CheckV évalue la qualité et l'exhaustivité des génomes viraux assemblés par métagénome. Nat. Biotechnol. 39, 578–585 (2021).

Article CAS PubMed Google Scholar

Bolduc, B. et al. vConTACT : un outil iVirus pour classer les virus à ADN double brin qui infectent les archées et les bactéries. Peer J. 5, e3243 (2017).

Article PubMed PubMed Central Google Scholar

Galiez, C., Siebert, M., Enault, F., Vincent, J. & Söding, J. WIsH : qui est l'hôte ? Prédire les hôtes procaryotes à partir des contigs de phages métagénomiques. Bioinformatique 33, 3113–3114 (2017).

Article CAS PubMed PubMed Central Google Scholar

Ahlgren, NA, Ren, J., Lu, YY, Fuhrman, JA et Sun, F. La mesure de la dissemblance de la fréquence des oligonucléotides d2 * sans alignement améliore la prédiction des hôtes à partir de séquences virales dérivées de la métagénomique. Nucl. Acides Rés. 45, 39-53 (2017).

Article CAS PubMed Google Scholar

Lu, C. et al. Prédicteur de l'hôte du virus procaryote : un modèle gaussien pour la prédiction de l'hôte des virus procaryotes en métagénomique. BMC Biol. 19, 5 (2021).

Article CAS PubMed PubMed Central Google Scholar

Fu, L., Niu, B., Zhu, Z., Wu, S. & Li, W. CD-HIT : accéléré pour regrouper les données de séquençage de nouvelle génération. Bioinformatique 28, 3150–3152 (2012).

Article CAS PubMed PubMed Central Google Scholar

Katoh, K. & Standley, DM Logiciel d'alignement de séquences multiples MAFFT version 7 : Améliorations des performances et de la convivialité. Mol. Biol. Évol. 30, 772–780 (2013).

Article CAS PubMed PubMed Central Google Scholar

Kozlov, AM, Darriba, D., Flouri, T., Morel, B. & Stamatakis, A. RAxML-NG : un outil rapide, évolutif et convivial pour l'inférence phylogénétique à probabilité maximale. Bioinformatique 35, 4453–4455 (2019).

Article CAS PubMed PubMed Central Google Scholar

Studier, FW Production de protéines par auto-induction dans des cultures agitées à haute densité. Prot. expr. Purif. 41, 207-234 (2005).

Article CAS Google Scholar

Buchko, GW, Clifton, MC, Wallace, EG, Atkins, KA & Myler, PJ Affectations de déplacement chimique du squelette et analyse de la structure secondaire de la protéine U1 du virus du Bas-Congo. Biomol. Affectation RMN. 11, 51–56 (2017).

Article CAS PubMed Google Scholar

Wrenbeck, EE et al. Mutagenèse à saturation en un seul pot à base de plasmide. Nat. Méthodes. 13, 928–930 (2016).

Article CAS PubMed PubMed Central Google Scholar

Schönbichler, A., Díaz-Moreno, SM, Srivastava, V. & McKee, LS Exploration du potentiel d'antagonisme fongique et d'attaque de la paroi cellulaire par Bacillus subtilis natto. Microbiol avant. 11, 521 (2020).

Article PubMed PubMed Central Google Scholar

Kabsch, W. XDS. Acta Crystallogr. D66, 125-132 (2010).

Google Scholar

Evans, PR & Murshudov, GN Quelle est la qualité de mes données et quelle est la résolution ? Acta Crystallogr. D69, 1204-1214 (2013).

Google Scholar

Vagin, A. & Teplyakov, A. MOLREP : Un programme automatisé pour le remplacement moléculaire. J. Appl Crist. 30, 1022-1025 (1997).

Article CAS Google Scholar

Winn, MD et al. Présentation de la suite CCP4 et des évolutions en cours. Cristal d'Acta. D67, 235-242 (2011).

Google Scholar

Weiss, MS Indicateurs locaux de la qualité des données radiographiques. J. Appl. Cristallologue. 34, 130-135 (2001).

Article CAS Google Scholar

Karplus, PA & Diederichs, K. Lier le modèle cristallographique et la qualité des données. Sciences 336, 1030-1033 (2012).

Article ADS CAS PubMed PubMed Central Google Scholar

Evans, PR Mise à l'échelle et évaluation de la qualité des données. Acta Crystallogr. D62, 72–82 (2006).

CAS Google Scholar

Chen, VB et al. MolProbity : validation de la structure de tous les atomes pour la cristallographie macromoléculaire. Acta Crystallogr. D66, 12–21 (2010).

Google Scholar

Télécharger les références

Ce travail a été soutenu par le Bureau de la recherche biologique et environnementale (BER) du Département de l'énergie (DOE) et est une contribution du domaine d'intérêt scientifique "Réponse phénotypique du microbiome du sol aux perturbations environnementales" à JKJ et KSH. Une partie de ce travail a été réalisée dans le cadre d'un projet attribué (https://doi.org/10.46936/cpcy.proj.2021.60161/60000437) dans le cadre du programme FICUS au JEM et a utilisé les ressources du DOE Joint Genome Institute (JGI) et du Laboratoire des sciences moléculaires de l'environnement (EMSL), qui sont les installations des utilisateurs du Bureau des sciences du DOE. Les deux installations sont parrainées par le programme de recherche biologique et environnementale et exploitées sous les contrats n° DE-AC02-05CH11231 (JGI) et DE-AC05-76RL01830 (EMSL). Les structures cristallines ont été déterminées à la Stanford Synchrotron Radiation Lightsource (SSRL). SSRL est une installation utilisateur nationale exploitée par l'Université de Stanford pour le compte du Département américain de l'énergie, Bureau des sciences énergétiques de base sous le contrat n° DE-AC02-76SF00515. Le programme de biologie moléculaire structurale SSRL est soutenu par le Département de l'énergie, le Bureau de la recherche biologique et environnementale et les Instituts nationaux de la santé (NIGMS) par le numéro de subvention P30GM133894. Les résultats préliminaires de la fonction enzymatique ont été fournis par Gregor Tegl et Stephen Withers de l'Université de la Colombie-Britannique.

Ces auteurs ont contribué à parts égales : Ruonan Wu, Clyde A. Smith.

Direction des sciences terrestres et biologiques, Pacific Northwest National Laboratory, Richland, WA, États-Unis

Ruonan Wu, Garry W. Buchko, Jason E. McDermott, Kirsten S. Hofmockel, John R. Cort et Janet K. Jansson

Source lumineuse de rayonnement synchrotron de Stanford, Université de Stanford, Menlo Park, Californie, États-Unis

Clyde A.Smith

École des biosciences moléculaires, Université de l'État de Washington, Pullman, WA, États-Unis

Garry W.Buchko

US Department of Energy Joint Genome Institute, Lawrence Berkeley National Laboratory, Berkeley, Californie, États-Unis

Ian K. Blaby, Nikos C. Kyrpides et Yasuo Yoshikuni

Mammoth Biosciences, Brisbane, Californie, États-Unis

David Paez Espino

Département de microbiologie moléculaire et d'immunologie, Oregon Health & Science University, Portland, OR, États-Unis

Jason E. McDermott

Institut de chimie biologique, Université de l'État de Washington, Pullman, WA, États-Unis

John R. Cort

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

RW a effectué la majorité des analyses bioinformatiques. CAS a déterminé les structures cristallines des enzymes chitosanase et élucidé leurs mécanismes. GWB a exprimé les protéines chitosanase, examiné les conditions de cristallisation et effectué des tests d'activité. IKB et YY ont réalisé la synthèse et le clonage des gènes et des mutants de la chitosanase. NCK a fourni la récupération de la base de données et les DOI des séquences de chitosanase accessibles au public. DP-E., JRC et CAS ont réalisé les prédictions AlphaFold de la structure des protéines. KSH, JKJ, JEM et CAS ont financé la recherche. JKJ a coordonné l'étude. Tous les auteurs ont contribué à la rédaction du manuscrit.

Correspondance avec Janet K. Jansson.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature Communications remercie Rey-Ting Guo et Ella Sieradzki pour leur contribution à l'examen par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International License, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, tant que vous donnez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Wu, R., Smith, CA, Buchko, GW et al. Caractérisation structurale d'un produit de gène métabolique auxiliaire viral du sol - une chitosanase fonctionnelle. Nat Commun 13, 5485 (2022). https://doi.org/10.1038/s41467-022-32993-8

Télécharger la citation

Reçu : 30 mars 2022

Accepté : 26 août 2022

Publié: 19 septembre 2022

DOI : https://doi.org/10.1038/s41467-022-32993-8

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

Nature Reviews Microbiologie (2023)

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.