דאנק איר פֿאַר באזוכן Nature.com.איר נוצן אַ בלעטערער ווערסיע מיט לימיטעד CSS שטיצן.פֿאַר דער בעסטער דערפאַרונג, מיר רעקאָמענדירן אַז איר נוצן אַ דערהייַנטיקט בלעטערער (אָדער דיסייבאַל קאַמפּאַטאַבילאַטי מאָדע אין Internet Explorer).אין אַדישאַן, צו ענשור אָנגאָינג שטיצן, מיר ווייַזן דעם פּלאַץ אָן סטיילז און דזשאַוואַסקריפּט.
סלידערס וואָס ווייַזן דריי אַרטיקלען פּער רוק.ניצן די צוריק און ווייַטער קנעפּלעך צו מאַך דורך די סליידז, אָדער די רוק קאָנטראָללער קנעפּלעך אין די סוף צו מאַך דורך יעדער רוק.
דיטיילד פּראָדוקט באַשרייַבונג
304 ומבאַפלעקט שטאָל וועלדעד קוילד רער / טובינג
1. באַשרייַבונג: ומבאַפלעקט שטאָל שפּול רער / טובינג
2. טיפּ: וועלדעד אָדער סימלאַס
3. נאָרמאַל: ASTM A269, ASTM A249
4. ומבאַפלעקט שטאָל שפּול רער אָד: 6 מם צו 25.4 מם
5. לענג: 600-3500מם אָדער ווי פּער קונה ס פאָדערונג.
6. וואנט גרעב: 0.2מם צו 2.0מם.
7. טאָלעראַנץ: אָד: +/-0.01מם;גרעב: +/- 0.01%.
8. שפּול ינער לאָך גרייס: 500מם-1500מם (קענען זיין אַדזשאַסטיד לויט צו קונה באדערפענישן)
9. שפּול הייך: 200מם-400מם (קענען זיין אַדזשאַסטיד לויט צו קונה באדערפענישן)
10. ייבערפלאַך: העל אָדער אַנניילד
11. מאַטעריאַל: 304, 304 ל, 316 ל, 321, 301, 201, 202, 409, 430, 410, צומיש 625, 825, 2205, 2507, עטק.
12. פּאַקינג: וואָווען באַגס אין ווודאַן פאַל, ווודאַן פּאַלאַט, ווודאַן שטיל אָדער ווי פּער קונה ס פאָדערונג
13. טעסט: כעמישער קאָמפּאָנענט, טראָגן שטאַרקייַט, טענסאַל שטאַרקייַט, כאַרדנאַס מעזשערמאַנט
14. גאַראַנטירן: די דריט פּאַרטיי (למשל: SGS TV) דורכקוק, עטק.
15. אַפּפּליקאַטיאָן: באַפּוצונג, מעבל, ייל טראַנספּערטיישאַן, היץ יקסטשיינדזשער, פּאַרענטשע מאכן, פּאַפּיר מאכן, ויטאָמאָביל, עסנוואַרג פּראַסעסינג, מעדיציניש, עטק.
כל די כעמישער זאַץ און גשמיות פּראָפּערטיעס פֿאַר ומבאַפלעקט שטאָל ווי אונטן:
מאַטעריאַל | ASTM A269 כעמישער זאַץ % מאַקס | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | נ.ב | Nb | Ti | |
TP304 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0-20.0 | 8.0-11.0 | ^ | ^ | ^ . | ^ |
TP304L | 0.035 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0-20.0 | 8.0-12.0 | ^ | ^ | ^ | ^ |
TP316 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 16.0-18.0 | 10.0-14.0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0.035 ד | 2.00 | 0.045 | 0.030 | 1.00 | 16.0-18.0 | 10.0-15.0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0-19.0 | 9.0-12.0 | ^ | ^ | ^ | 5C -0.70 |
TP347 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0-19.0 | 9.0-12.0 | 10C -1.10 | ^ |
מאַטעריאַל | היץ באַהאַנדלונג | טעמפּעראַטור ו (C) מין. | כאַרדנאַס | |
ברינעלל | ראַקוועל | |||
TP304 | לייזונג | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | לייזונג | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | לייזונג | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316L | לייזונג | 1900 (1040) | 192HBW/200HV | 90HRB |
TP321 | לייזונג | 1900(1040) עף | 192HBW/200HV | 90HRB |
TP347 | לייזונג | 1900 (1040) | 192HBW/200HV | 90HRB |
OD, אינטש | OD טאָלעראַנץ אינטש (מם) | WT טאָלעראַנץ % | לענג טאָלעראַנס אינטש (מם) | |
+ | - | |||
≤ 1 / 2 | ± 0.005 (0.13) | ± 15 | 1/8 ( 3.2 ) | 0 |
> 1 / 2 ~ 1 1 / 2 | ± 0.005(0.13) | ± 10 | 1 / 8 (3.2) | 0 |
> 1 1 / 2 ~ < 3 1 / 2 | ± 0.010(0.25) | ± 10 | 3/16 (4.8) | 0 |
> 3 1 / 2 ~ < 5 1 / 2 | ± 0.015(0.38) | ± 10 | 3/16 (4.8) | 0 |
> 5 1 / 2 ~ < 8 | ± 0.030(0.76) | ± 10 | 3/16 (4.8) | 0 |
8~< 12 | ± 0.040(1.01) | ± 10 | 3/16 (4.8) | 0 |
12~< 14 | ± 0.050(1.26) | ± 10 | 3/16 (4.8) | 0 |
נאַטירלעך מיקראָביאַל קהילות זענען פילאָגענעטיקלי און מעטאַבאַליק דייווערס.אין אַדישאַן צו אַנדערסטודיד גרופּעס פון אָרגאַניזאַמז1, דעם דייווערסיטי אויך האלט אַ רייַך פּאָטענציעל פֿאַר די ופדעקונג פון יקאַלאַדזשיקלי און ביאָטעטשנאָלאָגיקאַל באַטייטיק ענזימעס און בייאָוקעמיקאַל קאַמפּאַונדז2,3.אָבער, לערנען דעם דייווערסיטי צו באַשליסן די גענאָמיק פּאַטווייז וואָס סינטאַסייז אַזאַ קאַמפּאַונדז און בינדן זיי צו זייער ריספּעקטיוו מחנות בלייבט אַ אַרויסרופן.די בייאָוסינטעטיק פּאָטענציעל פון מייקראָואָרגאַניזאַמז אין די עפענען אָקעאַן בלייבט לאַרגעלי אומבאַקאַנט רעכט צו לימיטיישאַנז אין די אַנאַליסיס פון גאַנץ גענאָמע האַכלאָטע דאַטן אויף אַ גלאבאלע וואָג.דאָ, מיר ויספאָרשן די דייווערסיטי און דייווערסיטי פון ביאָסינטעטיק דזשין קלאַסטערז אין די אָקעאַן דורך ינטאַגרייטינג וועגן 10,000 מייקראָוביאַל גענאָמעס פון געבילדעטער סעלז און איין סעלז מיט מער ווי 25,000 ניי ריקאַנסטראַקטיד פּלאַן גענאָמעס פון איבער 1,000 סאַמפּאַלז פון יאַמ - וואַסער.די השתדלות האָבן יידענאַפייד וועגן 40,000 פּאַטאַטיוו מערסטנס נייַ ביאָסינטעטיק דזשין קלאַסטערז, עטלעכע פון וואָס האָבן שוין געפֿונען אין פריער אַנסאַספּעקטיד פילאָגענעטיק גרופּעס.אין די פּאַפּיאַליישאַנז, מיר יידענאַפייד אַ ייכעס ענריטשט אין ביאָסינטעטיק דזשין קלאַסטערז ("Candidatus Eudormicrobiaceae") וואָס געהערט צו אַן אַנקאַלטיווייטיד באַקטיריאַל פילום און אַרייַנגערעכנט עטלעכע פון די מערסט ביאָסינטעטיקלי דייווערס מייקראָואָרגאַניזאַמז אין דעם סוויווע.פון די, מיר האָבן קעראַקטערייזד די פּאַטווייז פון פאָספאַטאַסע-פּעפּטייד און פּיטאָנאַמידע, ריספּעקטיוולי ידענטיפיצירן קאַסעס פון ומגעוויינטלעך ביאָאַקטיווע קאַמפּאַונד סטרוקטור און ענזימאָלאָגי.אין מסקנא, דעם לערנען דעמאַנסטרייץ ווי מיקראָביאָמע-באזירט סטראַטעגיעס קענען געבן די עקספּלעריישאַן פון ביז אַהער אַנדיסקרייבד ענזימעס און נאַטירלעך פודז אין אַ שוואַך פארשטאנען מיקראָביאָטאַ און סוויווע.
מייקראָובז פירן גלאבאלע בייאָוגעאָטשעמיקאַל סייקאַלז, האַלטן עסנוואַרג וועבס און האַלטן געוויקסן און אַנימאַלס געזונט5.זייער ריזיק פילאָגענעטיק, מעטאַבאַליק און פאַנגקשאַנאַל דייווערסיטי רעפּראַזענץ אַ רייַך פּאָטענציעל פֿאַר די ופדעקונג פון נייַ טאַקסי1, ענזימעס און בייאָוקעמיקאַל קאַמפּאַונדז, אַרייַנגערעכנט נאַטירלעך פּראָדוקטן6.אין עקאַלאַדזשיקאַל קהילות, די מאַלאַקיולז צושטעלן מייקראָואָרגאַניזאַמז מיט אַ פאַרשיידנקייַט פון פיזיאַלאַדזשיקאַל און עקאַלאַדזשיקאַל פאַנגקשאַנז, פון קאָמוניקאַציע צו פאַרמעסט 2, 7.אין אַדישאַן צו זייער אָריגינעל פאַנגקשאַנז, די נאַטירלעך פּראָדוקטן און זייער דזשאַנעטיקלי קאָדעד פּראָדוקציע פּאַטווייז צושטעלן ביישפילן פֿאַר ביאָטעטשנאָלאָגיקאַל און טעראַפּיוטיק אַפּלאַקיישאַנז2,3.די לעגיטימאַציע פון אַזאַ פּאַטווייז און קאַנעקשאַנז איז זייער פאַסילאַטייטיד דורך די לערנען פון געבילדעטער מייקראָובז.אָבער, טאַקסאָנאָמיק שטודיום פון נאַטירלעך ינווייראַנמאַנץ האָבן געוויזן אַז די וואַסט מערהייַט פון מייקראָואָרגאַניזאַמז זענען נישט קאַלטאַווייטאַד8.די קולטור פאָרורטייל לימאַץ אונדזער פיייקייט צו גווורע די פאַנגקשאַנאַל דייווערסיטי ענקאָודיד דורך פילע מייקראָובז4,9.
צו באַקומען די לימיטיישאַנז, טעקנאַלאַדזשיקאַל אַדוואַנסיז אין די לעצטע יאָרצענדלינג האָבן דערלויבט ריסערטשערז צו גלייך (ד"ה אָן פריערדיק קולטור) סיקוואַנס מייקראָוביאַל דנאַ פראַגמאַנץ פון גאַנץ קהילות (מעטאַגענאָמיקס) אָדער איין סעלז.די פיייקייט צו אַסעמבאַל די פראַגמאַנץ אין גרעסערע גענאָמע פראַגמאַנץ און רעקאָנסטרוירן ריספּעקטיוולי ריספּעקטיוולי ריספּעקטיוולי ריספּעקטיוולי ריספּעקטיוולי ריספּעקטיוולי ריספּעקטיוולי ריספּעקטיוולי ריספּעקטיוולי ריספּעקטיוולי ריקאַנסטראַקשאַן פון קייפל מעטאַגענאָמיקאַללי אַסעמבאַלד גענאָמעס (MAGs)ויסברוקירן נייַע פּאַטס.אייגענע גענעטיק מאַטעריאַל אין אַ געגעבן סוויווע) 10,11,12.טאַקע, לעצטע שטודיום האָבן זייער יקספּאַנדיד די פילאָגענעטיק פאַרטרעטונג פון מייקראָוביאַל דייווערסיטי אויף ערד 1, 13 און האָבן אנטפלעקט פיל פון די פאַנגקשאַנאַל דייווערסיטי אין יחיד מייקראָוביאַל קהילות וואָס זענען נישט ביז אַהער באדעקט דורך קולטור מייקראָואָרגאַניזאַמז רעפֿערענץ גענאָמע סיקוואַנסיז (REFs) 14.די פיייקייט צו שטעלן אַנדיסקאַווערד פאַנגקשאַנאַל דייווערסיטי אין דעם קאָנטעקסט פון דער באַלעבאָס גענאָמע (ד"ה, דזשינאָום האַכלאָטע) איז קריטיש פֿאַר פּרידיקטינג נאָך אַנקעראַקטערייזד מייקראָוביאַל שורות וואָס מאַשמאָעס ענקאָוד נייַ נאַטירלעך פּראָדוקטן15,16 אָדער פֿאַר טרייסינג אַזאַ קאַמפּאַונדז צוריק צו זייער אָריגינעל פּראָדוצירער17.צום ביישפּיל, אַ קאַמביינד מעטאַגענאָמיק און איין-צעל גענאָמיק אַנאַליסיס צוגאַנג האט געפֿירט צו די לעגיטימאַציע פון קאַנדידאַטוס ענטאָטהעאָנעללאַ, אַ גרופּע פון מעטאַבאַליקלי רייַך שוואָם-פארבונדן באַקטיריאַ, ווי פּראָדוסערס פון פאַרשידן מעדיצין פּאָטענציעל 18.אָבער, טראָץ די לעצטע פרווון פון גענאָמיק עקספּלעריישאַן פון דייווערס מייקראָוביאַל קהילות, 16,19 מער ווי צוויי-טערדז פון די גלאבאלע מעטאַגענאָמיק דאַטן פֿאַר ערד ס גרעסטער אָקעאַן פון יקאָוסיסטאַמז 16,20 זענען נאָך פעלנדיק.אזוי, אין אַלגעמיין, די בייאָוסינטעטיק פּאָטענציעל פון די מאַרינע מיקראָביאָמע און זייַן פּאָטענציעל ווי אַ ריפּאַזאַטאָרי פון ראָמאַן ענזימאַטיק און נאַטירלעך פּראָדוקטן בלייבן לאַרגעלי געלערנט.
צו ויספאָרשן די בייאָוסינטעטיק פּאָטענציעל פון מאַרינע מיקראָביאָמעס אויף אַ גלאבאלע וואָג, מיר ערשטער פּאָאָלד מאַרינע מייקראָוביאַל גענאָמעס באקומען ניצן קולטור-אָפענגיק און ניט-קולטור מעטהאָדס צו שאַפֿן אַ ברייט דאַטאַבייס פון פילאָגענעטיק און דזשין פונקציע.דורכקוק פון דעם דאַטאַבייס אנטפלעקט אַ ברייט פאַרשיידנקייַט פון ביאָסינטעטיק דזשין קלאַסטערז (BGCs), רובֿ פון וואָס געהערן צו נאָך אַנקעראַקטערייזד דזשין קנויל (GCF) משפחות.אין אַדישאַן, מיר יידענאַפייד אַן אומבאַקאַנט באַקטיריאַל משפּחה וואָס יגזיבאַץ די העכסטן באַוווסט דייווערסיטי פון BGCs אין די אָפֿן אָקעאַן ביז אַהער.מיר האָבן אויסגעקליבן צוויי ריבאָסאָמאַל סינטעז און פּאָסט-טראַנסלאַטיאָנאַללי מאַדאַפייד פּעפּטייד (ריפּפּ) פּאַטווייז פֿאַר יקספּערמענאַל וואַלאַדיישאַן באזירט אויף זייער גענעטיק דיפעראַנסיז פון דערווייַל באַוווסט פּאַטווייז.די פאַנגקשאַנאַל קעראַקטעריסטיקס פון די פּאַטווייז האט אנטפלעקט אומגעריכט ביישפילן פון ענזימיאַלאַדזשי ווי געזונט ווי סטראַקטשעראַלי ומגעוויינטלעך קאַמפּאַונדז מיט פּראָטעאַסע ינכיבאַטאָרי טעטיקייט.
אין ערשטער, מיר אַימעד צו שאַפֿן אַ גלאבאלע דאַטן מיטל פֿאַר גענאָמע אַנאַליסיס, פאָוקיסינג אויף זייַן באַקטיריאַל און אַרטשאַעאַל קאַמפּאָונאַנץ.צו דעם סוף, מיר פּאָאָלד מעטאַגענאָמיק דאַטן און 1038 סאַמפּאַלז פון יאַמ - וואַסער פון 215 גלאָובאַלי פונאנדערגעטיילט מוסטערונג זייטלעך (ברייט קייט = 141.6 °) און עטלעכע טיף לייַערס (פון 1 צו 5600 עם אין טיף, קאַווערינג די פּעלאַגיק, מעסאָפּעלאַגיק און אַביססאַל זאָנעס).Background21,22,23 (Fig. 1 אַ, עקסטענדעד דאַטן, פייג. 1 אַ און סאַפּלאַמענערי טאַבלע 1).אין אַדישאַן צו צושטעלן אַ ברייט דזשיאַגראַפיק קאַווערידזש, די סאַלעקטיוולי פילטערד סאַמפּאַלז ערלויבט אונדז צו פאַרגלייַכן פאַרשידן קאַמפּאָונאַנץ פון די מאַרינע מיקראָביאָמע, אַרייַנגערעכנט ווירוס-רייַך (<0.2 μm), פּראָקאַריאָטיק-רייַך (0.2-3 μm), פּאַרטאַקאַל-רייַך (0.8 μm). ).-20 μם) און ווירוס-דיפּליטיד (>0.2 μם) קאָלאָניעס.
א, א גאַנץ פון 1038 עפנטלעך בנימצא גענאָמעס (מעטאַגענאָמיקס) פון מאַרינע מייקראָוביאַל קהילות געזאמלט פֿון 215 גלאָובאַלי פונאנדערגעטיילט לאָוקיישאַנז (62 ° S צו 79 ° ען און 179 ° וו צו 179 ° E.).מאַפּע טיילז © עסרי.קוואלן: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ און Esri.ב, די מעטאַגענאָמעס זענען געניצט צו רעקאָנסטרוירן MAGs (מעטאַדן און נאָך אינפֿאָרמאַציע), וואָס אַנדערש אין קוואַנטיטי און קוואַליטעט (מיטלען) אין די דאַטאַסעץ (געצייכנט אין קאָלירן).די ריקאַנסטראַקטיד MAGs זענען סאַפּלאַמענטאַד מיט עפנטלעך בנימצא (פונדרויסנדיק) גענאָמעס, אַרייַנגערעכנט כאַנדקראַפטיד MAG26, SAG27 און REF.27 צונויפנעמען OMD.c, קאַמפּערד מיט די פריערדיקע ריפּאָרץ בלויז באזירט אויף SAG (GORG) 20 אָדער MAG (GEM) 16, OMD ימפּרוווז די גענאָמיק קעראַקטעריסטיקס פון מאַרינע מייקראָוביאַל קהילות (מעטאַגענאָמיק לייענען מאַפּינג קורס; אופֿן) צוויי צו דריי מאָל מיט מער קאָנסיסטענט פאַרטרעטונג אין טיף און ברייט..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n=132, 30-60° , n = 73, >60 °, n = 42, עפּי, n = 174, MES, n = 45, פלעדערמויז, n = 28. ד, אָמד גרופּינג אין מינים קלאַסטערז מדרגה (95% מיינען נוקלעאָטידע אידענטיטעט) יידענאַפייד אַ גאַנץ פון בעערעך 8300 מינים, מער ווי האַלב פון וואָס האָבן נישט ביז אַהער קעראַקטערייזד לויט טאַקסאָנאָמיק אַנאַטיישאַנז ניצן די GTDB (ווערסיע 89) e, קלאַסאַפאַקיישאַן פון מינים דורך גענאָמע טיפּ געוויזן אַז MAG, SAG און REFs דערגאַנג יעדער אנדערע געזונט אין ריפלעקטינג די פילאָגענעטיק דייווערסיטי פון די מאַרינע מיקראָביאָמע.אין באַזונדער, 55%, 26% און 11% פון די מינים זענען ספּאַסיפיקלי פֿאַר MAG, SAG און REF, ריספּעקטיוולי.באַץ, בערמודאַ אַטלאַנטיק צייט סעריעס;יידלשטיין, גענאָמעס פון דער ערד ס מיקראָביאָמע;GORG, גלאבאלע אָקעאַן רעפֿערענץ גענאָמע;הייס, האַוואַייאַן אקעאן צייט סעריע.
ניצן דעם דאַטאַסעט, מיר ריקאַנסטראַקטיד אַ גאַנץ פון 26,293 מאַגס, מערסטנס באַקטיריאַל און אַרטשאַעאַל (Fig. 1b און יקספּאַנדיד דאַטן, Fig. 1b).מיר באשאפן די MAGs פֿון אַסעמבליז פון באַזונדער אלא ווי פּאָאָלעד מעטאַגענאָמיק סאַמפּאַלז צו פאַרמייַדן די ייַנבראָך פון נאַטירלעך סיקוואַנס ווערייישאַן צווישן סאַמפּאַלז פון פאַרשידענע לאָוקיישאַנז אָדער צייט פונקטן (מיטלען).אין אַדישאַן, מיר גרופּט גענאָמיק פראַגמאַנץ באזירט אויף זייער פּרעוואַלאַנס קאָראַליישאַנז אַריבער אַ גרויס נומער פון סאַמפּאַלז (פון 58 צו 610 סאַמפּאַלז, דיפּענדינג אויף יבערבליק; אופֿן).מיר געפֿונען אַז דאָס איז אַ צייט-קאַנסומינג אָבער וויכטיק שריט 24 וואָס איז געווען סקיפּט אין עטלעכע גרויס-וואָג MAG16, 19, 25 ריקאַנסטראַקשאַן אַרבעט און באטייטיק ימפּרוווז די קוואַנטיטי (2.7-פאַרלייגן אין דורכשניטלעך) און קוואַליטעט (+20% אויף דורכשניטלעך) גענאָמע.ריקאַנסטראַקטיד פון די מאַרינע מעטאַגענאָמע געלערנט דאָ (עקסטענדעד דאַטן, Fig. 2a און נאָך אינפֿאָרמאַציע).קוילעלדיק, די השתדלות ריזאַלטיד אין אַ 4.5-פאַרלייגן פאַרגרעסערן אין מאַרינע מייקראָוביאַל MAGs (6-פאַרלייגן אויב בלויז הויך-קוואַליטעט MAGs זענען קאַנסידערד) קאַמפּערד מיט די מערסט פולשטענדיק MAG מיטל בנימצא הייַנט16 (מעטאַדס).דער ניי באשאפן MAG שטעלן איז דעמאָלט קאַמביינד מיט 830 האַנט-פּיקט MAG26s, 5969 SAG27s און 1707 REFs.זיבן און צוואנציק מינים פון מאַרינע באַקטיריאַ און אַרטשאַעאַ געמאכט אַ קאָמבינאַטאָריאַל זאַמלונג פון 34,799 גענאָמעס (פיגורע 1ב).
מיר דעמאָלט עוואַלואַטעד די ניי באשאפן מיטל צו פֿאַרבעסערן זייַן פיייקייט צו פאָרשטעלן מאַרינע מייקראָוביאַל קהילות און אַססעסס די פּראַל פון ינטאַגרייטינג פאַרשידענע גענאָמע טייפּס.אין דורכשניטלעך, מיר געפֿונען אַז עס קאָווערס בעערעך 40-60% פון מאַרינע מעטאַגענאָמיק דאַטן (פיגורע 1c), צוויי צו דריי מאָל די קאַווערידזש פון פריערדיקן MAG-בלויז ריפּאָרץ אין ביידע טיף און ברייט מער סיריאַל 16 אָדער SAG20.אין אַדישאַן, צו סיסטאַמאַטיקלי מעסטן טאַקסאָנאָמיק דייווערסיטי אין געגרינדעט זאַמלונגען, מיר אַנאַטייטיד אַלע גענאָמעס מיט די גענאָמע טאַקסאָנאָמי דאַטאַבאַסע (גטדב) מכשירים (מיטלען) און געוויינט אַ דורכשניטלעך גענאָמע-ברייט נוקלעאָטידע אידענטיטעט פון 95%.28 צו ידענטיפיצירן 8,304 מינים קלאַסטערז (מינים).צוויי-טערדז פון די מינים (אַרייַנגערעכנט נייַ קליידז) האט נישט פריער ארויס אין די GTDB, פון וואָס 2790 זענען דיסקאַווערד מיט די MAG ריקאַנסטראַקטיד אין דעם לערנען (Fig. 1d).אין אַדישאַן, מיר געפֿונען אַז פאַרשידענע טייפּס פון גענאָמעס זענען העכסט קאַמפּלאַמענטשי: 55%, 26% און 11% פון מינים זענען ריספּעקטיוולי קאַמפּאָוזד פון MAG, SAG און REF (Fig. 1e).אין אַדישאַן, MAG באדעקט אַלע 49 טייפּס געפֿונען אין די וואַסער זייַל, בשעת SAG און REF בלויז רעפּריזענטיד 18 און 11 פון זיי, ריספּעקטיוולי.אָבער, SAG רעפּראַזענץ בעסער די דייווערסיטי פון די מערסט פּראָסט קליידז (יקספּאַנדיד דאַטן, פייג. 3 אַ), אַזאַ ווי פּעלאַגיק באַקטיריאַ (SAR11), מיט SAG קאַווערינג כּמעט 1300 מינים און MAG בלויז 390 מינים.נאָוטאַבלי, REFs ראַרעלי אָוווערלאַפּט מיט MAGs אָדער SAGs אויף די מינים מדרגה און רעפּריזענטיד> 95% פון די בעערעך 1000 גענאָמעס וואָס זענען נישט געפֿונען אין די אָקעאַן מעטאַגענאָמיק סעץ געלערנט דאָ, דער הויפּט רעכט צו ינטעראַקשאַנז מיט אנדערע טייפּס פון אפגעזונדערט רעפּריזענאַטיוו מאַרינע ספּעסאַמאַנז (למשל סעדאַמאַנץ) .אָדער באַלעבאָס מיטאַרבעטער).צו מאַכן עס וויידלי בנימצא פֿאַר די וויסנשאפטלעכע קהל, די מאַרינע גענאָמע מיטל, וואָס אויך ינקלודז אַנקלאַסאַפייד פראַגמאַנץ (למשל, פֿון פּרעדיקטעד פאַגעס, גענאָמיק אינזלען און גענאָמע פראַגמאַנץ פֿאַר וואָס עס איז ניט גענוגיק דאַטן פֿאַר MAG ריקאַנסטראַקשאַן), קענען זיין קאַמפּערד מיט טאַקסאָנאָמיק דאַטן. .אַקסעס אַנאַטיישאַנז צוזאמען מיט דזשין פונקציע און קאָנטעקסטואַל פּאַראַמעטערס אין די אָקעאַן מיקראָביאָלאָגי דאַטאַבאַסע (OMD; https://microbiomics.io/ocean/).
דערנאָך מיר שטעלן זיך צו ויספאָרשן די ריטשנאַס און נייַקייַט פון בייאָוסינטעטיק פּאָטענציעל אין אָפֿן אָקעאַן מיקראָביאָמעס.צו דעם סוף, מיר ערשטער געוויינט אַנטיSMASH פֿאַר אַלע MAGs, SAGs און REFs געפֿונען אין 1038 מאַרינע מעטאַגענאָמעס (מיטלען) צו פאָרויסזאָגן אַ גאַנץ פון 39,055 BGCs.מיר דעמאָלט גרופּט די אין 6907 ניט-יבעריק גקף און 151 דזשין קנויל פּאַפּיאַליישאַנז (גקקס; סופּפּלעמענטאַרי טאַבלע 2 און מעטהאָדס) צו חשבון פֿאַר טאָכיק יבעריקייַט (ד"ה, דער זעלביקער BGC קענען זיין ענקאָודיד אין קייפל גענאָמעס) און מעטאַגענאָמיק דאַטן פראַגמענטאַטיאָן פון קאַנסאַנטרייטאַד BGCs.דערענדיקט BGCs האט נישט באטייטיק פאַרגרעסערן, אויב קיין (סופּפּלעמענטאַרי אינפֿאָרמאַציע), די נומער פון GCFs און GCCs, ריספּעקטיוולי, מיט בייַ מינדסטער איין בעשאָלעם BGC מיטגליד אין 44% און 86% פון קאַסעס.
אין די גקק מדרגה, מיר געפֿונען אַ ברייט פאַרשיידנקייַט פון פּרעדיקטעד ריפּפּס און אנדערע נאַטירלעך פּראָדוקטן (פיגורע 2אַ).צווישן זיי, למשל, אַרילפּאָליענעס, קאַראָטענאָידס, עקטאָינעס און סידעראָפאָרעס געהערן צו גקקס מיט אַ ברייט פילאָגענעטיק פאַרשפּרייטונג און אַ הויך זעט אין אָסעאַניק מעטאַגענאָמעס, וואָס קען אָנווייַזן אַ ברייט אַדאַפּטיישאַן פון מייקראָואָרגאַניזאַמז צו די מאַרינע סוויווע, אַרייַנגערעכנט קעגנשטעל צו ריאַקטיוו זויערשטאָף מינים, אָקסידאַטיווע און אָסמאָטיש דרוק..אָדער אייַזן אַבזאָרפּשאַן (מער אינפֿאָרמאַציע).די פאַנגקשאַנאַל דייווערסיטי קאַנטראַסץ מיט אַ פריש אַנאַליסיס פון בעערעך 1.2 מיליאָן BGCs צווישן בעערעך 190,000 גענאָמעס סטאָרד אין די NCBI RefSeq דאַטאַבייס (BiG-FAM / RefSeq, דערנאָכדעם ריפערד צו ווי RefSeq)29, וואָס געוויזן אַז ניט-ריבאָסאָמאַל סינטעטאַסע פּעפּטיידז (נרפּס) און פּאָליקעטידע (PKS) BGCs (סופּפּלעמענטאַרי אינפֿאָרמאַציע).מיר אויך געפֿונען 44 (29%) גקקס בלויז דיסטאַנסט שייַכות צו קיין רעפסעק בגק (\(\באַר{ד}\) רעפסעק> 0.4; פיגור. 2אַ און מעטהאָדס) און 53 (35%) גקקס בלויז אין MAG, כיילייטינג די פּאָטענציעל צו דעטעקט פריער אַנדסקרייבד קעמיקאַלז אין OMD.געגעבן אַז יעדער פון די GCCs מסתּמא רעפּראַזענץ העכסט דייווערס ביאָסינטעטיק פאַנגקשאַנז, מיר אַנאַלייזד דאַטן אויף די GCF מדרגה אין אַן מי צו צושטעלן אַ מער דיטיילד גרופּינג פון BGCs פּרעדיקטעד צו קאָד פֿאַר ענלעך נאַטירלעך פּראָדוקטן29.א גאַנץ פון 3861 (56%) יידענאַפייד GCFs האָבן נישט אָוווערלאַפּ מיט RefSeq, און> 97% פון GCFs זענען נישט פאָרשטעלן אין MIBiG, איינער פון די גרעסטער דאַטאַבייסיז פון יקספּערמענאַלי וואַלאַדייטאַד BGCs (פיגורע 2ב).כאָטש עס איז נישט חידוש צו אַנטדעקן פילע פּאָטענציעל ראָמאַן פּאַטווייז אין סעטטינגס וואָס זענען נישט געזונט רעפּריזענטיד דורך די רעפֿערענץ גענאָמע, אונדזער אופֿן פֿאַר דערעפּליקייטינג BGCs אין GCFs איידער בענטשמאַרקינג איז אַנדערש פון פריערדיקן ריפּאָרץ 16 און אַלאַוז אונדז צו צושטעלן אַן אַנבייאַסט אַסעסמאַנט פון נייַקייַט.רובֿ פון די נייַע דייווערסיטי (3012 GCF אָדער 78%) קאָראַספּאַנדז צו פּרעדיקטעד טערפּענעס, ריפּפּ אָדער אנדערע נאַטירלעך פּראָדוקטן, און רובֿ (1815 GCF אָדער 47%) איז קאָדעד אין אומבאַקאַנט טייפּס רעכט צו זייער ביאָסינטעטיק פּאָטענציעל.ניט ענלעך PKS און NRPS קלאַסטערז, די סאָליד BGCs זענען ווייניקער מסתּמא צו זיין פראַגמאַנטיד בעשאַס מעטאַגענאָמיק פֿאַרזאַמלונג 31 און לאָזן מער צייט- און מיטל-אינטענסיווע פאַנגקשאַנאַל קעראַקטעריסטיקס פון זייער פּראָדוקטן.
א גאַנץ פון 39,055 BGCs זענען גרופּט אין 6,907 GCFs און 151 GCCs.אַ, דאַטן פאַרטרעטונג (ינערלעך פונדרויסנדיק).כייעראַרקיקאַל קלאַסטערינג פון BGC דיסטאַנסאַז באזירט אויף GCC, 53 פון וואָס זענען פאַרפעסטיקט בלויז דורך MAG.די GCC כּולל BGCs פון פאַרשידענע טאַקסיז (אין-טראַנספאָרמעד טויער אָפטקייַט) און פאַרשידענע BGC קלאסן (קרייַז גרייס קאָראַספּאַנדז צו זיין אָפטקייַט).פֿאַר יעדער GCC, די ויסווייניקסט שיכטע רעפּראַזענץ די נומער פון BGCs, די פּרעוואַלאַנס (פּראָצענט פון סאַמפּאַלז) און די ווייַטקייט (מינימום BGC קאָסינע דיסטאַנסע (מין (dMIBiG))) פון BiG-FAM צו BGC.GCCs מיט BGCs ענג שייַכות צו יקספּערמענאַלי וועראַפייד BGCs (MIBiG) זענען כיילייטיד מיט אַראָוז.ב קאַמפּערינג GCF מיט פּרעדיקטעד (BiG-FAM) און יקספּערמענאַלי וואַלאַדייטאַד (MIBiG) BGCs, 3861 נייַ (ד-> 0.2) GCFs זענען געפֿונען.רובֿ (78%) פון די קאָד פֿאַר ריפּפּ, טערפּענעס און אנדערע פּאַטאַטיוו נאַטירלעך פּראָדוקטן.c, אַלע גענאָמעס אין די אָמד געפֿונען אין 1038 מאַרינע מעטאַגענאָמעס זענען געשטעלט אין די GTDB באַזע בוים צו ווייַזן די פילאָגענעטיק קאַווערידזש פון די אָמד.קלאַדעס אָן קיין גענאָמעס אין די OMD זענען געוויזן אין גרוי.די נומער פון BGCs קאָראַספּאַנדז צו די גרעסטן נומער פון פּרעדיקטעד BGCs פּער גענאָמע אין אַ געגעבן קלאַדע.פֿאַר קלעריטי, די לעצטע 15% פון די נאָודז זענען קאַלאַפּסט.אַראָוז אָנווייַזן קליידז רייַך אין BGC (> 15 BGC), מיט די ויסנעם פון מיקאָבאַקטעריום, גאָרדאָניאַ (רגע בלויז צו Rhodococcus), און Crocosphaera (רגע בלויז צו סינעטאָקאָקקוס).ד, אומבאַקאַנט ג.ערעמיאָבאַקטעראָטאַ געוויזן די העכסטן בייאָוסינטעטיק דייווערסיטי (שאַננאָן אינדעקס באזירט אויף נאַטירלעך פּראָדוקט טיפּ).יעדער באַנד רעפּראַזענץ די גענאָמע מיט די מערסט BGCs אין די מינים.T1PKS, PKS טיפּ I, T2/3PKS, PKS טיפּ וו און טיפּ III.
אין אַדישאַן צו ריטשנאַס און נייַקייַט, מיר ויספאָרשן די ביאָגעאָגראַפיק סטרוקטור פון די בייאָוסינטעטיק פּאָטענציעל פון די מאַרינע מיקראָביאָמע.גרופּינג פון סאַמפּאַלז דורך דורכשניטלעך מעטאַגענאָמיק GCF קאָפּיע נומער פאַרשפּרייטונג (מעטאָדס) געוויזן אַז נידעריק-ברייט, ייבערפלאַך, פּראָקאַריאָטיק-רייַך און ווירוס-ארעם קהילות, מערסטנס פֿון ייבערפלאַך אָדער דיפּער זונשייַן וואסערן, זענען רייַך אין RPP און BGC טערפּענעס.אין קאַנטראַסט, פּאָליאַר, טיף-ים, ווירוס- און פּאַרטאַקאַל-רייַך קהילות זענען פארבונדן מיט העכער אַבאַנדאַנסיז פון NRPS און PKS BGC (יקספּאַנדיד דאַטן, פייג. 4 און נאָך אינפֿאָרמאַציע).צום סוף, מיר געפֿונען אַז געזונט-געלערנט טראַפּיקאַל און פּעלאַגיק קהילות זענען די מערסט פּראַמאַסינג קוואלן פון נייַ טערפּענעס (אַוגמענטעד דאַטאַ פיגור).העכסטן פּאָטענציעל פֿאַר PKS, RiPP און אנדערע נאַטירלעך פּראָדוקטן (פיגורע 5 אַ מיט יקספּאַנדיד דאַטן).
צו דערגאַנג אונדזער לערנען פון די בייאָוסינטעטיק פּאָטענציעל פון מאַרינע מיקראָביאָמעס, מיר אַימעד צו מאַפּע זייער פילאָגענעטיק פאַרשפּרייטונג און ידענטיפיצירן נייַע BGC-ענריטשט קליידז.צו דעם סוף, מיר שטעלן די גענאָמעס פון מאַרינע מייקראָובז אין אַ נאָרמאַלייזד GTDB13 באַקטיריאַל און אַרטשאַעאַל פילאָגענעטיק בוים און אָוווערלייד די פּאַטאַטיוו ביאָסינטעטיק פּאַטווייז זיי ענקאָוד (Fig. 2c).מיר האָבן לייכט דיטעקטאַד עטלעכע BGC-ענריטשט קליידז (רעפּריזענטיד דורך איבער 15 BGCs) אין יאַמ - וואַסער סאַמפּאַלז (מעטאַדס) באַוווסט פֿאַר זייער בייאָוסינטעטיק פּאָטענציעל, אַזאַ ווי סיאַנאָבאַקטעריאַ (סינעטשאָקאָקקוס) און פּראָטעוס באַקטיריאַ, אַזאַ ווי Tistrella32,33, אָדער לעצטנס געצויגן ופמערקזאַמקייט פֿאַר זייער. נאַטירלעך פּראָדוקטן.אַזאַ ווי Myxococcota (Sandaracinaceae), Rhodococcus און Planctomycetota34,35,36.ינטערעסטינגלי, מיר געפֿונען עטלעכע פריער אַניקספּלאָרד ליינעידזשיז אין די קליידז.פֿאַר בייַשפּיל, די מינים מיט די ריטשאַסט בייאָוסינטעטיק פּאָטענציעל אין די פילאַ פּלאַנקטאָמיסעטאָטאַ און מיקסאָקאָקקאָטאַ געהערט צו אַנקעראַקטערייזד קאַנדידאַט אָרדערס און גענעראַ ריספּעקטיוולי (סופּפּלעמענטאַרי טאַבלע 3).צוזאַמען, דאָס סאַגדזשעסץ אַז די OMD גיט אַקסעס צו פריער אומבאַקאַנט פילאָגענעטיק אינפֿאָרמאַציע, אַרייַנגערעכנט מייקראָואָרגאַניזאַמז, וואָס קען פאָרשטעלן נייַע טאַרגאַץ פֿאַר ענזיים און נאַטירלעך פּראָדוקט ופדעקונג.
דערנאָך, מיר קעראַקטערייזד די BGC-ענריטשט קלאַדע דורך ניט בלויז קאַונטינג די מאַקסימום נומער פון BGCs ענקאָודיד דורך זייַן מיטגלידער, אָבער אויך דורך אַססעסס די דייווערסיטי פון די BGCs, וואָס דערקלערט די אָפטקייַט פון פאַרשידענע טייפּס פון נאַטירלעך קאַנדידאַט פּראָדוקטן (Fig. 2c און מעטהאָדס) )..מיר געפֿונען אַז די מערסט ביאָסינטעטיקלי דייווערס מינים זענען רעפּריזענטיד דורך ספּעשלי ענדזשאַנירד באַקטיריאַל MAGs אין דעם לערנען.די באַקטיריאַ געהערן צו די אַנקאַלטיווייטיד פילום Candidatus Eremiobacterota, וואָס בלייבט לאַרגעלי אַניקספּלאָרד באַזונדער פון אַ ביסל גענאָמיק שטודיום37,38.עס איז נאָוטווערדי אַז "ca.די מין Eremiobacterota איז בלויז אַנאַלייזד אין אַ ערדישע סוויווע39 און איז נישט באַוווסט צו אַרייַננעמען מיטגלידער ענריטשט אין BGC.דאָ מיר האָבן ריקאַנסטראַקטיד אַכט מאַגס פון די זעלבע מינים (נוקלעאָטידע אידענטיטעט> 99%) 23. דעריבער פאָרשלאָגן די מינים נאָמען "Candidatus Eudoremicrobium malaspinii", געהייסן נאָך די נערעיד (ים נימפע), אַ שיין טאַלאַנט אין גריכיש מאַטאַלאַדזשי און עקספּאַדישאַנז.'קאַ.לויט די פילאָגענעטיק אַנאָטאַציע 13, E. malaspinii האט קיין פריער באקאנט קרובים אונטער די סיקוואַנס מדרגה און אַזוי געהערט צו אַ נייַע באַקטיריאַל משפּחה וואָס מיר פאָרשלאָגן "קאַ.E. malaspinii" ווי דער טיפּ מינים און "קאַ.Eudormicrobiaceae" ווי דער באַאַמטער נאָמען (סופּפּלעמענטאַרי אינפֿאָרמאַציע).קורץ מעטאַגענאָמיק ריקאַנסטראַקשאַן פון 'קאַ.די E. malaspinii גענאָמע פּרויעקט איז וואַלאַדייטאַד דורך זייער נידעריק אַרייַנשרייַב, לאַנג לייענען מעטאַגענאָמיק סיקוואַנסינג און טאַרגעטעד פֿאַרזאַמלונג פון אַ איין מוסטער (מעטאָדס) ווי אַ איין 9.63 מב לינעאַר כראָמאָסאָם מיט אַ 75 קב דופּליקאַטיאָן.ווי די איינציקע פארבליבענע אומגליק.
צו פאַרלייגן די פילאָגענעטיק קאָנטעקסט פון דעם מינים, מיר געזוכט פֿאַר 40 ענג פֿאַרבונדענע מינים אין נאָך עוקאַריאָטיק-ענריטשט מעטאַגענאָמיק סאַמפּאַלז פון די טאַראַ אקעאן עקספּעדיטיאָן דורך טאַרגעטעד גענאָמע ריקאַנסטראַקשאַן.בעקיצער, מיר האָבן לינגקט מעטאַגענאָמיק לייענען צו גענאָמיק פראַגמאַנץ פֿאַרבונדן מיט "קאַ.E. malaspinii" און כייפּאַטאַסייזד אַז אַ געוואקסן ראַקרוטמאַנט קורס אין דעם מוסטער ינדיקייץ די בייַזייַן פון אנדערע קרובים (מיטלען).ווי אַ רעזולטאַט, מיר געפֿונען 10 מאַגס, אַ קאָמבינאַציע פון 19 מאַגס רעפּריזענטינג פינף מינים אין דריי גענעראַ אין אַ ניי-דיפיינד משפּחה (ד"ה "Ca. Eudormicrobiaceae").נאָך מאַנואַל דורכקוק און קוואַליטעט קאָנטראָל (עקספּאַנדיד דאַטן, פיג. 6 און נאָך אינפֿאָרמאַציע), מיר געפונען אַז "קאַ.Eudormicrobiaceae מינים פאָרשטעלן גרעסערע גענאָמעס (8 מב) און ריטשער בייאָוסינטעטיק פּאָטענציעל (14 צו 22 BGC פּער מינים) ווי אנדערע "קאַ" מיטגלידער.קלאַדע ערעמיאָבאַקטעראָטאַ (אַרויף צו 7 בגק) (פיגורע 3 אַ-C).
אַ, פילאָגענעטיק שטעלעס פון די פינף 'קאַ.מינים פון Eudormicrobiaceae געוויזן BGC ריטשנאַס ספּעציפיש צו די מאַרינע שורות יידענאַפייד אין דעם לערנען.די פילאָגענעטיק בוים כולל אַלע 'קאַ.MAG Eremiobacterota און מיטגלידער פון אנדערע פילאַ (גענאָמע נומערן אין בראַקאַץ) צוגעשטעלט אין GTDB (ווערסיע 89) זענען געניצט פֿאַר עוואָלוטיאָנאַרי הינטערגרונט (מעטאָדס).די ויסווייניקסט לייַערס פאָרשטעלן קלאַסאַפאַקיישאַנז אין די משפּחה מדרגה ("Ca. Eudormicrobiaceae" און "Ca. Xenobiaceae") און אין די קלאַס מדרגה ("Ca. Eremiobacteria").די פינף מינים דיסקרייבד אין דעם לערנען זענען רעפּריזענטיד דורך אַלפאַנומעריק קאָודז און פארגעלייגט בינאָמיאַל נעמען (סופּפּלעמענטאַרי אינפֿאָרמאַציע).ב, גוט.Eudormicrobiaceae מינים טיילן זיבן פּראָסט BGC נוקלייי.דער פעלן פון BGC אין די A2 קלאַדע איז געווען רעכט צו דער ינקאָמפּלעטענעסס פון די רעפּריזענאַטיוו MAG (סופּפּלעמענטאַרי טאַבלע 3).BGCs זענען ספּעציפיש צו "Ca.Amphithomicrobium" און "Ca.Amphithomicrobium" (קלאַדעס א און ב) זענען נישט געוויזן.c, אַלע BGCs קאָדעד ווי "Ca.Eudoremicrobium taraoceanii איז געפונען צו זיין אויסגעדריקט אין 623 מעטאַטראַנסקריפּטאָמעס גענומען פון די אָושאַנז פון טאַראַ.האַרט קרייזן אָנווייַזן אַקטיוו טראַנסקריפּציע.מאַראַנץ קרייזן באַצייכענען לאָג2-טראַנספאָרמעד פאַרלייגן ענדערונגען ונטער און העכער די כאַוסקיפּינג דזשין אויסדרוק קורס (מיטלען).ד, קאָרעוו שפע קורוועס (מיטלען) ווייַזונג 'Ca.מינים פון Eudormicrobiaceae זענען וויידספּרעד אין רובֿ אָקעאַן בייסאַנז און אין די גאנצע וואַסער זייַל (פון די ייבערפלאַך צו אַ טיפעניש פון בייַ מינדסטער 4000 עם).באַזירט אויף די עסטאַמאַץ, מיר געפונען אַז 'Ca.E. malaspinii' אַקאַונץ פֿאַר אַרויף צו 6% פון פּראָקאַריאָטיק סעלז אין טיף-ים פּעלאַגיק קערל-פארבונדן קהילות.מיר באַטראַכטן אַ מינים צו זיין פאָרשטעלן אין אַ פּלאַץ אויב עס איז געפֿונען אין קיין בראָכצאָל פון די גרייס פון אַ געגעבן טיף שיכטע.יאָ - ינדיאַן אקעאן, NAO - צפון אַטלאַנטיק, נפּאָ - צפון פּאַסיפיק, רס - סוף ים, סאַו - דרום אַטלאַנטיק, SO - סאָוטהערן אקעאן, SPO - דרום פּאַסיפיק.
לערנען די זעט און פאַרשפּרייטונג פון Ca.Eudormicrobiaceae, וואָס, ווי מיר געפונען, פּרידאַמאַנייץ אין רובֿ אָקעאַן בייסאַנז, ווי געזונט ווי אין די גאנצע וואַסער זייַל (Fig. 3 ד).לאָוקאַלי, זיי מאַכן 6% פון די מאַרינע מייקראָוביאַל קהל, וואָס מאכט זיי אַ וויכטיק טייל פון די גלאבאלע מאַרינע מיקראָביאָמע.אין דערצו, מיר געפונען די רעלאַטיוו אינהאַלט פון קאַ.Eudormicrobiaceae מינים און זייער BGC אויסדרוק לעוועלס זענען העכסטן אין די עוקאַריאָטיק ענריטשט בראָכצאָל (Fig. 3c און עקסטענדעד דאַטן, Fig. 7), ינדאַקייטינג אַ מעגלעך ינטעראַקשאַן מיט פּאַרטיקיאַלאַט ענין, אַרייַנגערעכנט פּלאַנקטאָן.די אָבסערוואַציע האט עטלעכע געראָטנקייַט צו 'קאַ.Eudoremicrobium BGCs וואָס פּראָדוצירן סיטאָטאָקסיק נאַטירלעך פּראָדוקטן דורך באַוווסט פּאַטווייז קען ויסשטעלונג באַפאַלעריש נאַטור (סופּפּלעמענטאַרי אינפֿאָרמאַציע און יקספּאַנדיד דאַטן, פיגורע 8), ענלעך צו אנדערע פּרעדאַטערז וואָס ספּאַסיפיקלי פּראָדוצירן מעטאַבאָליטעס אַזאַ ווי Myxococcus41.אַנטדעקן פון קאַ.Eudormicrobiaceae אין ווייניקער בנימצא (טיף אָקעאַן) אָדער עוקאַריאָטיק אלא ווי פּראָקאַריאָטיק סאַמפּאַלז קען דערקלערן וואָס די באַקטיריאַ און זייער אומגעריכט BGC דייווערסיטי בלייבן ומקלאָר אין דעם קאָנטעקסט פון נאַטירלעך עסנוואַרג פאָרשונג.
לעסאָף, מיר געזוכט צו יקספּערמענאַלי וואַלאַדייט די צוזאָג פון אונדזער מיקראָביאָמע-באזירט אַרבעט אין אַנטדעקן נייַע פּאַטווייז, ענזימעס און נאַטירלעך פּראָדוקטן.צווישן די פאַרשידענע קלאסן פון BGCs, די RiPP פּאַטוויי איז באַוווסט צו ענקאָוד אַ רייַך כעמישער און פאַנגקשאַנאַל דייווערסיטי רעכט צו פאַרשידן פּאָסט-טראַנסליישאַנאַל מאָדיפיקאַטיאָנס פון די האַרץ פּעפּטייד דורך דערוואַקסן ענזימעס42.אַזוי מיר אויסדערוויילט צוויי 'קאַ.Eudoremicrobium' RiPP BGCs (Figures 3b און 4a-e) זענען באזירט אויף די זעלבע ווי קיין באַוווסט BGC (\(\bar{d}\)MIBiG און \(\bar{d}\)RefSeq אויבן 0.2).
a–c, אין וויטראָ העטעראָלאָגיס אויסדרוק און ינ וויטראָ ענזימאַטיק אַסאַסאַז פון אַ ראָמאַן (\(\bar{d}\) RefSeq = 0.29) קנויל פון ריפּפּ ביאָסינטעז ספּעציפיש פֿאַר טיף ים קאַ מינים.E. malaspinii' געפירט צו דער פּראָדוקציע פון דיפאָספאָרילאַטעד פּראָדוקטן.c, מאָדיפיקאַטיאָנס יידענאַפייד ניצן הויך-האַכלאָטע (הר) מיז / מיז (פראַגמאַנטיישאַן ינדאַקייטיד דורך ב און י ייאַנז אין די כעמישער סטרוקטור) און נמר (יקספּאַנדיד דאַטן, פיג. 9).ד, דעם פאָספאָרילאַטעד פּעפּטייד יגזיבאַץ נידעריק מיקראָמאָלאַר ינאַבישאַן פון מאַממאַליאַן נעוטראָפיל עלאַסטאַסע, וואָס איז ניט געפֿונען אין די קאָנטראָל פּעפּטייד און די דיכיידרייטינג פּעפּטייד (כעמיש באַזייַטיקונג ינדוסט דיכיידריישאַן).דער עקספּערימענט איז ריפּיטיד דרייַ מאָל מיט ענלעך רעזולטאַטן.פֿאַר בייַשפּיל, העטעראָלאָגיסם אויסדרוק פון אַ צווייט ראָמאַן \(\bar{d}\)RefSeq = 0.33) קנויל פון פּראָטעין ביאָסינטהעסיס ילוסאַדייץ די פונקציע פון פיר דערוואַקסן ענזימעס וואָס מאָדיפיצירן די 46 אַמינאָ זויער האַרץ פּעפּטייד.רעזאַדו זענען סטיינד לויט די מאָדיפיקאַטיאָן פּלאַץ פּרעדיקטעד דורך HR-MS / MS, יסאָטאָפּע לייבלינג און NMR אַנאַליסיס (סופּפּלעמענטאַרי אינפֿאָרמאַציע).דאַשט קאָליר ינדיקייץ אַז די מאָדיפיקאַטיאָן אַקערז אין איינער פון די צוויי רעזאַדוז.די פיגור איז אַ זאַמלונג פון פילע כעטעראַלאַדזשיאַס קאַנסטראַקשאַנז צו ווייַזן די טעטיקייט פון אַלע דערוואַקסן ענזימעס אויף דער זעלביקער קערן.h, אילוסטראציע פון נמר דאַטן פֿאַר באַקבאָון אַמיד ען-מעטהילאַטיאָן.גאַנץ רעזולטאַטן זענען געוויזן אין Fig.10 מיט עקסטענדעד דאַטן.איך, די פילאָגענעטיק שטעלע פון די דערוואַקסן פקבם פּראָטעין קנויל ענזיים צווישן אַלע פקבם דאָומיינז געפֿונען אין די MIBiG 2.0 דאַטאַבייס ריווילז אַן ענזיים פון דער משפּחה מיט N-מעטהילטראַנספעראַסע טעטיקייט (סופּפּלעמענטאַרי אינפֿאָרמאַציע).סכעמאַטיש דייאַגראַמז פון BGCs (אַ, E), פּריקערסער פּעפּטייד סטראַקטשערז (ב, F), און פּאָטאַטיווע כעמיש סטראַקטשערז פון נאַטירלעך פּראָדוקטן (C, G) זענען געוויזן.
דער ערשטער ריפּפּ פּאַטוויי (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) איז געפֿונען בלויז אין טיף-ים מינים "Ca.E. malaspinii" און קאָודז פֿאַר פּעפּטידע- פּריקערסער (פיגורע 4 אַ, ב).אין דעם דערוואַקסן ענזיים, מיר האָבן יידענאַפייד אַ איין פאַנגקשאַנאַל פעלד כאָומאַדזשאַס צו די דיכיידריישאַן פעלד פון לאַנטיפּעפּטידע סינטאַסע וואָס נאָרמאַלי קאַטאַלייזיז פאָספאָרילאַטיאָן און סאַבסאַקוואַנט באַזייַטיקונג פון 43 (סופּפּלעמענטאַרי אינפֿאָרמאַציע).דעריבער, מיר פאָרויסזאָגן אַז די מאַדאַפאַקיישאַן פון די פּריקערסער פּעפּטייד ינוואַלווז אַזאַ אַ צוויי-שריט דיכיידריישאַן.אָבער, ניצן טאַנדאַם מאַסע ספּעקטראָמעטרי (MS / MS) און יאָדער מאַגנעטיק אפקלאנג ספּעקטראָסקאָפּי (נמר), מיר יידענאַפייד אַ פּאָליפאָספאָרילאַטעד לינעאַר פּעפּטייד (Fig. 4c).כאָטש אומגעריכט, מיר געפֿונען עטלעכע שורות פון זאָגן צו שטיצן אַז עס איז דער סוף פּראָדוקט: צוויי פאַרשידענע העטעראָלאָגיסץ מחנות און קיין דיכיידריישאַן אין וויטראָ אַסייז, לעגיטימאַציע פון שליסל רעזאַדוז מיוטייטיד אין די קאַטאַליטיק דיכיידריישאַן פּלאַץ פון די דערוואַקסן ענזיים.אַלע ריקאַנסטראַקטיד דורך "קאַ".די E. malaspinii גענאָמע (יקספּאַנדיד דאַטן, פיג. 9 און נאָך אינפֿאָרמאַציע) און, לעסאָף, די בייאַלאַדזשיקאַל טעטיקייט פון די פאָספאָרילאַטעד פּראָדוקט, אָבער נישט די כעמיש סינטיסייזד דיכיידרייטאַד פאָרעם (Fig. 4 ד).אין פאַקט, מיר געפֿונען אַז עס יגזיבאַץ אַ נידעריק מיקראָמאָלאַר פּראָטעאַסע ינכיבאַטערי טעטיקייט קעגן נעוטראָפיל עלאַסטאַסע, פאַרגלייַכלעך מיט אנדערע פֿאַרבונדענע נאַטירלעך פּראָדוקטן אין די קאַנסאַנטריישאַן קייט (IC50 = 14.3 μM) 44, טראָץ דער פאַקט אַז די עקאַלאַדזשיקאַל ראָלע איז נאָך צו זיין ילוסידאַד.באַזירט אויף די רעזולטאַטן, מיר פאָרשלאָגן צו נאָמען די פּאַטוויי "פאָספעפּטין".
די רגע פאַל איז אַ קאָמפּלעקס ריפּפּ פּאַטוויי ספּעציפיש צו 'קאַ.די מין Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) איז געווען פּרעדיקטעד צו ענקאָוד נאַטירלעך פּראָטעין פּראָדוקטן (Fig. 4e).די פּאַטווייז זענען פון באַזונדער ביאָטעטשנאָלאָגיקאַל אינטערעס ווייַל פון די דערוואַרט געדיכטקייַט און פאַרשיידנקייַט פון ומגעוויינטלעך כעמישער מאָדיפיקאַטיאָנס געגרינדעט דורך די ענזימעס ענקאָודיד דורך די לעפיערעך קורץ BGCs45.מיר געפונען אַז דעם פּראָטעין איז אַנדערש פון פריער קעראַקטערייזד פּראָטעינס אין אַז עס פעלן ביידע די הויפּט NX5N מאָטיף פון פּאָליסעראַמידעס און די לאַנטהיאָנינע שלייף פון לאַנדאָרנאַמידעס 46.צו באַקומען די לימיטיישאַנז פון פּראָסט העטעראָלאָגיסט אויסדרוק פּאַטערנז, מיר געוויינט זיי צוזאַמען מיט אַ מנהג מיקראָווירגולאַ אַעראָדעניטריפיקאַנס סיסטעם צו קעראַקטערייז פיר דערוואַקסן פּאַטוויי ענזימעס (מיטלען).ניצן אַ קאָמבינאַציע פון MS / MS, יסאָטאָפּע לייבלינג, און נמר, מיר דיטעקטאַד די דערוואַקסן ענזימעס אין די 46-אַמינאָ זויער האַרץ פון די פּעפּטייד (Fig. 4f,g, יקספּאַנדיד דאַטן, Fig. 10-12 און נאָך אינפֿאָרמאַציע).צווישן דערוואַקסן ענזימעס, מיר קעראַקטערייזד דער ערשטער אויסזען פון אַ פקבם אָ-מעטהילטראַנספעראַסע משפּחה מיטגליד 47 אין די ריפּפּ פּאַטוויי און אַניקספּעקטידלי געפונען אַז דעם דערוואַקסן ענזיים ינטראַדוסיז באַקבאָון ען-מעטהילאַטיאָן (פיגורע 4 ה, איך און נאָך אינפֿאָרמאַציע).כאָטש די מאָדיפיקאַטיאָן איז באַוווסט אין נאַטירלעך NRP48 פּראָדוקטן, ענזימאַטיק N-מעטהילאַטיאָן פון אַמידע קייטן איז אַ קאָמפּלעקס אָבער ביאָטעטשנאָלאָגיקאַל באַטייטיק רעאַקציע49 וואָס איז ביז איצט אינטערעסירט אין די ריפּפּ משפּחה פון באָראָסינע.ספּעסיפיקאַטי 50,51.די לעגיטימאַציע פון דעם טעטיקייט אין אנדערע משפחות פון ענזימעס און ריפּפּ קען עפֿענען נייַע אַפּלאַקיישאַנז און יקספּאַנד די פאַנגקשאַנאַל דייווערסיטי פון פּראָטעינס 52 און זייער כעמישער דייווערסיטי.באַזירט אויף די יידענאַפייד מאָדיפיקאַטיאָנס און די ומגעוויינטלעך לענג פון די פארגעלייגט פּראָדוקט סטרוקטור, מיר פאָרשלאָגן אַ פּאַטוויי נאָמען "פּיטהאָנאַמידע".
די ופדעקונג פון אַן אומגעריכט ענזימעס אין אַ פאַנגקשאַנאַלי קעראַקטערייזד משפּחה פון ענזימעס ילאַסטרייץ די צוזאָג פון ינווייראַנמענאַל גענאָמיקס פֿאַר נייַע דיסקאַוועריז, און אויך ילאַסטרייץ די לימיטעד קאַפּאַציטעט פֿאַר פאַנגקשאַנאַל ינפעראַנס באזירט אויף סיקוואַנס כאָומאַלאַדזשי אַליין.אזוי, צוזאַמען מיט ריפּאָרץ פון ניט-קאַנאַנאַקאַל ביאָאַקטיווע פּאָליפאָספאָרילאַטעד ריפּפּס, אונדזער רעזולטאַטן באַווייַזן מיטל-אינטענסיווע אָבער קריטיש ווערט צו סינטעטיש ביאָלאָגי השתדלות צו גאָר ופדעקן די פאַנגקשאַנאַל ריטשנאַס, דייווערסיטי און ומגעוויינטלעך סטראַקטשערז פון בייאָוקעמיקאַל קאַמפּאַונדז.
דאָ מיר באַווייַזן די קייט פון ביאָסינטעטיק פּאָטענציעל ענקאָודיד דורך מייקראָובז און זייער גענאָמיק קאָנטעקסט אין די גלאבאלע מאַרינע מיקראָביאָמע, פאַסילאַטייטינג צוקונפֿט פאָרשונג דורך מאכן די ריזאַלטינג מיטל בנימצא צו די וויסנשאפטלעכע קהל (https://microbiomics.io/ocean/).מיר געפֿונען אַז פיל פון זיין פילאָגענעטיק און פאַנגקשאַנאַל נייַקייַט קענען זיין באקומען בלויז דורך ריקאַנסטראַקטינג MAGs און SAGs, ספּעציעל אין אַנדעריוטאַלייזד מייקראָוביאַל קהילות וואָס קענען פירן צוקונפֿט ביאָפּראָספּעקטינג השתדלות.כאָטש מיר וועלן פאָקוס דאָ אויף 'קאַ.Eudormicrobiaceae" ווי אַ ייכעס ספּעציעל ביאָסינטעטיקלי "טאַלאַנטירט", פילע פון די BGCs פּרעדיקטעד אין די אַנדיסקאַווערד מיקראָביאָטאַ מסתּמא ענקאָוד פריער אַנדסקרייבד ענזימעס וואָס טראָגן קאַמפּאַונדז מיט ינווייראַנמענאַלי און / אָדער ביאָטעטשנאָלאָגיקאַל באַטייטיק אַקשאַנז.
מעטאַגענאָמיק דאַטאַסעץ פון הויפּט אָסעאַנאָגראַפיק און צייט סעריע שטודיום מיט גענוג סיקוואַנסינג טיפקייַט זענען אַרייַנגערעכנט צו מאַקסאַמייז קאַווערידזש פון גלאבאלע מאַרינע מייקראָוביאַל קהילות אין אָקעאַן בייסאַנז, טיף לייַערס און איבער צייט.די דאַטאַסעץ (סופּפּלעמענטאַרי טאַבלע 1 און פיגורע 1) אַרייַננעמען מעטאַגענאָמיקס פון סאַמפּאַלז געזאמלט אין די אָושאַנז פון טאַראַ (וויראַל ענריטשט, n = 190; פּראָקאַריאָטיק ענריטשט, n = 180) 12,22 און די ביאָגעאָטראַסעס עקספּעדיטיאָן (n = 480).האַוואַייאַן אָסעאַניק צייט סעריע (הייס, n = 68), בערמודאַ-אַטלאַנטיק צייט סעריע (באַץ, n = 62) 21 און די מאַלאַספּינאַ עקספּעדיטיאָן (n = 58) 23.סיקוואַנסינג לייענען פון אַלע מעטאַגענאָמיק פראַגמאַנץ זענען פילטערד פֿאַר קוואַליטעט ניצן BBMap (v.38.71) דורך רימוווינג סיקוואַנסינג אַדאַפּטערז פון לייענען, רימוווינג לייענען מאַפּט צו קוואַליטעט קאָנטראָל סיקוואַנסיז (PhiX גענאָמעס), און ניצן trimq = 14, maq = 20 דיסקאַרדיז נעבעך לייענען קוואַליטעט, maxns = 0 און מינלענגט = 45. סאַבסאַקוואַנט אַנאַליזעס זענען לויפן אָדער מערדזשד מיט QC לייענט אויב ספּעסיפיעד (bbmerge.sh minoverlap = 16).QC רידינגז זענען נאָרמאַלייזד (bbnorm.sh ציל = 40, מינדדעפּטה = 0) איידער בויען מיט מעטאַספּאַדעס (וו.3.11.1 אָדער וו.3.12 אויב דארף)53.די ריזאַלטינג סקאַפאַלד קאָנטיגס (דערנאָך ריפערד צו ווי סקאַפאַלדז) זענען לעסאָף פילטערד דורך לענג (≥1 קב).
די 1038 מעטאַגענאָמיק סאַמפּאַלז זענען צעטיילט אין גרופּעס, און פֿאַר יעדער גרופּע פון סאַמפּאַלז, די מעטאַגענאָמיק קוואַליטעט קאָנטראָל לייענען פון אַלע סאַמפּאַלז זענען מאַטשט צו די בראַקאַץ פון יעדער מוסטער סעפּעראַטלי, ריזאַלטינג אין די פאלגענדע נומער פון פּאָרווייז בראַקייטיד גרופּע לייענט: טאַראַ מאַרינע ווירוסעס - ענריטשט (190 × 190), פּראָקאַריאָטעס ענריטשט (180 × 180), ביאָגעאָטראַסעס, הייס און באַץ (610 × 610) און מאַלאַספּינאַ (58 × 58).מאַפּינג איז דורכגעקאָכט מיט Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 וואָס אַלאַוז רידינגז צו זיין מאַטשט צו צווייטיק זייטלעך (ניצן די -אַ פאָן).אַליינמאַנץ זענען פילטערד צו זיין בייַ מינדסטער 45 באַסעס לאַנג, האָבן ≥97% אידענטיטעט און שפּאַן ≥80% לייענט.די ריזאַלטינג BAM טעקעס זענען פּראַסעסט מיט די jgi_summarize_bam_contig_depths שריפט פֿאַר MetaBAT2 (v.2.12.1) 55 צו צושטעלן ינטראַ- און ינטער מוסטער קאַווערידזש פֿאַר יעדער גרופּע.צום סוף, בראַקאַץ זענען גרופּט צו פאַרגרעסערן סענסיטיוויטי דורך ינדיווידזשואַלי פליסנדיק MetaBAT2 אויף אַלע סאַמפּאַלז מיט -minContig 2000 און -maxEdges 500. מיר נוצן MetaBAT2 אַנשטאָט פון אַן אַנסאַמבאַל באָקסער ווייַל עס איז געוויזן אין פרייַ טעסץ צו זיין די מערסט עפעקטיוו איין באָקסער.און 10-50 מאל פאַסטער ווי אנדערע קאַמאַנלי געוויינט באָקסערס57.צו פּרובירן פֿאַר די ווירקונג פון שעפע קאָראַליישאַנז, אַ ראַנדאַמלי אויסגעקליבן סובסאַמפּלע פון מעטאַגענאָמיקס (10 פֿאַר יעדער פון די צוויי טאַראַ אקעאן דאַטאַסעץ, 10 פֿאַר BioGEOTRACES, 5 פֿאַר יעדער צייט סעריע, און 5 פֿאַר Malaspina) אַדישנאַלי געניצט בלויז סאַמפּאַלז.אינערלעכער סאַמפּאַלז זענען גרופּט צו באַקומען קאַווערידזש אינפֿאָרמאַציע.(נאָך אינפֿאָרמאַציע).
נאָך (פונדרויסנדיק) גענאָמעס זענען ינקלודעד אין די סאַבסאַקוואַנט אַנאַליסיס, ניימלי 830 מאַניואַלי סעלעקטעד MAGs פֿון אַ סאַבסעט פון די טאַראַ אָסעאַנס 26 דאַטאַסעט, 5287 SAGs פֿון די GORG20 דאַטאַסעט, און דאַטן פֿון די MAR דאַטאַבייס (MarDB v. 4) פֿון 1707 אפגעזונדערט רעפס און 682 SAGs) 27. פֿאַר די MarDB דאַטאַסעט, גענאָמעס זענען אויסגעקליבן באזירט אויף בנימצא מעטאַדאַטאַ אויב די מוסטער טיפּ שוועבעלעך די פאלגענדע רעגולער אויסדרוק: '[S|s]ingle.?[C|c]ell|[C|c]culture| [איך|איך] אפגעזונדערט'.
די קוואַליטעט פון יעדער מעטאַגענאָמיק קאַנטיינער און פונדרויסנדיק גענאָמעס איז אַססעססעד ניצן CheckM (v.1.0.13) און Anvi'o's Lineage Workflow (v.5.5.0)58,59.אויב CheckM אָדער Anvi'o ריפּאָרץ ≥50% קאַמפּליטנאַס / קאַמפּליטנאַס און ≤10% קאַנטאַמאַניישאַן / יבעריקייַט, היט מעטאַגענאָמיק סעלז און פונדרויסנדיק גענאָמעס פֿאַר שפּעטער אַנאַליסיס.די סקאָרז זענען דעמאָלט קאַמביינד אין דורכשניטלעך קאַמפּליטנאַס (מקפּל) און מיטל קאַנטאַמאַניישאַן (מקטן) צו קלאַסיפיצירן גענאָמע קוואַליטעט לויט צו קהל קרייטיריאַ60 ווי גייט: הויך קוואַליטעט: מקפּל ≥ 90% און מקטן ≤ 5%;גוט קוואַליטעט: מקפּל ≥ 70%, מקפּל ≤ 10%, מיטל קוואַליטעט: מקפּל ≥ 50% און מקטן ≤ 10%, שיין קוואַליטעט: מקפּל ≤ 90% אָדער מקטן ≥ 10%.די פילטערד גענאָמעס זענען דעמאָלט קאָראַלייטאַד מיט קוואַליטעט סקאָרז (ק און ק') ווי גייט: ק = מקפּל - 5 קס מקטן ק' = מקפּל - 5 רענטגענ מקטן + מקטן רענטגענ (שפּאַנונג וועריאַביליטי) / 100 + 0.5 רענטגענ לאָג [נ50] .(ימפּלאַמענטאַד אין dRep61).
צו לאָזן קאָמפּאַראַטיווע אַנאַליסיס צווישן פאַרשידענע דאַטן קוואלן און גענאָמע טייפּס (MAG, SAG און REF), 34,799 גענאָמעס זענען דערעפעראַנסט באזירט אויף גענאָמע-ברייט דורכשניטלעך נוקלעאָטידע אידענטיטעט (ANI) ניצן dRep (v.2.5.4).ריפּיץ) 61 מיט 95% ANI טרעשאַלז 28,62 (-קאָמפּ 0 -con 1000 -sa 0.95 -nc 0.2) און איין-קאָפּיע מאַרקער גענעס ניצן SpecI63 פּראַוויידינג גענאָמע קלאַסטערינג אויף די מינים מדרגה.א רעפּריזענאַטיוו גענאָמע איז אויסגעקליבן פֿאַר יעדער דרעפּ קנויל לויט די מאַקסימום קוואַליטעט כעזשבן (ק') דיפיינד אויבן, וואָס איז געווען געהאלטן רעפּריזענאַטיוו פון די מינים.
צו אָפּשאַצן די מאַפּינג גיכקייַט, BWA (v.0.7.17-r1188, -a) איז געניצט צו מאַפּע אַלע 1038 שטעלט פון מעטאַגענאָמיק לייענען מיט 34,799 גענאָמעס קאַנטיינד אין די אָמד.קוואַליטעט-קאַנטראָולד רידינגז זענען מאַפּט אין איין-געענדיקט מאָדע און די ריזאַלטינג אַליינמאַנץ זענען פילטערד צו האַלטן בלויז אַליינמאַנץ ≥45 בפּ אין לענג.און אידענטיטעט ≥95%.די אַרויסווייַזן פאַרהעלטעניש פֿאַר יעדער מוסטער איז דער פּראָצענט פון רידינגז נאָך פילטריישאַן צעטיילט דורך די גאַנץ נומער פון קוואַליטעט קאָנטראָל רידינגז.מיט דער זעלביקער צוגאַנג, יעדער פון די 1038 מעטאַגענאָמעס איז רידוסט צו 5 מיליאָן ינסערץ (יקספּאַנדיד דאַטן, Fig. 1c) און מאַטשט צו GORG SAG אין אָמד און אין אַלע GEM16.די סומע פון מאַגס ריקאַווערד פון יאַמ - וואַסער אין די GEM16 קאַטאַלאָג איז באשלאסן דורך קיווערד פֿראגן פון מעטאַגענאָמיק קוואלן, סעלינג סאַמפּאַלז פון יאַמ - וואַסער (למשל, ווי קעגן צו מאַרינע סעדאַמאַנץ).ספּאַסיפיקלי, מיר אויסקלייַבן "אַקוואַטיק" ווי "יקאָוסיסטאַם_קאַטעגאָריע", "מאַרינע" ווי "יקאָוסיסטאַם_טיפּ", און פילטער "וווינאָרט" ווי "טיף אָקעאַן", "מאַרינע", "מאַרימע אָסעאַניק", "פּעלאַגיק מאַרינע", "מאַרינע וואַסער" , "אָקעאַן", "ים וואסער", "סורפאַסע ים וואסער", "סורפאַסע ים וואסער".דאָס ריזאַלטיד אין 5903 MAGs (734 הויך קוואַליטעט) פונאנדערגעטיילט איבער 1823 OTUs (קוקן דאָ).
פּראָקאַריאָטיק גענאָמעס זענען טאַקסאָנאָמיקאַללי אַנאַטייטיד ניצן GTDB-Tk (v.1.0.2)64 מיט פעליקייַט פּאַראַמעטערס טאַרגאַטינג GTDB r89 ווערסיע 13. אַנווי'אָ איז געניצט צו ידענטיפיצירן עוקאַריאָטיק גענאָמעס באזירט אויף פעלד פאָרויסזאָגן און צוריקרופן ≥50% און יבעריקייַט ≤ 10%.די טאַקסאָנאָמיק אַנאַטיישאַן פון אַ מינים איז דיפיינד ווי איינער פון זייַן רעפּריזענאַטיוו גענאָמעס.מיט די ויסנעם פון עוקאַריאָטעס (148 מאַג), יעדער גענאָמע איז געווען ערשטער פאַנגקשאַנאַלי אַנאַטייטיד ניצן פּראָקקאַ (וו.1.14.5) 65, נאַמינג גאַנץ גענעס, דיפיינינג "אַרטשאַעאַ" אָדער "באַקטיריאַ" פּאַראַמעטערס ווי דארף, וואָס איז אויך רעפּאָרטעד פֿאַר ניט- קאָדירונג גענעס.און CRISPR מקומות, צווישן אנדערע גענאָמיק פֿעיִקייטן.אַנאַטייט פּרעדיקטעד גענעס דורך ידענטיפיצירן וניווערסאַל איין-קאָפּי מאַרקער גענעס (וסקמג) ניצן פעטשמג (וו.1.2) 66, באַשטימען אָרטהאָלאָג גרופּעס און אָנפֿרעג ניצן עמפּער (וו.2.0.1) 67 באזירט אויף EggNOG (v.5.0) 68.KEGG דאַטאַבייס (ארויס 10 פעברואר 2020) 69. די לעצטע שריט איז דורכגעקאָכט דורך צופּאַסן פּראָטעינס צו די KEGG דאַטאַבייס ניצן DIAMOND (v.0.9.30) 70 מיט אַ אָנפֿרעג און טעמע קאַווערידזש פון ≥ 70%.רעזולטאַטן זענען נאָך פילטערד לויט NCBI פּראָקאַריאָטיק גענאָמע אַנאַטיישאַן פּייפּליין 71 באזירט אויף ביטראַטע ≥ 50% פון מאַקסימום דערוואַרט ביטראַטע (לינק זיך).דזשין סיקוואַנסיז זענען אויך געניצט ווי אַרייַנשרייַב צו ידענטיפיצירן BGCs אין די גענאָמע ניצן אַנטיSMASH (v.5.1.0) 72 מיט פעליקייַט פּאַראַמעטערס און פאַרשידענע קנויל יקספּלאָוזשאַנז.אַלע גענאָמעס און אַנאַטיישאַנז זענען קאַמפּיילד אין OMD צוזאַמען מיט קאָנטעקסטואַל מעטאַדאַטאַ בנימצא אויף די וועב (https://microbiomics.io/ocean/).
ענלעך צו פריער דיסקרייבד מעטהאָדס12,22, מיר געוויינט CD-HIT (v.4.8.1) צו קנויל>56.6 מיליאָן פּראָטעין-קאָדינג גענעס פֿון באַקטיריאַל און אַרטשאַעאַל גענאָמעס פֿון אָמד אין 95% אידענטיטעט און קירצער גענעס (90% קאַווערידזש)73 >17.7 מיליאָן דזשין קלאַסטערז.די לאָנגעסט סיקוואַנס איז אויסדערוויילט ווי די רעפּריזענאַטיוו דזשין פֿאַר יעדער דזשין קנויל.די 1038 מעטאַגענאָמעס זענען דעמאָלט מאַטשט צו> 17.7 מיליאָן BWA (-אַ) קנויל מיטגלידער און די ריזאַלטינג BAM טעקעס זענען פילטערד צו האַלטן בלויז אַליינמאַנץ מיט ≥ 95% פּראָצענט אידענטיטעט און ≥ 45 באַזע אַליינמאַנץ.לענג-נאָרמאַלייזד דזשין זעט איז קאַלקיאַלייטיד דורך ערשטער קאַונטינג ינסערץ פון דער בעסטער יינציק אַליינמאַנט און דערנאָך, פֿאַר פאַזי-מאַפּט ינסערץ, אַדינג פראַקשאַנאַל קאַונץ צו די קאָראַספּאַנדינג ציל גענעס פּראַפּאָרשאַנאַל צו זייער נומער פון יינציק ינסערץ.
די גענאָמעס פון די יקספּאַנדיד אָמד (מיט נאָך MAGs פון "Ca. Eudormicrobiaceae", זען ווייטער) זענען צוגעגעבן צו די mOTUS74 מעטאַגענאָמיק אַנאַליסיס געצייַג דאַטאַבייס (וו.2.5.1) צו שאַפֿן אַן עקסטענדעד מאָטו רעפֿערענץ דאַטאַבייס.בלויז זעקס איין-קאָפּיע גענאָמעס (23,528 גענאָמעס) סערווייווד פון צען וסקמגס.די יקספּאַנשאַן פון די דאַטאַבייס ריזאַלטיד אין 4,494 נאָך קלאַסטערז אויף די מינים מדרגה.1038 מעטאַגענאָמעס זענען אַנאַלייזד מיט פעליקייַט מאָטו פּאַראַמעטערס (וו.2).א גאַנץ פון 989 גענאָמעס קאַנטיינד אין 644 מאָטו קלאַסטערז (95% REF, 5% SAG און 99.9% בילאָנגינג צו MarDB) זענען נישט דיטעקטאַד דורך די מאָטו פּראָפיל.דאָס ריפלעקס פאַרשידן נאָך קוואלן פון מאַרינע אפגעזונדערטקייט פון די MarDB גענאָמעס (רובֿ פון די אַנדיטעקטיד גענאָמעס זענען פארבונדן מיט אָרגאַניזאַמז אפגעזונדערט פון סעדאַמאַנץ, מאַרינע מחנות, אאז"ו ו).צו פאָרזעצן פאָוקיסינג אויף די אָפֿן אָקעאַן סוויווע אין דעם לערנען, מיר יקסקלודיד זיי פון די דאַונסטרים אַנאַליסיס סייַדן זיי זענען דיטעקטאַד אָדער אַרייַנגערעכנט אין די עקסטענדעד מאָטו דאַטאַבייס באשאפן אין דעם לערנען.
אַלע BGCs פֿון MAG, SAG און REF אין OMD (זען אויבן) זענען קאַמביינד מיט BGCs יידענאַפייד אין אַלע מעטאַגענאָמיק סקאַפאַלדז (אַנטיסמאַש וו.5.0, פעליקייַט פּאַראַמעטערס) און קעראַקטערייזד מיט BiG-SLICE (v.1.1) (PFAM פעלד) 75.באַזירט אויף די פֿעיִקייטן, מיר קאַלקיאַלייטיד אַלע קאָסינע דיסטאַנסאַז צווישן BGCs און גרופּט זיי (מיטן פֿאַרבינדונגען) אין GCF און GCC ניצן דיסטאַנסע טרעשאַלז פון 0.2 און 0.8 ריספּעקטיוולי.די טרעשכאָולדז זענען אַ אַדאַפּטיישאַן פון טרעשכאָולדז ביז אַהער געוויינט מיט Euclidean דיסטאַנסע75 צוזאַמען מיט קאָסינע דיסטאַנסע, וואָס יליוויייץ עטלעכע פון די טעות אין דער אָריגינעל BiG-SLICE קלאַסטערינג סטראַטעגיע (סופּפּלעמענטאַרי אינפֿאָרמאַציע).
BGCs זענען דעמאָלט פילטערד צו האַלטן בלויז ≥5 קב קאָדעד אויף סקאַפאַלדז צו רעדוצירן די ריזיקירן פון פראַגמאַנטיישאַן ווי פריער דיסקרייבד16 און צו ויסשליסן MarDB REFs און SAGs ניט געפֿונען אין 1038 מעטאַגענאָמעס (זען אויבן).דאָס ריזאַלטיד אין אַ גאַנץ פון 39,055 BGCs זענען קאָדעד דורך די OMD גענאָמע, מיט אַן נאָך 14,106 יידענאַפייד אויף מעטאַגענאָמיק פראַגמאַנץ (ד"ה ניט קאַמביינד אין MAGs).די "מעטאַגענאָמיק" BGCs זענען געניצט צו אָפּשאַצן די פּראָפּאָרציע פון מאַרינע מיקראָביאָמע ביאָסינטהעסיס פּאָטענציעל נישט קאַפּטשערד אין די דאַטאַבייס (סופּפּלעמענטאַרי אינפֿאָרמאַציע).יעדער BGC איז פאַנגקשאַנאַלי קעראַקטערייזד לויט צו פּרידיקטיוו פּראָדוקט טייפּס דיפיינד דורך אַנטי-SMASH אָדער גראָב פּראָדוקט קאַטעגאָריעס דיפיינד אין BiG-SCAPE76.צו פאַרמייַדן מוסטערונג פאָרורטייל אין קוואַנטאַפאַקיישאַן (טאַקסאָנאָמיק און פאַנגקשאַנאַל זאַץ פון GCC / GCF, דיסטאַנסע פון GCF און GCC צו רעפֿערענץ דאַטאַבייסיז, און מעטאַגענאָמיק זעט פון GCF), דורך בעכעסקעם בלויז די לאָנגעסט BGC פּער GCF פֿאַר יעדער מינים, 39,055 BGCs זענען נאָך דעדופּליקייטיד, ריזאַלטינג אין אַ גאַנץ פון 17,689 BGC.
די נייַקייַט פון GCC און GCF איז אַססעססעד באזירט אויף די דיסטאַנסע צווישן די קאַלקיאַלייטיד דאַטאַבייס (RefSeq דאַטאַבייס אין BiG-FAM) 29 און די יקספּערמענאַלי וועראַפייד (MIBIG 2.0) 30 BGC.פֿאַר יעדער פון די 17,689 רעפּריזענאַטיוו BGCs, מיר אויסדערוויילט דער קלענסטער קאָסינע דיסטאַנסע צו די ריספּעקטיוו דאַטאַבייס.די מינימום דיסטאַנסאַז זענען דעמאָלט אַוורידזשד (מיטן) לויט צו GCF אָדער GCC, ווי צונעמען.א GCF איז גערעכנט ווי נייַ אויב די דיסטאַנסע צו די דאַטאַבייס איז גרעסער ווי 0.2, וואָס קאָראַספּאַנדז צו אַן אידעאל צעשיידונג צווישן די (דורכשניטלעך) GCF און די רעפֿערענץ.פֿאַר GCC, מיר קלייַבן 0.4, וואָס איז צוויי מאָל די שוועל דיפיינד דורך GCF, צו פאַרשליסן אַ לאַנג-טערמין שייכות מיט לינקס.
די מעטאַגענאָמיק זעט פון BGC איז געווען עסטימאַטעד ווי די דורכשניטלעך זעט פון זייַן ביאָסינטעטיק גענעס (ווי באשלאסן דורך אַנטי-SMASH) בנימצא פֿון דזשין-מדרגה פּראָופיילז.די מעטאַגענאָמיק זעט פון יעדער GCF אָדער GCC איז געווען קאַלקיאַלייטיד ווי די סאַכאַקל פון רעפּריזענאַטיוו BGCs (פון 17,689).די זעט מאַפּס זענען דערנאָך נאָרמאַלייזד פֿאַר סעליאַלער זאַץ ניצן די פּער-מוסטער מאָטו ציילן, וואָס אויך אַקאַונאַד פֿאַר סיקוואַנסינג השתדלות (יקספּאַנדיד דאַטן, פייג. קסנומקסד).די פּרעוואַלאַנס פון GCF אָדער GCC איז קאַלקיאַלייטיד ווי דער פּראָצענט פון סאַמפּאַלז מיט אַ זעט > 0.
די עוקלידאַן דיסטאַנסע צווישן סאַמפּאַלז איז קאַלקיאַלייטיד פון די נאָרמאַלייזד GCF פּראָפיל.די דיסטאַנסאַז זענען רידוסט אין גרייס מיט UMAP77 און די ריזאַלטינג עמבעדינגז זענען געניצט פֿאַר אַנסופּערווייזד געדיכטקייַט-באזירט קלאַסטערינג ניצן HDBSCAN78.די אָפּטימאַל מינימום נומער פון פונקטן פֿאַר אַ קנויל (און דערפאר די נומער פון קלאַסטערז) געניצט דורך HDBSCAN איז באשלאסן דורך מאַקסאַמייזינג די קיומיאַלאַטיוו מאַשמאָעס פון קנויל מיטגלידערשאַפט.די יידענאַפייד קלאַסטערז (און אַ טראַפ-באַלאַנסט סאַבסאַמפּלע פון די קלאַסטערז צו חשבון פֿאַר פאָרורטייל אין פּערמוטיישאַנאַל מולטיוואַריאַט אַנאַליסיס פון וועריאַנס (PERMANOVA)) זענען טעסטעד פֿאַר באַטייַט קעגן אַנרעדוסט עוקלידיאַן דיסטאַנסאַז ניצן PERMANOVA.די דורכשניטלעך גענאָמע גרייס פון די סאַמפּאַלז איז קאַלקיאַלייטיד באזירט אויף די קאָרעוו זעט פון מאָטו און די עסטימאַטעד גענאָמע גרייס פון די מיטגלידער פון די גענאָמעס.אין באַזונדער, די דורכשניטלעך גענאָמע גרייס פון יעדער מאָטו איז עסטימאַטעד ווי די דורכשניטלעך פון די גענאָמע סיזעס פון זייַן מיטגלידער קערעקטאַד פֿאַר קאַמפּליטנאַס (נאָך פֿילטרירונג) (למשל, אַ 75% גאַנץ גענאָמע מיט אַ לענג פון 3 מב האט אַ אַדזשאַסטיד גרייס פון 4 מב).פֿאַר מיטל גענאָמעס מיט אָרנטלעכקייַט ≥70%.די דורכשניטלעך גענאָמע גרייס פֿאַר יעדער מוסטער איז דעמאָלט קאַלקיאַלייטיד ווי די סאַכאַקל פון מאָטו גענאָמע סיזעס ווייטעד דורך קאָרעוו זעט.
א פילטערד גאַנג פון גענאָמע-ענקאָודיד BGCs אין די OMD איז געוויזן אין באַקטיריאַל און אַרטשאַעאַל GTDB ביימער (אין ≥5 קב פראַמעוואָרקס, אַחוץ REF און SAG MarDB ניט געפֿונען אין 1038 מעטאַגענאָמעס, זען אויבן) און זייער פּרעדיקטעד פּראָדוקט קאַטעגאָריעס באזירט אויף די פילאָגענעטיק. שטעלע פון די גענאָמע (זען אויבן).מיר ערשטער רידוסט די דאַטן דורך מינים, ניצן די גענאָמע מיט די מערסט BGCs אין די מינים ווי רעפּריזענאַטיוו.פֿאַר וויזשוואַלאַזיישאַן, די פארשטייערס זענען ווייַטער צעטיילט אין בוים גרופּעס, און ווידער, פֿאַר יעדער סעלעד קלאַדע, די גענאָמע מיט די גרעסטע נומער פון BGCs איז אויסגעקליבן ווי אַ פארשטייער.BGC-ענריטשט מינים (לפּחות איין גענאָמע מיט> 15 BGCs) זענען ווייַטער אַנאַלייזד דורך קאַלקיאַלייטינג די שאַננאָן דייווערסיטי אינדעקס פֿאַר די פּראָדוקט טייפּס קאָדעד אין די BGCs.אויב אַלע פּרעדיקטעד פּראָדוקט טייפּס זענען די זעלבע, כעמישער כייבראַדז און אנדערע קאָמפּלעקס BGCs (ווי פּרעדיקטעד דורך אַנטי-SMAH) זענען גערעכנט צו געהערן צו דער זעלביקער פּראָדוקט טיפּ, ראַגאַרדלאַס פון זייער סדר אין דעם קנויל (למשל פּראָטעין-באַקטיריאָסין און באַקטעריאָסין-פּראָטעאָפּראָטעין פוסיאָן. גוף).כייבריד).
די רוען דנאַ (עסטימאַטעד צו זיין 6 נג) פֿון Malaspina מוסטער MP1648, קאָראַספּאַנדינג צו בייאַלאַדזשיקאַל מוסטער SAMN05421555 און מאַטשט צו Illumina SRR3962772 מעטאַגענאָמיק לייענען שטעלן פֿאַר קורץ לייענען, פּראַסעסט לויט PacBio סיקוואַנסינג פּראָטאָקאָל מיט הינטער-נידעריק אַרייַנשרייַב צו נוצן PacBelllification gDNA מוסטער. קיט (100-980-000) און SMRTbell Express 2.0 מוסטער צוגרייטונג קיט (100-938-900).בעקיצער, די רוען דנאַ איז געווען שנייַדן, ריפּערד און פּיוראַפייד (פּראָנעקס קרעלן) ניצן קאָוואַריס (ג-טובע, 52104).פּיוראַפייד דנאַ איז דערנאָך אונטערטעניק צו ביבליאָטעק צוגרייטונג, אַמפּלאַפאַקיישאַן, רייניקונג (פּראָנעקס קרעלן) און גרייס סעלעקציע (> 6 קב, בלו פּיפּפּין) איידער אַ לעצט רייניקונג שריט (פּראָנעקס קרעלן) און סיקוואַנסינג אויף די סעקוועל וו פּלאַטפאָרמע.
ריקאַנסטראַקשאַן פון די ערשטער צוויי קאַ.פֿאַר MAG Eremiobacterota, מיר יידענאַפייד זעקס נאָך אַניס> 99% (די זענען אַרייַנגערעכנט אין פיגורע 3), וואָס זענען טכילעס פילטערד באזירט אויף קאַנטאַמאַניישאַן סקאָרז (שפּעטער יידענאַפייד ווי דזשין דופּליקיישאַנז, זען ווייטער).מיר אויך געפונען אַ טאַץ מיטן נאָמען "קאַ".Eremiobacterota" פון פאַרשידן שטודיום23 און געוויינט זיי צוזאַמען מיט אַכט MAGs פון אונדזער לערנען ווי אַ רעפֿערענץ פֿאַר מעטאַגענאָמיק לייענען פון 633 עוקאַריאָטיק ענריטשט (>0.8 μm) סאַמפּאַלז ניצן BWA (v.0.7.17) Ref -r1188, - אַ פאָן) פֿאַר דאַונסאַמפּאַלד מאַפּינג (5 מיליאָן לייענען).באַזירט אויף ענריטשמענט-ספּעציפיש מאַפּס (פילטערד דורך 95% אַליינמאַנט אידענטיטעט און 80% לייענען קאַווערידזש), 10 מעטאַגענאָמעס (געריכט קאַווערידזש ≥5 ×) זענען אויסגעקליבן פֿאַר פֿאַרזאַמלונג און נאָך 49 מעטאַגענאָמעס (דערוואַרט קאַווערידזש ≥1 ×) פֿאַר אינהאַלט קאָראַליישאַן.ניצן די זעלבע פּאַראַמעטערס ווי אויבן, די סאַמפּאַלז זענען בינדן און 10 נאָך 'Ca's זענען צוגעגעבן.MAG Eremiobacterota איז געזונט.די 16 MAGs (ניט קאַונטינג די צוויי שוין אין די דאַטאַבייס) ברענגען די גאַנץ נומער פון גענאָמעס אין די יקספּאַנדיד אָמד צו 34,815.MAGs זענען אַסיינד טאַקסאָנאָמיק רייען באזירט אויף זייער גענאָמיק ענלעכקייט און שטעלע אין די GTDB.18 מאַגס זענען דערעפּליקאַטעד ניצן דרעפּ אין 5 מינים (ינטראַספּעסיפיק אַני>99%) און 3 גענעראַ (ינטראַגענעריק אַני 85% צו 94%) אין דער זעלביקער משפּחה79.מינים פארשטייערס זענען מאַניואַלי אויסגעקליבן באזירט אויף אָרנטלעכקייַט, קאַנטאַמאַניישאַן און N50.סאַגדזשעסטיד נאַמאַנקלאַטורע איז צוגעשטעלט אין די סאַפּלאַמענטערי אינפֿאָרמאַציע.
אַססעסס די אָרנטלעכקייַט און קאַנטאַמאַניישאַן פון 'קאַ.MAG Eremiobacterota, מיר אַססעססעד די בייַזייַן פון uscMG, ווי געזונט ווי ייכעס- און פעלד-ספּעציפיש איין-קאָפּיע מאַרקער דזשין שטעלט געניצט דורך CheckM און Anvi'o.די לעגיטימאַציע פון 2 דופּליקאַטן פון 40 uscMGs איז באשטעטיקט דורך פילאָגענעטיק ריקאַנסטראַקשאַן (זען ווייטער) צו ויסשליסן קיין פּאָטענציעל קאַנטאַמאַניישאַן (דאָס קאָראַספּאַנדז צו 5% באזירט אויף די 40 מאַרקער גענעס).אַן נאָך לערנען פון פינף רעפּריזענאַטיוו MAGs 'Ca.די נידעריק מדרגה פון קאַנטאַמאַנאַנץ אין די ריקאַנסטראַקטיד גענאָמעס איז באשטעטיקט פֿאַר Eremiobacterota מינים ניצן די ינטעראַקטיוו אַנווי'אָ צובינד באזירט אויף שפע און סיקוואַנס זאַץ קאָראַליישאַנז (סופּפּלעמענטאַרי אינפֿאָרמאַציע)59.
פֿאַר פילאָגענאָמיק אַנאַליסיס, מיר אויסגעקליבן פינף רעפּריזענאַטיוו MAGs "Ca".Eudormicrobiaceae, אַלע מינים "Ca.די גענאָמע פון ערעמיאָבאַקטעראָטאַ און מיטגלידער פון אנדערע פילאַ (אַרייַנגערעכנט UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria and Planctomycetota) איז בנימצא פון GTDB (r89)13.אַלע פון די גענאָמעס זענען אַנאַטייטיד ווי פריער דיסקרייבד פֿאַר איין קאָפּיע מאַרקער דזשין יקסטראַקשאַן און BGC אַנאַטיישאַן.די GTDB גענאָמעס זענען קאַנסערווד לויט די אויבן אָרנטלעכקייַט און קאַנטאַמאַניישאַן קרייטיריאַ.פילאָגענעטיק אַנאַליסיס איז דורכגעקאָכט מיט די Anvi'o Phylogenetics59 וואָרקפלאָוו.דער בוים איז געווען קאַנסטראַקטאַד ניצן IQTREE (v.2.0.3) (פעליקייַט אָפּציעס און -בב 1000) 80 אויף אַ אַליינמאַנט פון 39 טאַנדאַם ריבאָסאָמאַל פּראָטעינס יידענאַפייד דורך אַנווי'אָ (מוסקל, וו.3.8.1551)81.זיינע שטעלעס זענען רידוסט.צו דעקן בייַ מינדסטער 50% פון די גענאָמע82 און פּלאַנקטאָמיסעקאָטאַ איז געניצט ווי אַ אַוטגראָופּ באזירט אויף די GTDB בוים טאַפּאַלאַדזשי.איין בוים פון 40 uscMGs איז געבויט מיט די זעלבע מכשירים און פּאַראַמעטערס.
מיר געוויינט Traitar (v.1.1.2) מיט פעליקייַט פּאַראַמעטערס (פענאָטיפּע, פֿון נוקלעאָטידעס) 83 צו פאָרויסזאָגן פּראָסט מייקראָוביאַל טרייץ.מיר ויספאָרשן אַ פּאָטענציעל באַפאַלעריש לייפסטייל באזירט אויף אַ פריער דעוועלאָפּעד באַפאַלעריש אינדעקס84 וואָס דעפּענדס אויף די אינהאַלט פון אַ פּראָטעין-קאָדינג דזשין אין די גענאָמע.ספּאַסיפיקלי, מיר נוצן DIAMOND צו פאַרגלייַכן פּראָטעינס אין די גענאָמע קעגן די OrthoMCL דאַטאַבייס (v.4) 85 ניצן די אָפּציעס -מער-שענסיוו -יד 25 -קווערי-דעק 70 -subject-cover 70 -top 20 און ציילן די גענעס קאָראַספּאַנדינג צו די מאַרקער גענעס פֿאַר פּרעדאַטערז און ניט-פּרעדאַטערז.דער אינדעקס איז דער חילוק צווישן די נומער פון באַפאַלעריש און ניט-באַפאַלעריש מאַרקינגז.ווי אַן נאָך קאָנטראָל, מיר אויך אַנאַלייזד די "קאַ" גענאָמע.די Entotheonella TSY118 פאַקטאָר איז באזירט אויף זייַן פאַרבאַנד מיט Ca.Eudoremicrobium (גרויס גענאָמע גרייס און בייאָוסינטעטיק פּאָטענציעל).דערנאָך, מיר טעסטעד פּאָטענציעל פֿאַרבינדונגען צווישן פּרעדאַטער און ניט-פּרעדאַטאָר מאַרקער גענעס און די בייאָוסינטעטיק פּאָטענציעל פון Ca.Eudormicrobiaceae" און געפונען אַז ניט מער ווי איין דזשין (פון קיין טיפּ פון מאַרקער דזשין, ד"ה פּרעדאַטער / ניט-פּרעדאַטאָר דזשין) אָוווערלאַפּס מיט BGC, סאַגדזשעסטינג אַז BGC קען נישט צעמישן פּרעדאַטיאָן סיגנאַלז.נאָך גענאָמיק אַנאַטיישאַן פון סקראַמבאַלד רעפּלאַקאַנז איז דורכגעקאָכט מיט TXSSCAN (v.1.0.2) צו ספּאַסיפיקלי ונטערזוכן די ויסשיידונג סיסטעם, פּילי און פלאַגעללאַ86.
פינף רעפּריזענאַטיוו 'Ca's זענען מאַפּט דורך מאַפּינג 623 מעטאַטראַנסקריפּטאָמעס פון די פּראָקאַריאָטיק און עוקאַריאָטיק ענריטשמענט פראַקשאַנז פון די טאַראַ אָושאַנז 22,40,87 (ניצן BWA, v.0.7.17-r1188, -אַ פאָן).Eudormicrobiaceae גענאָמע.BAM טעקעס זענען פּראַסעסט מיט FeatureCounts (v.2.0.1)88 נאָך 80% לייענען קאַווערידזש און 95% אידענטיטעט פֿילטרירונג (מיט אָפּציעס שטריךקאָונץ -ערשטיק -אָ -פראַקשאַן -ט CDS,tRNA -F GTF -g ID -p ) קאַונץ די נומער פון ינסערץ פּער דזשין.די דזשענערייטאַד מאַפּס זענען נאָרמאַלייזד פֿאַר דזשין לענג און מאַרקער דזשין זעט מאָTU (לענג-נאָרמאַלייזד דורכשניטלעך ינסערשאַן ציילן פֿאַר גענעס מיט ינסערשאַן ציילן> 0) און קלאָץ-טראַנספאָרמעד צו 22.74 צו באַקומען די קאָרעוו אויסדרוק פּער צעל פון יעדער דזשין מדרגה, וואָס אויך דערקלערט די וועריאַביליטי פון מוסטער צו מוסטער בעשאַס סיקוואַנסינג.אַזאַ ריישיאָוז לאָזן פֿאַר קאָמפּאַראַטיווע אַנאַליסיס, מיטאַגייטינג קאַמפּאַזישאַן פּראָבלעמס ווען ניצן קאָרעוו זעט דאַטן.בלויז סאַמפּאַלז מיט> 5 פון די 10 מאָטו מאַרקער גענעס זענען קאַנסידערד פֿאַר ווייַטער אַנאַליסיס צו לאָזן אַ גרויס גענוג חלק פון די גענאָמע צו זיין דיטעקטאַד.
די נאָרמאַלייזד טראַנסקריפּטאָמע פּראָפיל פון 'Ca.E. taraoceanii איז געווען אונטערטעניק צו דימענשאַנאַליטי רעדוקציע ניצן UMAP און די ריזאַלטינג פאַרטרעטונג איז געניצט פֿאַר אַנסופּערווייזד קלאַסטערינג ניצן HDBSCAN (זען אויבן) צו באַשטימען אויסדרוק סטאַטוס.PERMANOVA טעסץ די באַטייַט פון דיפעראַנסיז צווישן יידענאַפייד קלאַסטערז אין דער אָריגינעל (ניט רידוסט) דיסטאַנסע פּלאַץ.דיפערענטשאַל אויסדרוק צווישן די באדינגונגען איז טעסטעד איבער די גענאָמע (זען אויבן) און 201 KEGG פּאַטווייז זענען יידענאַפייד אין 6 פאַנגקשאַנאַל גרופּעס, ניימלי: BGC, ויסשיידונג סיסטעם און פלאַגעללאַר גענעס פֿון TXSSCAN, דערנידעריקונג ענזימעס (פּראָטעאַסע און פּעפּטיידאַסאַז), און באַפאַלעריש און ניט- באַפאַלעריש גענעס.באַפאַלעריש אינדעקס מאַרקערס.פֿאַר יעדער מוסטער, מיר קאַלקיאַלייטיד די מידיאַן נאָרמאַלייזד אויסדרוק פֿאַר יעדער קלאַס (באַמערקונג אַז BGC אויסדרוק זיך איז קאַלקיאַלייטיד ווי די מידיאַן אויסדרוק פון ביאָסינטעטיק גענעס פֿאַר אַז BGC) און טעסטעד פֿאַר באַטייַט אין שטאַטן (Kruskal-Wallis פּרובירן אַדזשאַסטיד פֿאַר FDR).
סינטעטיש גענעס זענען פּערטשאַסט פֿון GenScript און PCR פּרימערז זענען פּערטשאַסט פֿון Microsynth.פוסיאָן פּאָלימעראַסע פֿון Thermo Fisher Scientific איז געניצט פֿאַר דנאַ אַמפּלאַפאַקיישאַן.NucleoSpin פּלאַסמיידז, NucleoSpin געל און PCR רייניקונג קיט פון Macherey-Nagel זענען געניצט פֿאַר דנאַ רייניקונג.ריסטריקשאַן ענזימעס און ט 4 דנאַ ליגאַסע זענען פּערטשאַסט פֿון ניו ענגלאַנד ביאָלאַבס.קעמיקאַלז אנדערע ווי יסאָפּראָפּיל-β-ד-1-טהיאָגאַלאַקטאָפּיראַנאָסידע (IPTG) (ביאָסינטה) און 1,4-דיטהיאָטהרעיטאָל (דטט, אַפּפּליטשעם) זענען פּערטשאַסט פֿון Sigma-Aldrich און געוויינט אָן ווייַטער רייניקונג.די אַנטיביאַטיקס טשלאָראַמפעניקאָל (קם), ספּעקטינאָמיסין דיהידראָטשלאָרידע (סם), אַמפּיסיללין (אַמפּ), גענטאַמיסין (גט), און קאַרבעניסיללין (קבן) זענען פּערטשאַסט פֿון אַפּפּליטשעם.Bacto Tryptone און Bacto Yeast Extract מעדיע קאַמפּאָונאַנץ זענען פּערטשאַסט פֿון BD Biosciences.טריפּסין פֿאַר סיקוואַנסינג איז פּערטשאַסט פֿון פּראָמעגאַ.
דזשין סיקוואַנסיז זענען יקסטראַקטיד פון אַנטי-SMASH פּרעדיקטעד BGC 75.1.E. malaspinii (סופּפּלעמענטאַרי אינפֿאָרמאַציע).
די גענעס embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), און embAM (אַרייַנגערעכנט ינטערדזשין מקומות) זענען קאַנסטראַקטאַד מיט סינטהעטיק 5 און אָפּטימום 5 סיקוואַנסאַז מיט פּUCR יזעד פֿאַר אויסדרוק אין E ווען.די embA דזשין איז געווען סאַבקלאַנד אין דער ערשטער קייפל קלאָונינג פּלאַץ (MCS1) פון pACYCDuet-1 (CmR) און pCDFDuet-1 (SmR) מיט BamHI און HindIII קלעאַוואַגע זייטלעך.די embM און embMopt גענעס (קאָדאָן-אָפּטימיזעד) זענען סאַבקלאַנד אין MCS1 pCDFDuet-1 (SmR) מיט BamHI און HindIII און געשטעלט אין די רגע קייפל קלאָונינג פּלאַץ פון pCDFDuet-1 (SmR) און pRSFDuet-1 (KanR) (MCS2) מיט NdeI/ChoI.די embAM קאַסעט איז געווען סאַבקלאַנד אין pCDFDuet1 (SmR) מיט BamHI און HindIII קלעאַוואַגע זייטלעך.די אָרפ3 / עמבי דזשין (לאָקוס, MALA_SAMN05422137_METAG-scaffold_127-gene_3) איז קאַנסטראַקטאַד דורך אָוווערלאַפּ פאַרלענגערונג פּקר ניצן אָנפאַנגערס EmbI_OE_F_NdeI און EmbI_OE_R_XhoI, דיידזשעסטיד מיט NdeI / XhoI, און ליגאַטעד אין די זעלבע ענזימעס (MCS-1 PS-1) ענזימעס. לענדינג טיש).6).ריסטריקשאַן ענזיים דיידזשעסטשאַן און ליגיישאַן איז דורכגעקאָכט לויט דער פּראָטאָקאָל פון דער פאַבריקאַנט (ניו ענגלאַנד ביאָלאַבס).
פּאָסטן צייט: מערץ 14-2023