Сварные спиральные трубы из нержавеющей стали 304, химический компонент трубок, биосинтетический потенциал глобального морского микробиома

Благодарим вас за посещение Nature.com.Вы используете версию браузера с ограниченной поддержкой CSS.Для оптимальной работы мы рекомендуем вам использовать обновленный браузер (или отключить режим совместимости в Internet Explorer).Кроме того, для обеспечения постоянной поддержки мы показываем сайт без стилей и JavaScript.
Слайдеры, показывающие по три статьи на слайде.Используйте кнопки «Назад» и «Далее» для перемещения по слайдам или кнопки контроллера слайдов в конце для перемещения по каждому слайду.

Подробное описание продукта

Сварные гибкие трубы из нержавеющей стали 304
1. Спецификация: змеевиковая трубка/трубка из нержавеющей стали.
2. Тип: сварной или бесшовный.
3. Стандарт: АСТМ А269, АСТМ А249.
4. Змеевиковая трубка из нержавеющей стали, внешний диаметр: от 6 до 25,4 мм.
5. Длина: 600-3500 мм или по требованию заказчика.
6. Толщина стенки: от 0,2 до 2,0 мм.

7. Допуск: наружный диаметр: +/- 0,01 мм;Толщина: +/- 0,01%.

8. Размер внутреннего отверстия катушки: 500-1500 мм (можно регулировать в соответствии с требованиями заказчика)

9. Высота катушки: 200-400 мм (можно регулировать в соответствии с требованиями заказчика)

10. Поверхность: яркая или отожженная.
11. Материал: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, сплав 625, 825, 2205, 2507 и т. д.
12. Упаковка: тканые мешки в деревянном ящике, деревянном поддоне, деревянном валу или по требованию заказчика.
13. Испытание: химический компонент, предел текучести, предел прочности, измерение твердости.
14. Гарантия: проверка третьей стороной (например: SGS TV) и т. д.
15. Применение: отделка, мебель, транспортировка нефти, теплообменники, изготовление перил, производство бумаги, автомобилестроение, пищевая промышленность, медицина и т. д.

Весь химический состав и физические свойства нержавеющей стали приведены ниже:

Материал ASTM A269 Химический состав % Макс.
C Mn P S Si Cr Ni Mo Примечание: Nb Ti
ТП304 0,08 2.00 0,045 0,030 1.00 18,0-20,0 8,0-11,0 ^ ^ ^ . ^
ТП304Л 0,035 2.00 0,045 0,030 1.00 18,0-20,0 8,0-12,0 ^ ^ ^ ^
ТП316 0,08 2.00 0,045 0,030 1.00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
ТП316Л 0,035 Д 2.00 0,045 0,030 1.00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
ТП321 0,08 2.00 0,045 0,030 1.00 17,0-19,0 9,0-12,0 ^ ^ ^ 5С -0,70
ТП347 0,08 2.00 0,045 0,030 1.00 17,0-19,0 9,0-12,0 10С -1,10 ^

 

Материал Термическая обработка Температура F (C) Мин. Твердость
Бринелл Роквелл
ТП304 Решение 1900 (1040) 192HBW/200HV 90HRB
ТП304Л Решение 1900 (1040) 192HBW/200HV 90HRB
ТП316 Решение 1900(1040) 192HBW/200HV 90HRB
ТП316Л Решение 1900(1040) 192HBW/200HV 90HRB
ТП321 Решение 1900(1040) Ф 192HBW/200HV 90HRB
ТП347 Решение 1900(1040) 192HBW/200HV 90HRB

 

НД, дюйм Допуск по наружному диаметру, дюймы (мм) Допуск WT % Допуск на длину, дюймы (мм)
+ -
≤ 1/2 ± 0,005 (0,13) ± 15 1 / 8 ( 3,2 ) 0
> 1/2 ~1 1/2 ± 0,005 (0,13) ± 10 1 / 8 (3,2) 0
> 1 1/2 ~< 3 1/2 ± 0,010 (0,25) ± 10 3 / 16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015 (0,38) ± 10 3 / 16 (4,8) 0
> 5 1/2 ~< 8 ± 0,030 (0,76) ± 10 3 / 16 (4,8) 0
8~< 12 ± 0,040 (1,01) ± 10 3 / 16 (4,8) 0
12~< 14 ± 0,050 (1,26) ± 10 3 / 16 (4,8) 0

Природные микробные сообщества филогенетически и метаболически разнообразны.Помимо малоизученных групп организмов1, это разнообразие также несет в себе богатый потенциал для открытия экологически и биотехнологически значимых ферментов и биохимических соединений2,3.Однако изучение этого разнообразия для определения геномных путей, которые синтезируют такие соединения и связывают их с соответствующими хозяевами, остается сложной задачей.Биосинтетический потенциал микроорганизмов в открытом океане остается в значительной степени неизвестным из-за ограничений в анализе данных разрешения всего генома в глобальном масштабе.Здесь мы исследуем разнообразие и разнообразие кластеров биосинтетических генов в океане, интегрируя около 10 000 микробных геномов из культивируемых клеток и отдельных клеток с более чем 25 000 недавно реконструированных черновых геномов из более чем 1000 образцов морской воды.Эти усилия выявили около 40 000 предполагаемых, в основном новых кластеров биосинтетических генов, некоторые из которых были обнаружены в ранее не подозревавшихся филогенетических группах.В этих популяциях мы идентифицировали линию, обогащенную кластерами биосинтетических генов («Candidatus Eudormicrobiaceae»), которая принадлежала к некультивируемому бактериальному типу и включала некоторые из наиболее биосинтетически разнообразных микроорганизмов в этой среде.Из них мы охарактеризовали фосфатазо-пептидный и питонамидный пути, выявив случаи необычной структуры и энзимологии биологически активных соединений соответственно.В заключение, это исследование демонстрирует, как стратегии, основанные на микробиоме, могут позволить исследовать ранее неописанные ферменты и натуральные продукты питания в плохо изученной микробиоте и окружающей среде.
Микробы управляют глобальными биогеохимическими циклами, поддерживают пищевые сети и поддерживают здоровье растений и животных5.Их огромное филогенетическое, метаболическое и функциональное разнообразие представляет собой богатый потенциал для открытия новых таксонов1, ферментов и биохимических соединений, включая природные продукты6.В экологических сообществах эти молекулы обеспечивают микроорганизмам множество физиологических и экологических функций, от общения до конкуренции 2,7 .Помимо своих первоначальных функций, эти натуральные продукты и генетически закодированные пути их производства служат примерами биотехнологического и терапевтического применения2,3.Идентификация таких путей и связей во многом облегчилась изучением культивируемых микробов.Однако таксономические исследования природных сред показали, что подавляющее большинство микроорганизмов не культивируются8.Эта культурная предвзятость ограничивает нашу способность использовать функциональное разнообразие, закодированное многими микробами4,9.
Чтобы преодолеть эти ограничения, технологические достижения за последнее десятилетие позволили исследователям напрямую (т.е. без предварительного культивирования) секвенировать фрагменты микробной ДНК из целых сообществ (метагеномика) или отдельных клеток.Способность собирать эти фрагменты в более крупные фрагменты генома и реконструировать множественные метагеномно собранные геномы (MAG) или одиночные амплифицированные геномы (SAG), соответственно, открывает важную возможность для таксоцентрических исследований микробиома (т.е. микробных сообществ и микробиома).проложить новые пути.собственный генетический материал в данной среде) 10,11,12.Действительно, недавние исследования значительно расширили филогенетическое представление микробного разнообразия на Земле1, 13 и выявили большую часть функционального разнообразия в отдельных микробных сообществах, ранее не охваченного культивируемыми эталонными геномными последовательностями микроорганизмов (REF)14.Способность помещать необнаруженное функциональное разнообразие в контекст генома хозяина (т.е. разрешение генома) имеет решающее значение для прогнозирования еще не охарактеризованных микробных линий, которые предположительно кодируют новые природные продукты15,16, или для отслеживания таких соединений до их первоначального производителя17.Например, комбинированный подход к метагеномному и одноклеточному геномному анализу привел к идентификации Candidatus Entotheonella, группы метаболически богатых бактерий, связанных с губками, как продуцентов различных потенциальных лекарственных средств18.Однако, несмотря на недавние попытки геномного исследования разнообразных микробных сообществ16,19, более двух третей глобальных метагеномных данных для крупнейшего океана экосистем Земли16,20 все еще отсутствуют.Таким образом, в целом биосинтетический потенциал морского микробиома и его потенциал как хранилища новых ферментных и натуральных продуктов остаются в значительной степени недостаточно изученными.
Чтобы изучить биосинтетический потенциал морских микробиомов в глобальном масштабе, мы сначала объединили геномы морских микробов, полученные с использованием культурально-зависимых и некультуральных методов, чтобы создать обширную базу данных по филогенетике и функциям генов.Изучение этой базы данных выявило большое разнообразие кластеров биосинтетических генов (BGC), большинство из которых принадлежат к еще не охарактеризованным семействам кластеров генов (GCF).Кроме того, мы идентифицировали неизвестное семейство бактерий, которое на сегодняшний день демонстрирует самое большое известное разнообразие BGC в открытом океане.Мы выбрали два пути рибосомального синтеза и посттрансляционно модифицированных пептидов (RiPP) для экспериментальной проверки на основании их генетических отличий от известных в настоящее время путей.Функциональная характеристика этих путей выявила неожиданные примеры энзимологии, а также структурно необычные соединения с ингибирующей протеазу активностью.
Сначала мы стремились создать глобальный ресурс данных для анализа генома, сосредоточив внимание на его бактериальных и архейных компонентах.С этой целью мы объединили метагеномные данные и 1038 проб морской воды из 215 глобально распределенных точек отбора проб (диапазон широт = 141,6°) и нескольких глубоких слоев (от 1 до 5600 м в глубину, охватывающих пелагическую, мезопелагическую и абиссальную зоны).Предыстория21,22,23 (рис. 1а, расширенные данные, рис. 1а и дополнительная таблица 1).Эти выборочно отфильтрованные образцы не только обеспечили широкий географический охват, но и позволили нам сравнить различные компоненты морского микробиома, в том числе богатые вирусами (<0,2 мкм), богатые прокариотами (0,2–3 мкм), богатые частицами (0,8 мкм). ).–20 мкм) и обедненные вирусом (>0,2 мкм) колонии.
а, Всего 1038 общедоступных геномов (метагеномика) морских микробных сообществ, собранных из 215 точек по всему миру (от 62°ю.ш. до 79°с.ш. и от 179°з.д. до 179°в.д.).Фрагменты карты © Esri.Источники: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ и Esri.б — эти метагеномы были использованы для реконструкции MAG (методы и дополнительная информация), которые различаются по количеству и качеству (методы) в наборах данных (отмечены цветом).Реконструированные MAG были дополнены общедоступными (внешними) геномами, включая созданные вручную MAG26, SAG27 и REF.27 Скомпилируйте OMD.c, по сравнению с предыдущими отчетами, основанными только на SAG (GORG)20 или MAG (GEM)16, OMD улучшает геномную характеристику морских микробных сообществ (скорость картирования метагеномного считывания; метод) в два-три раза с более последовательным представлением по глубине и широта..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, группировка OMD по уровню кластеров видов (средняя идентичность нуклеотидов 95%) идентифицирует всего около 8300 видов, более половины из которых ранее не были охарактеризованы по таксономическим аннотациям с использованием GTDB (версия 89) е, классификация видов по типу генома показала, что MAG, SAG и REFs хорошо дополняют друг друга, отражая филогенетическое разнообразие морской микробиом.В частности, 55%, 26% и 11% видов были специфичны для MAG, SAG и REF соответственно.BATS, временной ряд Бермудских островов в Атлантическом океане;GEM — геномы микробиома Земли;GORG, эталонный геном глобального океана;ГОРЯЧИЙ, временной ряд Гавайского океана.
Используя этот набор данных, мы реконструировали в общей сложности 26 293 MAG, в основном бактериальных и архейных (рис. 1б и расширенные данные, рис. 1б).Мы создали эти MAG из сборок отдельных, а не объединенных метагеномных образцов, чтобы предотвратить коллапс вариаций естественной последовательности между образцами из разных мест или моментов времени (методов).Кроме того, мы сгруппировали фрагменты генома на основе корреляций их распространенности в большом количестве выборок (от 58 до 610 образцов в зависимости от опроса и метода).Мы обнаружили, что это трудоемкий, но важный шаг24, который был пропущен в нескольких масштабных работах по реконструкции МАГ16, 19, 25 и значительно улучшает количество (в среднем в 2,7 раза) и качество (в среднем +20%) геном.реконструирован на основе изученного здесь морского метагенома (расширенные данные, рис. 2а и дополнительная информация).В целом эти усилия привели к увеличению количества морских микробных MAG в 4,5 раза (в 6 раз, если рассматривать только высококачественные MAG) по сравнению с наиболее полным ресурсом MAG, доступным сегодня16 (Методы).Этот недавно созданный набор MAG был затем объединен с 830 тщательно подобранными MAG26, 5969 SAG27 и 1707 REF.Двадцать семь видов морских бактерий и архей составили комбинаторную коллекцию из 34 799 геномов (рис. 1б).
Затем мы оценили недавно созданный ресурс, чтобы улучшить его способность представлять морские микробные сообщества и оценить влияние интеграции различных типов генома.В среднем мы обнаружили, что он охватывает примерно 40-60% морских метагеномных данных (рис. 1c), что в два-три раза превышает охват предыдущих отчетов только MAG как по глубине, так и по широте More Serial 16 или SAG20.Кроме того, для систематического измерения таксономического разнообразия в установленных коллекциях мы аннотировали все геномы, используя набор инструментов (методов) Базы данных таксономии генома (GTDB), и использовали среднюю идентичность нуклеотидов по всему геному, равную 95%.28 для выявления 8304 видовых кластеров (видов).Две трети этих видов (включая новые клады) ранее не появлялись в GTDB, из них 2790 были обнаружены с помощью реконструированного в данной работе MAG (рис. 1г).Кроме того, мы обнаружили, что разные типы геномов высокодополнительны: 55%, 26% и 11% видов полностью состоят из MAG, SAG и REF соответственно (рис. 1д).При этом MAG охватывал все 49 типов, обнаруженных в толще воды, тогда как SAG и REF представляли лишь 18 и 11 из них соответственно.Однако SAG лучше отражает разнообразие наиболее распространенных клад (расширенные данные, рис. 3а), таких как Pelagic Bacteriales (SAR11), при этом SAG охватывает почти 1300 видов, а MAG - только 390 видов.Примечательно, что REF редко перекрывались с MAG или SAG на видовом уровне и представляли >95% из примерно 1000 геномов, не обнаруженных в изученных здесь метагеномных наборах открытого океана, в основном из-за взаимодействия с другими типами изолированных репрезентативных морских образцов (например, отложениями). .или партнер-хозяин).Чтобы сделать его широко доступным для научного сообщества, этот ресурс морского генома, который также включает неклассифицированные фрагменты (например, из предсказанных фагов, геномных островов и фрагментов генома, по которым недостаточно данных для реконструкции MAG), можно сравнить с таксономическими данными. .Доступ к аннотациям, функциям генов и контекстуальным параметрам в базе данных микробиологии океана (OMD; https://microbiomics.io/ocean/).
Затем мы приступили к изучению богатства и новизны биосинтетического потенциала микробиомов открытого океана.С этой целью мы сначала использовали антиSMASH для всех MAG, SAG и REF, обнаруженных в 1038 морских метагеномах (методы), чтобы предсказать в общей сложности 39 055 BGC.Затем мы сгруппировали их в 6907 неизбыточных GCF и 151 популяцию кластеров генов (GCC; дополнительная таблица 2 и методы), чтобы учесть присущую избыточность (т. е. один и тот же BGC может быть закодирован в нескольких геномах) и метагеномные данные. Фрагментация концентрированных BGC.Неполные BGC, если таковые имеются (дополнительная информация), существенно не увеличивали количество GCF и GCC, соответственно, содержащих хотя бы один неповрежденный член BGC в 44% и 86% случаев.
На уровне GCC мы обнаружили широкий спектр предсказанных RiPP и других натуральных продуктов (рис. 2а).Среди них, например, арилполиены, каротиноиды, эктоины и сидерофоры относятся к GCC с широким филогенетическим распространением и высокой распространенностью в океанических метагеномах, что может свидетельствовать о широкой адаптации микроорганизмов к морской среде, включая устойчивость к активным формам кислорода, окислительный и осмотический стресс..или поглощение железа (дополнительная информация).Это функциональное разнообразие контрастирует с недавним анализом примерно 1,2 миллиона BGC среди примерно 190 000 геномов, хранящихся в базе данных NCBI RefSeq (BiG-FAM/RefSeq, в дальнейшем именуемым RefSeq)29, который показал, что нерибосомальные пептиды синтетазы (NRPS) и поликетидсинтаза (PKS) BGC (дополнительная информация).Мы также обнаружили 44 (29%) GCC, лишь отдаленно связанных с любым RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; рис. 2a и методы) и 53 (35%) GCC только в MAG, что подчеркивает потенциал для обнаружения ранее неописанных химических веществ в ОМД.Учитывая, что каждая из этих GCC, вероятно, представляет весьма разнообразные биосинтетические функции, мы дополнительно проанализировали данные на уровне GCF, чтобы предоставить более подробную группировку BGC, которые, по прогнозам, кодируют сходные природные продукты29.В общей сложности 3861 (56%) идентифицированный GCF не перекрывался с RefSeq, и >97% GCF не присутствовали в MIBiG, одной из крупнейших баз данных экспериментально подтвержденных BGC (рис. 2b).Хотя неудивительно обнаружить множество потенциальных новых путей в условиях, которые плохо представлены эталонным геномом, наш метод дерепликации BGC в GCF перед сравнительным анализом отличается от предыдущих отчетов 16 и позволяет нам обеспечить беспристрастную оценку новизны.Большая часть нового разнообразия (3012 GCF или 78%) соответствует предсказанным терпенам, RiPP или другим природным продуктам, а большая часть (1815 GCF или 47%) закодирована в неизвестных типах из-за их биосинтетического потенциала.В отличие от кластеров PKS и NRPS, эти компактные BGC с меньшей вероятностью будут фрагментированы во время метагеномной сборки 31 и позволяют более трудоемко и ресурсоемко определять функциональные характеристики своих продуктов.
Всего 39 055 BGC были сгруппированы в 6 907 GCF и 151 GCC.а — представление данных (внутреннее внешнее).Иерархическая кластеризация расстояний BGC на основе GCC, 53 из которых фиксируются только MAG.GCC содержит BGC из разных таксонов (ln-преобразованная частота гейта) и разных классов BGC (размер кружка соответствует его частоте).Для каждого GCC внешний слой представляет количество BGC, распространенность (процент образцов) и расстояние (минимальное косинусное расстояние BGC (min(dMIBiG))) от BiG-FAM до BGC.GCC с BGC, тесно связанными с экспериментально подтвержденными BGC (MIBiG), выделены стрелками.b При сравнении GCF с предсказанными (BiG-FAM) и экспериментально подтвержденными (MIBiG) BGC, был обнаружен 3861 новый (d–>0,2) GCF.Большинство (78%) из них кодируют RiPP, терпены и другие предполагаемые натуральные продукты.c, все геномы в OMD, обнаруженные в 1038 морских метагеномах, были помещены в базовое дерево GTDB, чтобы продемонстрировать филогенетический охват OMD.Клады без каких-либо геномов в OMD показаны серым цветом.Количество BGC соответствует наибольшему количеству предсказанных BGC на геном в данной кладе.Для наглядности последние 15% узлов свернуты.Стрелками указаны клады, богатые BGC (>15 BGC), за исключением Mycobacterium, Gordonia (уступающая только Rhodococcus) и Crocosphaera (уступающая только Synechococcus).д, Неизвестно c.Eremiobacterota продемонстрировала самое высокое биосинтетическое разнообразие (индекс Шеннона, основанный на типе природного продукта).Каждая полоса представляет собой геном с наибольшим количеством BGC у вида.Т1ПКС, ПКС типа I, Т2/3ПКС, ПКС типа II и типа III.
Помимо богатства и новизны, мы исследуем биогеографическую структуру биосинтетического потенциала морского микробиома.Группировка образцов по среднему метагеномному распределению числа копий GCF (Методы) показала, что низкоширотные, поверхностные, богатые прокариотами и бедные вирусами сообщества, в основном из поверхностных или более глубоких, освещенных солнцем вод, были богаты терпенами RiPP и BGC.Напротив, полярные, глубоководные, богатые вирусами и частицами сообщества были связаны с более высоким содержанием NRPS и PKS BGC (расширенные данные, рис. 4 и дополнительная информация).Наконец, мы обнаружили, что хорошо изученные тропические и пелагические сообщества являются наиболее многообещающими источниками новых терпенов (рисунок дополненных данных).Самый высокий потенциал для ПКС, РиПП и других натуральных продуктов (рис. 5а с расширенными данными).
Чтобы дополнить наше исследование биосинтетического потенциала морских микробиомов, мы стремились составить карту их филогенетического распределения и идентифицировать новые клады, обогащенные BGC.С этой целью мы поместили геномы морских микробов в нормализованное филогенетическое дерево бактерий и архей GTDB13 и наложили предполагаемые пути биосинтеза, которые они кодируют (рис. 2в).Мы легко обнаружили несколько клад, обогащенных BGC (представленных более чем 15 BGC), в образцах морской воды (методы), известных своим биосинтетическим потенциалом, таких как цианобактерии (Synechococcus) и бактерии Proteus, такие как Tistrella32,33, или недавно привлекшие внимание своими натуральные продукты.такие как Myxococcota (Sandaracinaceae), Rhodococcus и Planctomycetota34,35,36.Интересно, что в этих кладах мы обнаружили несколько ранее неизученных линий.Например, виды с самым богатым биосинтетическим потенциалом в типах Planctomycetota и Myxococcota принадлежали к неохарактеризованным отрядам-кандидатам и родам соответственно (дополнительная таблица 3).В совокупности это предполагает, что OMD обеспечивает доступ к ранее неизвестной филогенетической информации, включая микроорганизмы, которые могут представлять собой новые цели для открытия ферментов и натуральных продуктов.
Далее мы охарактеризовали кладу, обогащенную BGC, не только подсчитав максимальное количество BGC, кодируемых ее членами, но и оценив разнообразие этих BGC, что объясняет частоту появления различных типов естественных продуктов-кандидатов (рис. 2в и методы). )..Мы обнаружили, что в этом исследовании наиболее биосинтетически разнообразные виды были представлены специально сконструированными бактериальными MAG.Эти бактерии принадлежат к некультивируемому типу Candidatus Eremiobacterota, который остается практически неизученным, за исключением нескольких геномных исследований37,38.Примечательно, что «ок.Род Eremiobacterota анализировался только в наземной среде39, и неизвестно, включает ли он представителей, обогащенных BGC.Здесь мы реконструировали восемь MAG одного и того же вида (идентичность нуклеотидов > 99%) 23. Поэтому мы предлагаем название вида «Candidatus Eudoremicrobium Malaspinii», названное в честь нереиды (морской нимфы), прекрасного подарка в греческой мифологии и экспедициях.'Ка.Согласно филогенетической аннотации 13, E. Malaspinii не имеет ранее известных родственников ниже уровня последовательности и, таким образом, принадлежит к новому семейству бактерий, которое мы предлагаем «Ca.E. Malaspinii» в качестве типового вида и «Ca.Eudormicrobiaceae» в качестве официального названия (дополнительная информация).Краткая метагеномная реконструкция 'Ca.Проект генома E. Malaspinii был подтвержден с помощью метагеномного секвенирования с очень низким уровнем затрат, длительного считывания и целевой сборки одного образца (Методы) в виде одной линейной хромосомы размером 9,63 МБ с дупликацией 75 т.п.н.как единственная оставшаяся двусмысленность.
Чтобы установить филогенетический контекст этого вида, мы провели поиск 40 близкородственных видов в дополнительных метагеномных образцах, обогащенных эукариотами, из экспедиции в океан Тара, посредством целевой реконструкции генома.Вкратце, мы связали метагеномные чтения с геномными фрагментами, связанными с «Ca.E. Malaspinii» и предположили, что повышенный уровень пополнения в этой выборке указывает на наличие других родственников (методы).В результате мы обнаружили 10 MAG, комбинацию из 19 MAG, представляющих пять видов трех родов в рамках недавно определенного семейства (т.е. «Ca. Eudormicrobiaceae»).После ручной проверки и контроля качества (расширенные данные, рис. 6 и дополнительная информация) мы обнаружили, что «Ca.Виды Eudormicrobiaceae обладают более крупными геномами (8 МБ) и более богатым биосинтетическим потенциалом (от 14 до 22 BGC на вид), чем другие представители «Ca».Клада Eremiobacterota (до 7 BGC) (рис. 3а–в).
а, Филогенетическое положение пяти 'Ca.Виды Eudormicrobiaceae продемонстрировали богатство BGC, специфичное для морских линий, выявленных в этом исследовании.Филогенетическое древо включает все виды Ca.MAG Eremiobacterota и представители других типов (номера геномов в скобках), представленные в GTDB (версия 89), использовались для изучения эволюционного фона (Методы).Самые внешние слои представляют собой классификации на уровне семейства («Ca. Eudormicrobiaceae» и «Ca. Xenobiaceae») и на уровне класса («Ca. Eremiobacteria»).Пять видов, описанных в этом исследовании, представлены буквенно-цифровыми кодами и предлагаемыми биномиальными названиями (дополнительная информация).б, ок.Виды Eudormicrobiaceae имеют семь общих ядер BGC.Отсутствие BGC в кладе A2 было связано с неполнотой репрезентативного MAG (дополнительная таблица 3).BGC специфичны для «Ca.Амфитомикробий» и «Ca.Амфитомикробий» (клады А и В) не показаны.c, Все BGC, закодированные как «Ca.Было обнаружено, что Eudoremicrobium taraoceanii экспрессируется в 623 метатранскриптомах, взятых из океанов Тары.Сплошные кружки указывают на активную транскрипцию.Оранжевые кружки обозначают log2-преобразованные кратные изменения ниже и выше скорости экспрессии гена домашнего хозяйства (методы).d, кривые относительной распространенности (методы), показывающие 'Ca.Виды Eudormicrobiaceae широко распространены в большинстве бассейнов океана и во всей толще вод (от поверхности до глубины не менее 4000 м).Основываясь на этих оценках, мы обнаружили, что «Ca.На долю E. Malaspinii' приходится до 6% прокариотических клеток в глубоководных пелагических зерносвязанных сообществах.Вид считался присутствующим на участке, если он был обнаружен в любой части размера данного глубинного слоя.ИО – Индийский океан, НАО – Северная Атлантика, НКО – Северная часть Тихого океана, РС – Красное море, САО – Южная Атлантика, ЮК – Южный океан, СПО – Южная часть Тихого океана.
Изучение численности и распределения Ca.Eudormicrobiaceae, которая, как мы установили, преобладает в большинстве бассейнов океана, а также во всей толще воды (рис. 3г).На местном уровне они составляют 6% морского микробного сообщества, что делает их важной частью глобального морского микробиома.Кроме того, мы установили относительное содержание Ca.Виды Eudormicrobiaceae и уровень их экспрессии BGC были самыми высокими во фракции, обогащенной эукариотами (рис. 3в и расширенные данные, рис. 7), что указывает на возможное взаимодействие с твердыми частицами, включая планктон.Это наблюдение имеет некоторое сходство с наблюдением 'Ca.BGC Eudoremicrobium, которые производят цитотоксические природные продукты известными путями, могут проявлять хищническое поведение (дополнительная информация и расширенные данные, рисунок 8), подобно другим хищникам, которые специфически производят метаболиты, такие как Myxococcus41.Открытие ок.Eudormicrobiaceae в менее доступных (глубокий океан) или эукариотических, а не прокариотических образцах может объяснить, почему эти бактерии и их неожиданное разнообразие BGC остаются неясными в контексте исследований натуральных пищевых продуктов.
В конечном итоге мы стремились экспериментально подтвердить перспективность нашей работы, основанной на микробиоме, в открытии новых путей, ферментов и натуральных продуктов.Известно, что среди различных классов BGC путь RiPP кодирует богатое химическое и функциональное разнообразие благодаря различным посттрансляционным модификациям корового пептида зрелыми ферментами42.Поэтому мы выбрали два 'Ca.BGC RiPP Eudoremicrobium (рис. 3b и 4a-e) основаны на том же, что и любой известный BGC (\(\bar{d}\)MIBiG и \(\bar{d}\)RefSeq выше 0,2).
a–c, Гетерологичная экспрессия in vitro и ферментативные анализы in vitro нового (\(\bar{d}\)RefSeq = 0,29) кластера биосинтеза RiPP, специфичного для глубоководных видов Ca.E. Malaspinii' привела к образованию дифосфорилированных продуктов.в — модификации, идентифицированные с помощью МС/МС высокого разрешения (ВР) (фрагментация обозначена ионами b и y в химической структуре) и ЯМР (расширенные данные, рис. 9).d, этот фосфорилированный пептид демонстрирует низкое микромолярное ингибирование эластазы нейтрофилов млекопитающих, которое не обнаружено в контрольном пептиде и дегидратирующем пептиде (обезвоживание, вызванное химическим удалением).Эксперимент был повторен трижды с аналогичными результатами.Например, гетерологичная экспрессия второго нового \(\bar{d}\)RefSeq = 0,33) кластера биосинтеза белка проясняет функцию четырех зрелых ферментов, которые модифицируют основной пептид из 46 аминокислот.Остатки окрашиваются в соответствии с местом модификации, предсказанным с помощью HR-MS/MS, изотопной маркировки и ЯМР-анализа (дополнительная информация).Пунктирная окраска указывает на то, что модификация происходит по любому из двух остатков.Рисунок представляет собой компиляцию многочисленных гетерологичных конструкций, показывающих активность всех зрелых ферментов в одном ядре.h, Иллюстрация данных ЯМР для N-метилирования амида основной цепи.Полные результаты показаны на рис.10 с расширенными данными.i. Филогенетическое положение зрелого фермента белкового кластера FkbM среди всех доменов FkbM, обнаруженных в базе данных MIBiG 2.0, показывает фермент этого семейства с активностью N-метилтрансферазы (дополнительная информация).Показаны схематические диаграммы БГК (а, д), структур пептидов-предшественников (б, е) и предполагаемых химических структур натуральных продуктов (в, ж).
Первый путь RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) обнаружен только у глубоководных видов «Ca.E. Malaspinii» и коды Пептида-предшественника (рис. 4а, б).В этом зрелом ферменте мы идентифицировали единственный функциональный домен, гомологичный домену дегидратации лантипептидсинтазы, который обычно катализирует фосфорилирование и последующее удаление 43 (дополнительная информация).Поэтому мы прогнозируем, что модификация пептида-предшественника включает такую ​​двухэтапную дегидратацию.Однако с помощью тандемной масс-спектрометрии (МС/МС) и спектроскопии ядерного магнитного резонанса (ЯМР) мы идентифицировали полифосфорилированный линейный пептид (рис. 4в).Хотя это было неожиданно, мы обнаружили несколько доказательств того, что он является конечным продуктом: два разных гетерологичных хозяина и отсутствие дегидратации в анализах in vitro, идентификация ключевых остатков, мутировавших в сайте каталитической дегидратации зрелого фермента.все реконструировано «Ка».Геном E. Malaspinii (расширенные данные, рис. 9 и дополнительная информация) и, наконец, биологическая активность фосфорилированного продукта, а не химически синтезированной дегидратированной формы (рис. 4г).Фактически, мы обнаружили, что он проявляет низкую микромолярную ингибирующую протеазу активность в отношении нейтрофильной эластазы, сравнимую с другими родственными природными продуктами в диапазоне концентраций (IC50 = 14,3 мкМ) 44 , несмотря на то, что экологическая роль еще предстоит выяснить.На основании этих результатов мы предлагаем назвать путь «фосфептином».
Второй случай представляет собой сложный путь RiPP, специфичный для 'Ca.Было предсказано, что род Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) кодирует природные белковые продукты (рис. 4д).Эти пути представляют особый биотехнологический интерес из-за ожидаемой плотности и разнообразия необычных химических модификаций, установленных ферментами, кодируемыми относительно короткими BGCs45.Мы обнаружили, что этот белок отличается от ранее охарактеризованных белков тем, что у него отсутствует как основной мотив NX5N полицерамидов, так и лантиониновая петля ландорнамидов 46 .Чтобы преодолеть ограничения общих гетерологичных паттернов экспрессии, мы использовали их вместе с специальной системой Microvirgula aerodenitrificans для характеристики четырех ферментов зрелого пути (методов).Используя комбинацию МС/МС, изотопного мечения и ЯМР, мы обнаружили эти зрелые ферменты в ядре пептида, состоящем из 46 аминокислот (рис. 4f,g, расширенные данные, рис. 10–12 и дополнительная информация).Среди зрелых ферментов мы охарактеризовали первое появление члена 47 семейства FkbM O-метилтрансфераз в пути RiPP и неожиданно обнаружили, что этот зрелый фермент вызывает N-метилирование основной цепи (рис. 4h, i и дополнительная информация).Хотя эта модификация известна в природных продуктах NRP48, ферментативное N-метилирование амидных связей представляет собой сложную, но биотехнологически значимую реакцию49, которая до сих пор представляла интерес для семейства борозинов RiPP.Специфичность 50,51.Идентификация этой активности в других семействах ферментов и RiPP может открыть новые применения и расширить функциональное разнообразие белков 52 и их химическое разнообразие.На основании выявленных модификаций и необычной длины предлагаемой структуры продукта мы предлагаем путь, названный «питонамид».
Открытие неожиданной энзимологии в функционально охарактеризованном семействе ферментов иллюстрирует перспективность экологической геномики для новых открытий, а также иллюстрирует ограниченные возможности функциональных выводов, основанных только на гомологии последовательностей.Таким образом, вместе с сообщениями о неканонических биоактивных полифосфорилированных RiPPs, наши результаты демонстрируют ресурсоемкую, но решающую ценность для усилий синтетической биологии, направленных на полное раскрытие функционального богатства, разнообразия и необычных структур биохимических соединений.
Здесь мы демонстрируем диапазон биосинтетического потенциала, закодированного микробами, и их геномный контекст в глобальном морском микробиоме, способствуя будущим исследованиям, делая полученный ресурс доступным для научного сообщества (https://microbiomics.io/ocean/).Мы обнаружили, что большая часть его филогенетической и функциональной новизны может быть получена только путем реконструкции MAG и SAG, особенно в недостаточно используемых микробных сообществах, которые могли бы направлять будущие усилия по биоразведке.Хотя мы сосредоточимся здесь на «Ca.Eudormicrobiaceae» как линию, особенно биосинтетически «талантливую», многие из BGC, предсказанных в неоткрытой микробиоте, вероятно, кодируют ранее неописанные ферменты, которые дают соединения с экологически и/или биотехнологически значимыми действиями.
Наборы метагеномных данных из крупных океанографических исследований и исследований временных рядов с достаточной глубиной секвенирования были включены для максимального охвата глобальных морских микробных сообществ в океанских бассейнах, глубоких слоях и с течением времени.Эти наборы данных (дополнительная таблица 1 и рисунок 1) включают метагеномику образцов, собранных в океанах Тары (обогащенных вирусами, n = 190; обогащенных прокариотами, n = 180)12,22 и экспедиции BioGEOTRACES (n = 480).Временной ряд Гавайских океанов (HOT, n = 68), временной ряд Бермудских островов и Атлантики (BATS, n = 62)21 и экспедиция Маласпина (n = 58)23.Считывания секвенирования из всех метагеномных фрагментов были отфильтрованы по качеству с использованием BBMap (v.38.71) путем удаления адаптеров секвенирования из ридов, удаления ридов, сопоставленных с последовательностями контроля качества (геномы PhiX), и использования обрезки = 14, maq = 20 отбрасывает плохое качество считывания, maxns = 0 и minlength = 45. Последующие анализы выполнялись или объединялись с показаниями контроля качества, если указано (bbmerge.sh minoverlap=16).Показания контроля качества были нормализованы (целевое значение bbnorm.sh = 40, MindDeep = 0) перед сборкой с использованием метаSPAdes (v.3.11.1 или v.3.12, если необходимо)53.Полученные контиги каркаса (далее называемые каркасами) окончательно фильтровались по длине (≥1 кб).
1038 метагеномных образцов были разделены на группы, и для каждой группы образцов результаты метагеномного контроля качества всех образцов были сопоставлены со скобками каждого образца отдельно, в результате чего было получено следующее количество групповых прочтений в парных скобках: Tara Marine Viruses – Enriched (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT and BATS (610×610) и Malaspina (58×58).Картирование было выполнено с помощью Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, который позволяет сопоставлять показания со вторичными сайтами (с использованием флага -a).Выравнивания были отфильтрованы так, чтобы иметь длину не менее 45 оснований, иметь идентичность ≥97% и охватывать ≥80% чтений.Полученные файлы BAM были обработаны с использованием сценария jgi_summarize_bam_contig_eeps для MetaBAT2 (v.2.12.1)55, чтобы обеспечить охват внутри и между выборками для каждой группы.Наконец, скобки были сгруппированы для повышения чувствительности путем индивидуального запуска MetaBAT2 на всех образцах с –minContig 2000 и –maxEdges 500. Мы используем MetaBAT2 вместо ансамблевого боксера, поскольку в независимых тестах было показано, что он является наиболее эффективным одиночным боксером.и в 10–50 раз быстрее, чем другие широко используемые боксеры57.Чтобы проверить влияние корреляций численности, случайно выбранная подвыборка метагеномики (10 для каждого из двух наборов данных океана Тара, 10 для BioGEOTRACES, 5 для каждого временного ряда и 5 для Маласпины) дополнительно использовала только образцы.Внутренние выборки группируются для получения информации о покрытии.(Дополнительная информация).
В последующий анализ были включены дополнительные (внешние) геномы, а именно 830 выбранных вручную MAG из подмножества набора данных Tara Oceans26, 5287 SAG из набора данных GORG20 и данные из базы данных MAR (MarDB v. 4) из 1707 изолированных REF и 682 SAG) 27. Для набора данных MarDB геномы отбираются на основе доступных метаданных, если тип выборки соответствует следующему регулярному выражению: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] изолирован».
Качество каждого метагеномного контейнера и внешних геномов оценивалось с помощью CheckM (v.1.0.13) и Anvi'o's Lineage Workflow (v.5.5.0)58,59.Если CheckM или Anvi'o сообщает о полноте/полноте ≥50% и загрязнении/избыточности ≤10%, сохраните метагеномные клетки и внешние геномы для последующего анализа.Эти оценки затем были объединены в среднюю полноту (mcpl) и среднюю загрязненность (mctn) для классификации качества генома в соответствии с критериями сообщества60 следующим образом: высокое качество: mcpl ≥ 90% и mctn ≤ 5%;хорошее качество: mcpl ≥ 70%, mctn ≤ 10%, среднее качество: mcpl ≥ 50% и mctn ≤ 10%, удовлетворительное качество: mcpl ≤ 90% или mctn ≥ 10%.Отфильтрованные геномы затем коррелировали с показателями качества (Q и Q') следующим образом: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (вариабельность штамма)/100 + 0,5 x log[N50] .(реализовано в dRep61).
Чтобы обеспечить сравнительный анализ между различными источниками данных и типами геномов (MAG, SAG и REF), 34 799 геномов были разыменованы на основе средней идентичности нуклеотидов по всему геному (ANI) с использованием dRep (v.2.5.4).Повторы)61 с 95% порогами ANI28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) и однокопийными маркерными генами с использованием SpecI63, обеспечивающими кластеризацию генома на уровне вида.Репрезентативный геном был выбран для каждого кластера dRep в соответствии с максимальным показателем качества (Q'), определенным выше, который считался репрезентативным для вида.
Для оценки скорости картирования использовалась программа BWA (v.0.7.17-r1188, -a) для картирования всех 1038 наборов метагеномных чтений с 34 799 геномами, содержащимися в OMD.Считывания с контролем качества были картированы в одностороннем режиме, а полученные выравнивания были отфильтрованы, чтобы сохранить только выравнивания длиной ≥45 п.н.и идентичность ≥95%.Коэффициент отображения для каждого образца представляет собой процент показаний, оставшихся после фильтрации, разделенный на общее количество показаний контроля качества.Используя тот же подход, каждый из 1038 метагеномов был сокращен до 5 миллионов вставок (расширенные данные, рис. 1c) и сопоставлен с GORG SAG в OMD и во всех GEM16.Количество MAG, извлеченных из морской воды в каталоге GEM16, определялось по ключевым словам метагеномных источников, отбирая образцы морской воды (например, в отличие от морских отложений).В частности, мы выбираем «водный» в качестве «ecosystem_category», «морской» в качестве «ecosystem_type» и фильтруем «среду обитания» как «глубокий океан», «морской», «морской океанический», «пелагический морской», «морская вода», «Океан», «Морская вода», «Поверхностная морская вода», «Поверхностная морская вода».В результате было получено 5903 MAG (734 высокого качества), распределенных по 1823 OTU (просмотр здесь).
Геномы прокариот были таксономически аннотированы с использованием GTDB-Tk (v.1.0.2)64 с параметрами по умолчанию, ориентированными на GTDB r89 версии 13. Anvi'o использовался для идентификации геномов эукариот на основе предсказания домена и отзыва ≥50% и избыточности ≤ 10%.Таксономическая аннотация вида определяется как один из его репрезентативных геномов.За исключением эукариот (148 MAG), каждый геном сначала был функционально аннотирован с использованием prokka (v.1.14.5)65, называя полные гены, определяя при необходимости параметры «архей» или «бактерий», что также сообщается для не- кодирующие гены.и регионы CRISPR, среди других геномных особенностей.Аннотируйте предсказанные гены, идентифицируя универсальные маркерные гены с одной копией (uscMG) с помощью fetchMG (v.1.2)66, назначая группы ортологов и осуществляя запрос с помощью emapper (v.2.0.1)67 на основе eggNOG (v.5.0)68.База данных KEGG (опубликовано 10 февраля 2020 г.) 69. Последний шаг был выполнен путем сопоставления белков с базой данных KEGG с использованием DIAMOND (v.0.9.30)70 с запросом и охватом тем ≥70%.Результаты были дополнительно отфильтрованы в соответствии с конвейером аннотаций генома прокариот NCBI71 на основе битрейта ≥ 50% от максимального ожидаемого битрейта (сама ссылка).Последовательности генов также использовались в качестве входных данных для идентификации BGC в геноме с использованием antiSMASH (v.5.1.0)72 с параметрами по умолчанию и различными кластерными взрывами.Все геномы и аннотации были скомпилированы в OMD вместе с контекстными метаданными, доступными в Интернете (https://microbiomics.io/ocean/).
Подобно ранее описанным методам12,22 мы использовали CD-HIT (v.4.8.1) для кластеризации >56,6 миллионов генов, кодирующих белок, из геномов бактерий и архей из OMD в 95% идентичности и более коротких генов (охват 90%)73 до >17,7 миллионов кластеров генов.Самая длинная последовательность была выбрана в качестве репрезентативного гена для каждого кластера генов.Затем 1038 метагеномов были сопоставлены с> 17,7 миллионами членов кластера BWA (-a), и полученные файлы BAM были отфильтрованы, чтобы сохранить только совпадения с идентичностью ≥95% и выравниванием оснований ≥45.Нормализованное по длине обилие генов рассчитывали путем сначала подсчета вставок из наилучшего уникального выравнивания, а затем, для вставок с нечетким картированием, добавления дробных подсчетов к соответствующим целевым генам, пропорциональным количеству их уникальных вставок.
Геномы из расширенного OMD (с дополнительными MAG из «Ca. Eudormicrobiaceae», см. ниже) были добавлены в базу данных инструмента метагеномного анализа mOTUs74 (версия 2.5.1) для создания расширенной справочной базы данных mOTU.Из десяти uscMG выжило только шесть однокопийных геномов (23 528 геномов).Расширение базы данных привело к появлению 4494 дополнительных кластеров на видовом уровне.1038 метагеномов были проанализированы с использованием параметров mOTU по умолчанию (v.2).Всего 989 геномов, содержащихся в 644 кластерах mOTU (95% REF, 5% SAG и 99,9% принадлежащих MarDB), не были обнаружены профилем mOTU.Это отражает различные дополнительные источники морской изоляции геномов MarDB (большая часть невыявленных геномов связана с организмами, выделенными из донных отложений, морскими хозяевами и т. д.).Чтобы продолжить фокусироваться на среде открытого океана в этом исследовании, мы исключили их из последующего анализа, если они не были обнаружены или включены в расширенную базу данных mOTU, созданную в этом исследовании.
Все BGC из MAG, SAG и REF в OMD (см. выше) были объединены с BGC, идентифицированными во всех метагеномных каркасах (antiSMASH v.5.0, параметры по умолчанию) и охарактеризованы с использованием BiG-SLICE (v.1.1) (домен PFAM)75.Основываясь на этих функциях, мы вычислили все косинусные расстояния между BGC и сгруппировали их (средние ссылки) в GCF и GCC, используя пороговые значения расстояния 0,2 и 0,8 соответственно.Эти пороги представляют собой адаптацию порогов, ранее использовавшихся с использованием евклидова расстояния75 вместе с косинусным расстоянием, что уменьшает часть ошибок в исходной стратегии кластеризации BiG-SLICE (дополнительная информация).
Затем BGC были отфильтрованы, чтобы сохранить только ≥5 т.п.н., закодированных на каркасах, чтобы снизить риск фрагментации, как описано ранее16, и исключить MarDB REF и SAG, не обнаруженные в 1038 метагеномах (см. выше).В результате всего 39 055 BGC кодируются геномом OMD, а еще 14 106 идентифицируются на метагеномных фрагментах (т.е. не объединены в MAG).Эти «метагеномные» BGC использовались для оценки доли потенциала биосинтеза морского микробиома, не отраженного в базе данных (дополнительная информация).Каждый BGC был функционально охарактеризован в соответствии с прогнозируемыми типами продуктов, определенными категориями продуктов anti-SMASH или более грубыми, определенными в BiG-SCAPE76.Чтобы предотвратить систематическую ошибку выборки при количественной оценке (таксономический и функциональный состав GCC/GCF, расстояние между GCC и GCC до справочных баз данных и метагеномное обилие GCF), сохраняя только самые длинные BGC на GCF для каждого вида, 39 055 BGC были дополнительно дедуплицированы. в результате чего в общей сложности получилось 17 689 BGC.
Новизна GCC и GCF оценивалась по расстоянию между рассчитанной базой данных (база данных RefSeq в BiG-FAM)29 и экспериментально проверенной (MIBIG 2.0)30 BGC.Для каждого из 17 689 репрезентативных BGC мы выбрали наименьшее косинусное расстояние до соответствующей базы данных.Эти минимальные расстояния затем усредняются (среднее) согласно GCF или GCC, в зависимости от ситуации.ЗКФ считается новым, если расстояние до базы данных превышает 0,2, что соответствует идеальному разделению между (средним) ЗКФ и эталоном.Для GCC мы выбираем 0,4, что в два раза превышает порог, определенный GCF, чтобы зафиксировать долгосрочные отношения со ссылками.
Метагеномное содержание BGC оценивалось как среднее содержание его биосинтетических генов (определенное с помощью анти-SMASH), доступное из профилей генного уровня.Затем метагеномную распространенность каждого GCF или GCC рассчитывали как сумму репрезентативных BGC (из 17 689).Эти карты численности были впоследствии нормализованы по клеточному составу с использованием подсчета mOTU для каждого образца, что также учитывало усилия по секвенированию (расширенные данные, рис. 1d).Распространенность GCF или GCC рассчитывали как процент образцов с численностью > 0.
Евклидово расстояние между образцами рассчитывали по нормализованному профилю GCF.Эти расстояния были уменьшены в размерах с помощью UMAP77, а полученные вложения использовались для неконтролируемой кластеризации на основе плотности с использованием HDBSCAN78.Оптимальное минимальное количество точек для кластера (и, следовательно, количество кластеров), используемое HDBSCAN, определяется путем максимизации кумулятивной вероятности членства в кластере.Идентифицированные кластеры (и случайная сбалансированная подвыборка этих кластеров для учета систематической ошибки в пермутационном многомерном дисперсионном анализе (PERMANOVA)) были проверены на значимость по сравнению с нередуцированными евклидовыми расстояниями с использованием PERMANOVA.Средний размер генома образцов рассчитывали на основе относительной распространенности mOTU и предполагаемого размера генома членов геномов.В частности, средний размер генома каждого mOTU оценивался как средний размер генома его членов, скорректированный на полноту (после фильтрации) (например, полный на 75% геном длиной 3 МБ имеет скорректированный размер 4 Мб).для средних геномов с целостностью ≥70%.Затем средний размер генома для каждого образца рассчитывали как сумму размеров генома mOTU, взвешенную по относительной численности.
Отфильтрованный набор закодированных геномом BGC в OMD показан в деревьях GTDB бактерий и архей (в рамках ≥5 т.п.н., за исключением REF и SAG MarDB, не обнаруженных в 1038 метагеномах, см. выше) и их предсказанных категорий продуктов на основе филогенетических данных. положение генома (см. выше).Сначала мы сократили данные по видам, используя в качестве репрезентативного геном с наибольшим количеством BGC этого вида.Для визуализации представители были далее разделены на древовидные группы, и снова для каждой клеточной клады в качестве представителя выбирался геном, содержащий наибольшее количество BGC.Виды, обогащенные BGC (по крайней мере, один геном с >15 BGC), были дополнительно проанализированы путем расчета индекса разнообразия Шеннона для типов продуктов, закодированных в этих BGC.Если все прогнозируемые типы продуктов одинаковы, химические гибриды и другие сложные BGC (согласно предсказанию анти-SMAH) считаются принадлежащими к одному и тому же типу продукта, независимо от их порядка в кластере (например, белок-бактериоцин и слияние бактериоцина-протеопротеина). тело).гибридный).
Оставшаяся ДНК (по оценкам, 6 нг) из образца MP1648 Malaspina, соответствующая биологическому образцу SAMN05421555 и соответствующая набору метагеномного считывания Illumina SRR3962772 для короткого считывания, обработанная в соответствии с протоколом секвенирования PacBio со сверхнизкими входными данными для использования набора PacBio Kit SMRTbell для амплификации образцов гДНК. комплект (100-980-000) и комплект для подготовки шаблона SMRTbell Express 2.0 (100-938-900).Вкратце, оставшуюся ДНК разрезали, репарировали и очищали (шарики ProNex) с использованием Covaris (g-TUBE, 52104).Затем очищенную ДНК подвергают подготовке библиотеки, амплификации, очистке (бусины ProNex) и выбору размера (>6 т.п.н., Blue Pippin) перед заключительным этапом очистки (бусины ProNex) и секвенированию на платформе Sequel II.
Реконструкция первых двух ок.Для MAG Eremiobacterota мы выявили шесть дополнительных ANI >99% (они включены в рисунок 3), которые первоначально были отфильтрованы на основе показателей загрязнения (позже идентифицированных как дупликации генов, см. ниже).Мы также нашли поднос с надписью «Ca».Eremiobacterota» из различных исследований23 и использовал их вместе с восемью MAG из нашего исследования в качестве эталона для метагеномного чтения из 633 образцов, обогащенных эукариотами (>0,8 мкм), с использованием BWA (v.0.7.17) Ref -r1188, – флаг) для пониженной выборки. картографирование (5 миллионов прочтений).На основе карт, специфичных для обогащения (отфильтрованных по идентичности выравнивания 95% и охвату чтения 80%), 10 метагеномов (ожидаемое покрытие ≥5×) были выбраны для сборки и дополнительные 49 метагеномов (ожидаемое покрытие ≥1×) для корреляции содержания.Используя те же параметры, что и выше, эти образцы были разделены и добавлено 10 дополнительных Ca.МАГ Eremiobacterota восстановлена.Эти 16 MAG (не считая двух, уже находящихся в базе данных) доводят общее количество геномов в расширенном OMD до 34 815.MAGs присваиваются таксономические ранги на основе их геномного сходства и положения в GTDB.18 MAG были дереплицированы с помощью dRep в 5 видов (внутривидовой ANI >99%) и 3 рода (внутриродовой ANI от 85% до 94%) в пределах одного семейства79.Представители видов отбирались вручную по целостности, загрязненности и N50.Предлагаемая номенклатура представлена ​​в дополнительной информации.
Оцените целостность и загрязненность «Ca.MAG Eremiobacterota мы оценили наличие uscMG, а также наборов однокопийных маркерных генов, специфичных для линии и домена, используемых CheckM и Anvi'o.Идентификация 2 дубликатов из 40 uscMG была подтверждена с помощью филогенетической реконструкции (см. ниже), чтобы исключить любое потенциальное загрязнение (это соответствует 5% на основе этих 40 маркерных генов).Дополнительное исследование пяти репрезентативных MAG 'Ca.Низкий уровень примесей в этих реконструированных геномах был подтвержден для видов Eremiobacterota с использованием интерактивного интерфейса Anvi'o, основанного на корреляциях численности и состава последовательностей (дополнительная информация)59.
Для филогеномного анализа мы выбрали пять репрезентативных MAG «Ca».Eudormicrobiaceae», все виды «Ca.Геном Eremiobacterota и представителей других типов (включая UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria и Planctomycetota) доступен в GTDB (r89)13.Все эти геномы были аннотированы, как описано ранее для выделения гена-маркера одной копии и аннотации BGC.Геномы GTDB были консервативны в соответствии с вышеуказанными критериями целостности и контаминации.Филогенетический анализ проводился с использованием рабочего процесса Anvi'o Phylogenetics59.Дерево было построено с использованием IQTREE (v.2.0.3) (параметры по умолчанию и -bb 1000)80 на основе выравнивания 39 тандемных рибосомальных белков, идентифицированных Anvi'o (MUSCLE, v.3.8.1551)81.Его позиции были сокращены.для покрытия не менее 50% генома82, а Planctomycecota использовалась в качестве внешней группы на основе топологии дерева GTDB.Одно дерево из 40 uscMG было построено с использованием тех же инструментов и параметров.
Мы использовали Traitar (v.1.1.2) с параметрами по умолчанию (фенотип, исходя из нуклеотидов)83 для прогнозирования общих микробных признаков.Мы исследовали потенциальный хищнический образ жизни на основе ранее разработанного индекса хищничества84, который зависит от содержания гена, кодирующего белок, в геноме.В частности, мы используем DIAMOND для сравнения белков в геноме с базой данных OrthoMCL (v.4)85, используя опции –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 И подсчитываем гены, соответствующие маркерные гены хищников и нехищников.Индекс представляет собой разницу между количеством хищных и нехищных отметин.В качестве дополнительного контроля мы также проанализировали геном «Са».Фактор Entotheonella TSY118 основан на его ассоциации с Ca.Eudoremicrobium (большой размер генома и биосинтетический потенциал).Затем мы проверили потенциальные связи между маркерными генами хищников и нехищников и биосинтетическим потенциалом Ca.Eudormicrobiaceae» и обнаружили, что не более одного гена (из любого типа маркерного гена, т.е. гена хищника/нехищника) перекрывается с BGC, что позволяет предположить, что BGC не искажает сигналы хищничества.Дополнительная геномная аннотация скремблированных репликонов была выполнена с использованием TXSSCAN (v.1.0.2) для специфического изучения системы секреции, пилей и жгутиков86.
Пять репрезентативных 'Ca' были картированы путем картирования 623 метатранскриптомов из фракций обогащения прокариот и эукариот океанов Тары22,40,87 (с использованием BWA, v.0.7.17-r1188, -a flag).Геном Eudormicrobiaceae.Файлы BAM были обработаны с помощью FeatureCounts (v.2.0.1)88 после 80%-ного покрытия чтения и 95%-ной фильтрации идентификации (с опциями FeatureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ). количество вставок на ген.Сгенерированные карты были нормализованы по длине гена и распространенности маркерных генов mOTU (нормализованное по длине среднее количество вставок для генов с количеством вставок >0) и логарифмически преобразованы до 22,74 для получения относительной экспрессии на клетку каждого уровня гена, что также объясняет изменчивость от образца к образцу во время секвенирования.Такие соотношения позволяют проводить сравнительный анализ, смягчая проблемы состава при использовании данных об относительной численности.Для дальнейшего анализа рассматривались только образцы с >5 из 10 маркерных генов mOTU, чтобы можно было обнаружить достаточно большую часть генома.
Нормализованный профиль транскриптома 'Ca.E. taraoceanii подвергли уменьшению размерности с использованием UMAP, а полученное представление использовали для неконтролируемой кластеризации с использованием HDBSCAN (см. выше) для определения статуса экспрессии.PERMANOVA проверяет значимость различий между идентифицированными кластерами в исходном (не уменьшенном) пространстве расстояний.Дифференциальная экспрессия между этими состояниями была протестирована по всему геному (см. выше), и 201 путь KEGG был идентифицирован в 6 функциональных группах, а именно: BGC, гены системы секреции и жгутиковых генов из TXSSCAN, ферменты деградации (протеазы и пептидазы), а также хищнические и не- хищнические гены.маркеры хищнического индекса.Для каждого образца мы рассчитали медианную нормализованную экспрессию для каждого класса (обратите внимание, что сама экспрессия BGC рассчитывается как медианная экспрессия биосинтетических генов для этого BGC) и проверили ее значимость в разных штатах (тест Крускала-Уоллиса с поправкой на FDR).
Синтетические гены были приобретены у GenScript, а праймеры для ПЦР были приобретены у Microsynth.Для амплификации ДНК использовали Phusion-полимеразу от Thermo Fisher Scientific.Для очистки ДНК использовали плазмиды NucleoSpin, гель NucleoSpin и набор для очистки ПЦР от Macherey-Nagel.Ферменты рестрикции и ДНК-лигаза Т4 были приобретены у New England Biolabs.Химические вещества, отличные от изопропил-β-d-1-тиогалактопиранозида (IPTG) (Biosynth) и 1,4-дитиотреитола (DTT, AppliChem), были приобретены у Sigma-Aldrich и использованы без дополнительной очистки.Антибиотики хлорамфеникол (Cm), спектиномицина дигидрохлорид (Sm), ампициллин (Amp), гентамицин (Gt) и карбенициллин (Cbn) были приобретены у AppliChem.Компоненты сред Bacto Tryptone и Bacto Yeast Extract были приобретены у BD Biosciences.Трипсин для секвенирования был приобретен у компании Promega.
Генные последовательности были извлечены из предсказанного анти-SMASH BGC 75.1.E. Malaspinii (Дополнительная информация).
Гены embA (локус MALA_SAMN05422137_METAG-framework_127-gene_5), embM (локус MALA_SAMN05422137_METAG-framework_127-gene_4) и embAM (включая межгенные области) были секвенированы как синтетические конструкции в pUC57(AmpR) с кодонами, оптимизированными для экспрессии в E, и без них. когда.Ген embA субклонировали в первый сайт множественного клонирования (MCS1) pACYCDuet-1(CmR) и pCDFDuet-1(SmR) с сайтами расщепления BamHI и HindIII.Гены embM и embMopt (оптимизированные по кодонам) были субклонированы в MCS1, pCDFDuet-1(SmR) с BamHI и HindIII и помещены во второй сайт множественного клонирования pCDFDuet-1(SmR) и pRSFDuet-1(KanR) (MCS2) с НдеИ/Чой.Кассету embAM субклонировали в pCDFDuet1(SmR) с сайтами расщепления BamHI и HindIII.Ген orf3/embi (locus, mala_samn05422137_metag-scaffold_127-gene_3) был сконструирован с помощью ПЦР расширения перекрытия с использованием праймеров Embi_oe_f_ndei и Embi_oe_r_xoi, перевариваемых с ndei/xhoi и лигированным в PCDFMET-1-ndei-ndei/xHo (Дополнительный стол).6).Расщепление и лигирование рестрикционными ферментами проводили в соответствии с протоколом производителя (New England Biolabs).

 


Время публикации: 14 марта 2023 г.