“`html
Мониторинг здоровья почвы с использованием машинного обучения на основе микробиомов:
Здоровье почвы критично для поддержания экологической и коммерческой ценности агроэкосистем, требуя оценки биологических, химических и физических свойств почвы. Традиционные методы мониторинга этих свойств могут быть дорогостоящими и непрактичными для регулярного анализа. Однако микробиом почвы предлагает богатый источник информации, который может быть изучен экономично с использованием высокопроизводительного секвенирования.
Практические решения:
Исследование исследует потенциал моделей машинного обучения, в частности случайного леса (RF) и метода опорных векторов (SVM), для прогнозирования 12 ключевых метрик здоровья почвы, включая состояние обработки и текстуру почвы, с использованием данных ампликонов гена 16S рРНК. Модели продемонстрировали сильные прогностические способности, достигнув значения Kappa примерно 0,65 для категориальных оценок и значения R² около 0,8 для числовых прогнозов, особенно преуспевая в прогнозировании биологических метрик здоровья почвы по сравнению с химическими и физическими.
Методы:
Проведена комплексная оценка здоровья почвы с использованием 949 образцов почвы из различных фермерских угодий по всей США и Канаде в соответствии с рекомендациями протокола Comprehensive Assessment of Soil Health (CASH). Каждый образец прошел тщательный анализ, охватывающий 12 ключевых биологических, химических и физических метрик здоровья почвы, которые были впоследствии нормализованы и категоризированы для практического использования. Общее ДНК было извлечено с использованием набора PowerSoil DNeasy, а затем произведено количественное определение. Бактериальные сообщества были профилированы путем секвенирования области V4 гена 16S рРНК. Данные секвенирования обрабатывались с использованием QIIME2, используя DADA2 для присвоения ампликонных последовательностей вариантам (ASV) и таксономия была присвоена, используя базу данных Silva. Были использованы методы, такие как редуцирование, пропорциональность, нормализация CSS и фильтрация разреженности, для создания пяти различных типов наборов данных для подготовки данных к дальнейшему анализу.
Оценка модели машинного обучения на основе микробиомов почвы:
Континентальное исследование почвенных микробиомов в североамериканских сельскохозяйственных угодьях оценило прогностическую точность моделей машинного обучения с использованием данных почвенного микробиома. SVM превзошел в классификации здоровья почвы, в то время как RF проявил себя лучше в задачах регрессии. Нормализация глубины прочтения и таксономическое разрешение значительно влияли на точность модели. Самыми предсказуемыми характеристиками были конкретные ASV, связанные с метриками здоровья, такими как активный углерод. Кросс-валидация с независимыми наборами данных подтвердила устойчивость моделей, особенно для прогнозирования биологических метрик. Почвенные микробиомы показали значительное географическое разнообразие, причем химические свойства вызывали больше различий в составе сообщества.
Потенциал и вызовы моделей машинного обучения на основе микробиомов для прогнозирования здоровья почвы:
Это исследование подчеркивает потенциал использования моделей машинного обучения на основе микробиомов для прогнозирования метрик здоровья почвы. Опрос гена 16S рРНК почвенных микробиомов показал, что эти модели могут эффективно прогнозировать биологические метрики здоровья, но их точность в отношении химических и физических метрик ниже. Модели столкнулись с вызовами из-за узкого диапазона значений pH почвы и недостаточного представления экстремальных состояний здоровья почвы в наборе данных. Улучшение точности этих моделей потребует лучшего представления разнообразных состояний здоровья почвы, особенно в крайних случаях, и преодоления трудностей в обработке почв с низкими показателями здоровья, которые обычно более филогенетически разнообразны.
Практическое применение:
Несмотря на эти вызовы, исследование заключает, что модели машинного обучения на основе микробиомов показывают перспективы в дополнении или потенциальной замене традиционных оценок здоровья почвы, особенно в биологических метриках. Полученные результаты указывают на то, что с появлением большего количества данных, особенно региональных или управленческих, точность этих моделей улучшится. Исследование также подчеркивает необходимость разработки высокопроизводительных методов сбора данных о микробиоме, особенно для почв с низкими выходами ДНК. В то время как линейные SVM L2 превзошли RF в задачах классификации, модели RF проявили себя лучше в задачах регрессии, указывая на отсутствие четкого предпочтения конкретного алгоритма машинного обучения в прогнозировании здоровья почвы. Будущие исследования и применение подходов машинного обучения на основе микробиомов в рамках оценки здоровья почвы могут улучшить цифровое сельское хозяйство и обеспечить всестороннюю оценку здоровья почвы.
Источник изображения
Потенциал и вызовы моделей машинного обучения на основе микробиомов для прогнозирования здоровья почвы
Это исследование подчеркивает потенциал использования моделей машинного обучения на основе микробиомов для прогнозирования метрик здоровья почвы. Опрос гена 16S рРНК почвенных микробиомов показал, что эти модели могут эффективно прогнозировать биологические метрики здоровья, но их точность в отношении химических и физических метрик ниже. Модели столкнулись с вызовами из-за узкого диапазона значений pH почвы и недостаточного представления экстремальных состояний здоровья почвы в наборе данных. Улучшение точности этих моделей потребует лучшего представления разнообразных состояний здоровья почвы, особенно в крайних случаях, и преодоления трудностей в обработке почв с низкими показателями здоровья, которые обычно более филогенетически разнообразны.
Не забудьте присоединиться к нашему сообществу в Telegram и Twitter, чтобы оставаться в курсе последних новостей об искусственном интеллекте и машинном обучении!
Не забудьте присоединиться к нашему сообществу в Telegram и Twitter, чтобы оставаться в курсе последних новостей об искусственном интеллекте и машинном обучении!
“`