Abstract

Forecasting of pink salmon runs in Kamchatka uses modern powerful method of machine learning Random Forest (random forest of decision trees). Monthly data of climate indices are used as predictors. Forecasting applies iterative way of selection of the most important factors. Decision about the best model is based on the least error on test data. The algorithm of the method is written in R language.

Highlights

  • Горбуша составляет основу добычи лососей Камчатки, поэтому важность прогнозирования ее подходов трудно переоценить

  • Естественно, что отбор предикторов машинным способом в таком случае заметно облегчил бы анализ данных

  • Model of salmon age structure and its use in preseason forecasting and studies of marine survival // Canadian Journal of Fisheries and Aquatic Sciences

Read more

Summary

МАТЕРИАЛ И МЕТОДИКА

В этот раз с помощью случайного леса в качестве предикторов мы рассмотрим более широкий диапазон помесячных данных WP за тот же период, что и для данных по индексу PDO Рассматривая на диаграмме рассеивания взаимоотношение натурального логарифма индекса выживаемости (отношения потомков к родителям) и признака PDO12-13, можно легко заметить, что наблюдения, отнесенные к низкому уровню численности (low), расположены преимущественно слева в области отрицательных значений признака, а наблюдения среднего уровня (average) — в положительной области Первоначально, во время настройки кода, использовался только данный цикл, но так как было обнаружено, что при различных зернах генератора случайных чисел (ГСЛ), который обуславливает состав бутстреп-выборок наблюдений и необходим для воспроизводимости результатов, возникают существенные различия в моделях леса, было решено рассмотреть 1000 выборок с различными зернами ГСЛ от 1 до 1000 с помощью внешнего цикла – readxl — импорт данных из MS Excel в R; – dplyr — манипуляции с данными; – rpart.plot — графическое представление дерева решений; – randomForest — обучение модели случайного леса; – randomForestExplainer — анализ признаков случайного леса и взаимодействий между ними; – Boruta — анализ и верификация признаков случайного леса; – xlsx — экспорт данных из R в MS Excel

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Findings
Основной скрипт
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.