Время R настало

Отправлено 28 авг. 2014 г., 20:36 пользователем Tin Tinro   [ обновлено 28 авг. 2014 г., 20:46 ]

В ТИНРО-Центре началась серия занятий, на которых научные сотрудники смогут познакомиться с одним из самых популярных в открытой научной печати языком программирования высокого уровня – R и апробировать его в различных расчетах. Он может позволить оперативно и на более высоком уровне исполнения обрабатывать получаемую в рейсах информацию, анализировать состояние морских экосистем и разрабатывать новые статистические модели изменения промысловых запасов с привлечением изменений в окружающей среде.

– R – это очень удобный язык программирования, прежде всего в плане человеческого восприятия для биологов и экологов, о чем свидетельствует его доминирование в цитированиях научных публикаций, - информирует организатор семинара, ведущий научный сотрудник лаборатории регионального центра данных ТИНРО-Центра Владимир Кулик. - Он позволяет быстро обрабатывать данные и проводить сравнительный анализ  материала с минимальными временными затратами на само программирование. R занял лидирующие позиции среди множества программных сред для проведения статистических анализов и моделирования. Он обладает  многотысячной коллекцией свободно доступных библиотек функций, которые дополнительно включают в установочный пакет примеры их использования на реальных или синтезированных данных со ссылками на тексты научных работ, где были опубликованы используемые методы в математической нотации. Замечу, что R - это бесплатная программная среда для статистического анализа и моделирования, которая может работать на всех популярных операционных системах: MS Windows, GNU Linux и Mac OS.

Владимир Кулик уверен, что необходимость в популяризации языка R в ТИНРО-Центре назрела. Его активно используют специалисты по рыбопромысловому прогнозированию в ICES, PICES и в некоторых отечественных рыбохозяйственных институтах. R – это язык, позволяющий выразить понятно и кратко (иногда всего в одну строку программного текста) довольно сложные биостатистические модели без использования математической нотации. В научных публикациях по биологии и экологии уже бывали дополнения или даже замены математического описания предлагаемой модели или метода на ее выражение в стиле языка R с приложением исходного текста программы на R и всех или части использованных в статье данных. Такой подход полностью соответствует принципу открытой науки, когда обеспечивается полная повторяемость авторских результатов и выводов, а также возможность быстрой проверки предлагаемых методов на новых данных. Следовательно, на R нужно уметь «общаться», чтобы не выпасть из «обоймы», полагает Владимир Кулик, сравнивая R в биологических науках с латынью, роль которой, конечно, давно исполняют математические выражения. Однако, они не всегда доступны для понимания большому числу специалистов, привлекаемых к анализу состояния, как отдельных популяций, так и целых экосистем.

Сегодня, когда рыбохозяйственная наука вынуждена работать в условиях постоянно сокращающегося бюджета, R может стать своего рода надёжным помощником. В то же время не стоит уповать на него как на палочку-выручалочку, т.к. не редки случаи, когда даже очень сложные и долго работавшие модели проигрывают простым моделям в условиях недостатка данных у первых и их достаточности у вторых.

– Таким образом, грамотное использование R может лишь частично компенсировать нехватку первичной информации, которую собирают в рейсах для прогнозирования состояния запасов и экосистем дальневосточных морей, – резюмирует Владимир Кулик. – Но полностью заменить материалы экспедиций оно не сможет, в то время как количество судосуток, к сожалению, с каждым годом все меньше и меньше.

Comments