«Статистичний оракул»: аналіз даних в зоології та екології

Отримання емпіричних даних — базовий етап, але лише один з етапів будь-якого дослідження. Отримання даних слід спланувати, дані треба представити у формі, придатній для інтерпретації, а далі — проаналізувати їх та зробити обґрунтовані висновки. Природниче дослідження — це спосіб задавати природі питання, отримувати відповіді, а потім робити ці відповіді зрозумілими, інтерпретувати їх.

Щоб підкреслити особливості сучасного природничо-наукового дослідження, порівняймо його з одним з найдавніших способів отримання відповідей на складні питання. На старій гравюрі угорі — дельфійський оракул. Піфія (жриця) входила в екстатичний стан (можливо, з використанням токсичних газів). Вона генерувала «первинні дані», які потім інтерпретували (перш за все, з натхнення) профети, жерці. Все це відбувалося в храмі, який Аполлон заснував там, де він вбив Піфона — жахливого змія, представника хтоничних божеств, тобто втілення животворних сил Землі й природи в цілому.

Здається, зараз все відбувається не так! Ми використовуємо формалізовані та доказові процедури, деякі з яких описані в цьому навчальному посібнику. Первинні дані збирають суворо регламентованим способом, часто — з процедурами, що захищають від упередженості дослідника. Вибір методів дослідження прийнято обґрунтовувати. Важливе питання, на який має дати відповідь статистичне дослідження, — наскільки ймовірним є те, що отримані в його ході висновки відбивають не причинно-наслідкові зв'язки в дійсності, яку ми досліджуємо, а є лише наслідком випадковості при формуванні вивченої вибірки. Але... І в давнину, і зараз процедури аналізу не дозволяють вичерпно встановити всі причинно-наслідкові зв'язки, дія яких відбилася у мінливості досліджуваних даних. І тоді, і зараз первинні дані вимагають особливо дбайливого, навіть трепетного ставлення дослідника. Якщо читачі цього підручника будуть з пієтетом зберігати отримані ними первинні дані, можливо, що колись ці дані дозволять поглянути на їх дослідження з іншого боку. Зібрані нами факти — це загадки, смисли яких відкриваються для нас лише частково. Звичайно, статистичний оракул дозволяє давати набагато переконливіші відповіді, ніж дельфійський, але, як і раніше, він допомагає зрозуміти лише окремі аспекти дійсності...

Це посібник призначений в першу чергу для студентів IV курсу кафедри зоології та екології тварин Харківського національного університету імені В. Н. Каразіна. Він відповідає програмі розділу великого практикуму, присвяченого аналізу даних. Ймовірно, посібник може бути корисним і в інших ситуаціях, наприклад, при виконанні навчально-дослідних робіт студентів II курсу на польовій практиці або при підготовці курсових і дипломних робіт, а також для студентів інших ВНЗ. В даний час цей підручник є неповним і перебуває у стані розробки; його обсяг поступово збільшується, а корисність, як хочеться сподіватися, зростає. З 2020 року автори зупиняють розробку російськомовної версії підручника та починають переносити матеріал в українську версію; акцент в ній буде робитися на використанні мови R. Протягом певного часу стара та нова версії підручника будуть сусідити на цьому сайті. Автори (shabanov(at)karazin.ua, marinakravchenko2106(at)gmail.com) будуть вдячні за конструктивну критику даного тексту або виправлення помилок в ньому.

Д. Шабанов, М. Кравченко; кафедра зоології та екології тварин Харківського національного університету імені В. Н. Каразіна

 

Тема 1. Основні поняття біостатистики

1.1. Що таке біостатистика, і навіщо вона потрібна
1.2. Імовірність
1.3. Генеральна сукупність та вибірка
1.4. Що таке значущість? Приклад-жарт
1.5. Статистична значущість; нульова та альтернативна гіпотези
1.6. Ознаки
1.7. Розподіли, статистики та параметри
1.8. Параметричні й непараметричні статистичні методи та критерії

Тема 2. Використання програми Statistica: файл-приклад PelophylaxExamples

2.1. Різноманіття програм для статистичного аналізу
2.2. Файл-приклад PelophylaxExamples
2.3. Кодування змінних в таблиці PelophylaxExamples (на прикладі файлу Statistica)
2.4. Statistica: корисні посилання, початок роботи та організація файлу даних
2.5. Робота з рядками та стовпцями в Statictica

Тема 3. Використання мови R

3.1. Загальні відомості про R
3.2. RStudio — оболонка для роботи з R
3.3. Типи об'єктів. Пакети
3.4. Початок роботи
3.5. Читання файлів *.csv
3.6. Перегляд даних на прикладі фрейму PelophylaxExample
3.7. R: корисні посилання

Тема 4. Робота з даними в R

4.1. Логічні та арифметичні операції в R
4.2. Пропущені значення
4.3. Вектори, їх створення та вибір певних елементів
4.4. Імена рядків та стовпців у матрицях та фреймах
4.5. Індексація даних на прикладі фрейму PelophylaxExample
4.6. Робота зі стовпцями фрейму PelophylaxExample

Тема 5. Візуалізація даних у Statistica

5.1. Гістограми в Statictica: приклад побудови графіків
5.2. Редагування графіка в Statictica
5.3. Діаграми розсіювання і лінії регресії в Statictica

Тема 6. Графічні можливості R

6.1. Побудова діаграми розсіювання за допомогою функції plot(): основа та опції
6.2. Гістограми

Тема 7. Короткий огляд команд R

7.1. Допомога
7.2. Оточення
7.3. Огляд об'єктів
7.4. Ввід та вивід
7.5. Створення об'єктів
7.6. Індексування
7.7. Робота зі змінними
7.8. Керування даними
7.9. Математика
7.10. Матриці
7.11. Перебудова даних
7.12. Рядки
7.13. Графіки
7.14. Окремі елементи графіків
7.15. Гратчасті графіки (Lattice-графіки)
7.16. Оптимізація та підгонка параметрів
7.17. Статистика
7.18. Розподіли
7.19. Програмування

Інтернет-сторінки: перероблені (українські) та старі, що вже не виправляються (російські):