← |
Д. Шабанов, М. Кравченко. «Статистичний оракул»: аналіз даних в зоології та екології |
→ |
||
Візуалізація даних з пакетом ggplot2 |
||||
«Статистичний оракул»-06 |
«Статистичний оракул»-07 |
«Статистичний оракул»-09 |
Візуалізація даних з пакетом ggplot2
7.1. Граматика графіки ggplot2
Зараз найпоширенішим засобом для побудови діаграм в R став пакет ggplot2. Скорочення "gg" в його назві походить від концепції граматики графіки (Grammar of Graphics), яка була запропонована в книзі Леланда Вілкинсона (Wilkinson, Leland. 2005. The Grammar of Graphics (Statistics and Computing). Berlin, Heidelberg: Springer-Verlag). Сенс цієї граматики полягає в описі статистичних діаграм за допомогою спеціальної мови. Цю концепцію розвинув Хедлі Вікхем, який у 2010 році запропонував пакет ggplot2 (Wickham, Hadley. 2010. “A Layered Grammar of Graphics.” Journal of Computational and Graphical Statistics 19 (1): 3–28).
Опис пакета ggplot2 можна знайти у мережі тут. «Шпаргалка», що допомагає працювати з цим пакетом, наведена нижче. Зверніть увагу: «клацання» (клик) мишею на зображенні викликає його збільшену копію, яку буде набагато простіше прочитати.
Рис. 7.1.1. Перша сторінка «шпаргалки» з ggplot2 (кликабельно!)
Рис. 7.1.2. Друга сторінка «шпаргалки» з ggplot2 (кликабельно!)
Характерною особливістю ggplot2 є «пошарова» побудова графіки. Основні шари зображення в цьому пакеті показані в табл. 7.1.1. Зверніть увагу: цю таблицю слід читати знизу догори; базовий рівень, рівень даних показано на ній у самому низу. Кожний наступний шар накладається поверх попередніх; ще вище має бути розташований шар з назвами діаграми, підписами осей тощо. Назви шарів, як-от «естетики», можуть здаватися незрозумілими; до них слід просто звикнути.
Таблиця 7.1.1. Шари зображення у ggplot2 (у порядку знизу догори)
Шар |
Назва |
Опис |
Пояснення |
7 |
Теми |
Стиль оформлення зображення з заздалегідь заданого переліку |
Характер зображення, що не пов’язаний з даними |
6 |
Координати |
Простір зображення |
Декартові або полярні; фіксовані або обмежені |
5 |
Статистики |
Узагальнений опис даних |
Згладжування, апроксимація, опис |
4 |
Фасетки |
Зображення, що відрізняються за однією змінною (категоризовані графіки) |
Частини зображення, що створюють рядки або стовпці. |
3 |
Геометрії |
Елементи, що використовуються для відбиття змінних |
Точки, лінії, гістограми, “ящики” (boxplot) |
2 |
Естетики |
Шкали та змінні, за якими будуються дані |
Вісі абсцис, ординат, кольори, заливки, розміри, рівні, прозорість, типи фігур, типи та товщина ліній |
1 |
Дані |
Набір даних, за якими будують зображення |
Дані, що відбиваються на зображенні (організовані за певними змінними) |