StatOracle–07 Візуалізація даних з пакетом ggplot2






       

Д. Шабанов, М. Кравченко. «Статистичний оракул»: аналіз даних в зоології та екології

Візуалізація даних штатними засобами R

Візуалізація даних з пакетом ggplot2

Порівняння вибірок та R

«Статистичний оракул»-06

«Статистичний оракул»-07

«Статистичний оракул»-09

 

Візуалізація даних з пакетом ggplot2

7.1.  Граматика графіки ggplot2

Зараз найпоширенішим засобом для побудови діаграм в R став пакет ggplot2. Скорочення "gg" в його назві походить від концепції граматики графіки (Grammar of Graphics), яка була запропонована в книзі Леланда Вілкинсона (Wilkinson, Leland. 2005. The Grammar of Graphics (Statistics and Computing). Berlin, Heidelberg: Springer-Verlag). Сенс цієї граматики полягає в описі статистичних діаграм за допомогою спеціальної мови. Цю концепцію розвинув Хедлі Вікхем, який у 2010 році запропонував пакет ggplot2 (Wickham, Hadley. 2010. “A Layered Grammar of Graphics.” Journal of Computational and Graphical Statistics 19 (1): 3–28).  

Опис пакета ggplot2 можна знайти у мережі тут. «Шпаргалка», що допомагає працювати з цим пакетом, наведена нижче. Зверніть увагу: «клацання» (клик) мишею на зображенні викликає його збільшену копію, яку буде набагато простіше прочитати.

Рис. 7.1.1. Перша сторінка «шпаргалки» з ggplot2 (кликабельно!)

Рис. 7.1.2. Друга сторінка «шпаргалки» з ggplot2 (кликабельно!)

 

Характерною особливістю ggplot2 є «пошарова» побудова графіки. Основні шари зображення в цьому пакеті показані в табл. 7.1.1. Зверніть увагу: цю таблицю слід читати знизу догори; базовий рівень, рівень даних показано на ній у самому низу. Кожний наступний шар накладається поверх попередніх; ще вище має бути розташований шар з назвами діаграми, підписами осей тощо. Назви шарів, як-от «естетики», можуть здаватися незрозумілими; до них слід просто звикнути.

 

Таблиця 7.1.1. Шари зображення у ggplot2 (у порядку знизу догори) 





Шар

Назва

Опис

Пояснення

7

Теми
(Themes)

Стиль оформлення зображення з заздалегідь заданого переліку

Характер зображення, що не пов’язаний з даними

6

Координати
(Coordinates)

Простір зображення

Декартові або полярні; фіксовані або обмежені

5

Статистики
(Statistics)

Узагальнений опис даних

Згладжування, апроксимація, опис

4

Фасетки
(Facets)

Зображення, що відрізняються за однією змінною (категоризовані графіки)

Частини зображення, що створюють рядки або стовпці.

3

Геометрії
(Geometries)

Елементи, що використовуються для відбиття змінних

Точки, лінії, гістограми, “ящики” (boxplot)

2

Естетики
(Aestetics)

Шкали та змінні, за якими будуються дані

Вісі абсцис, ординат, кольори, заливки, розміри, рівні, прозорість, типи фігур, типи та товщина ліній

1

Дані
(Data)

Набір даних, за якими будують зображення

Дані, що відбиваються на зображенні (організовані за певними змінними)