R - Форматирование данных за месяц и перенос фасетов за год

Я тренируюсь с R и наткнулся на «лежачий полицейский», пытаясь создать график авиапассажиров за месяц.

Я хочу показать отдельный месячный линейный график для каждого года с 1949 по 1960 год, по которому были записаны данные. Для этого я использовал ggplot, чтобы создать линейный график со значениями за месяц. Это работает нормально, однако, когда я пытаюсь разделить это по годам, используя facet_wrap () и форматируя текущее поле month: facet_wrap(format(air$month[seq(1, length(air$month), 12)], "%Y")); он возвращает это:

График возвращен

Я также попытался отформатировать фасет, введя свою последовательность лет: rep(c(1949:1960), each = 12). Это возвращает другой результат, который лучше, но все же неверен:

Второй график

Вот мой код:

air = data.frame(
  month = seq(as.Date("1949-01-01"), as.Date("1960-12-01"), by="months"),
  air = as.vector(AirPassengers)
)


ggplot(air, aes(x = month, y = air)) +
  geom_point() +
  labs(x = "Month", y = "Passengers (in thousands)", title = "Total passengers per month, 1949 - 1960") +
  geom_smooth(method = lm, se = F) + 
  geom_line() +
  scale_x_date(labels = date_format("%b"), breaks = "12 month") +
  facet_wrap(format(air$month[seq(1, length(air$month), 12)], "%Y"))
#OR
  facet_wrap(rep(c(1949:1960), each = 12))

Итак, как мне составить индивидуальный график за год?

Спасибо!


person Lucas Peters-Murphy    schedule 14.06.2020    source источник


Ответы (1)


Во второй попытке вы были действительно близки. Основная проблема с данными заключается в том, что вы пытаетесь построить фасетный график с разными значениями оси x (даты, включая год). Простым решением для исправления этого было бы преобразование данных в "общую" шкалу оси x, а затем построение фасетного графика. Вот код, который должен выводить желаемый сюжет.

library(tidyverse)
library(lubridate)

air %>%
  # Get the year value to use it for the facetted plot
  mutate(year = year(month),
         # Get the month-day dates and set all dates with a dummy year (2021 in this case)
         # This will get all your dates in a common x axis scale
         month_day = as_date(paste(2021,month(month),day(month), sep = "-"))) %>%
  # Do the same plot, just change the x variable to month_day
  ggplot(aes(x = month_day, 
             y = air)) +
  geom_point() +
  labs(x = "Month", 
       y = "Passengers (in thousands)", 
       title = "Total passengers per month, 1949 - 1960") +
  geom_smooth(method = lm, 
              se = F) + 
  geom_line() +
  # Set the breaks to 1 month
  scale_x_date(labels = scales::date_format("%b"), 
               breaks = "1 month") +
  # Use the year variable to do the facetted plot
  facet_wrap(~year) +
  # You could set the x axis in an 90° angle to get a cleaner plot
  theme(axis.text.x = element_text(angle = 90,
                                   vjust = 0.5,
                                   hjust = 1))

График по годам

person Jonathan V. Solórzano    schedule 14.06.2020
comment
Потрясающе, сработало отлично! Спасибо. Один вопрос: зачем при мутации вы добавляете year = year(month)? На мой нетренированный глаз это, похоже, ничего не меняет в кадре данных. Спасибо! - person Lucas Peters-Murphy; 15.06.2020
comment
year - это функция из пакета lubridate, которая получает год даты (в данном случае это столбец с именем месяц). Таким образом, строка year = year(month) фактически создает новый столбец с именем year, который содержит год вашего столбца даты. - person Jonathan V. Solórzano; 15.06.2020