ggplot2 добавить данные из дополнительного фрейма данных рядом с графиком

Я хотел бы иметь возможность дополнить свои коробочные диаграммы дополнительной информацией. Вот рабочий пример для ggplot2:

library(ggplot2)

ToothGrowth$dose <- as.factor(ToothGrowth$dose)

# Basic box plot
p <- ggplot(ToothGrowth, aes(x=dose, y=len)) + 
  geom_boxplot()
# Rotate the box plot
p + coord_flip()

Я хотел бы добавить дополнительную информацию из отдельного фрейма данных. Например:

extra <- data.frame(dose=factor(c(0.5,1,2)), label=c("Label1", "Label2", "Label3"), n=c("n=42","n=52","n=35"))

> extra
  dose  label    n
1  0.5 Label1 n=42
2    1 Label2 n=52
3    2 Label3 n=35

Я хотел бы создать следующий рисунок, на котором информация о каждой дозе (факторе) находится за пределами графика и согласуется с каждым из уровней дозы (я сделал это в PowerPoint в качестве примера):

введите описание изображения здесь

Любые советы высоко ценится!

С уважением, Люк

РЕДАКТИРОВАТЬ: Большое спасибо за ответ! Идеально. Я хотел бы попросить совета по расширению первоначального вопроса.

Как насчет этого расширения, где я использую заполнение, чтобы разделить дозу на две группы?

ToothGrowth$dose <- as.factor(ToothGrowth$dose)
ToothGrowth$group <- head(rep(1:2, 100), dim(ToothGrowth)[1])
ToothGrowth$group <- factor(ToothGrowth$group)

 p <- ggplot(ToothGrowth, aes(x=dose, y=len, fill=group)) + 
     geom_boxplot()
 # Rotate the box plot
 p + coord_flip()

extra <- data.frame(
  dose=factor(rep(c(0.5,1,2), each=2)), 
  group=factor(rep(c(1:2), 3)), 
  label=c("Label1A", "Label1B", "Label2A", "Label2B", "Label3A", "Label3B"), 
  n=c("n=12","n=30","n=20", "n=32","n=15","n=20")
)

Можно ли согласовать данные из нового фрейма данных (дополнительные, 6 строк) с каждой комбинацией дозы / группы?

Привет, Люк


person Luc    schedule 09.08.2018    source источник


Ответы (1)


Мы можем использовать geom_text с clip = "off" внутри coord_flip:

ggplot(ToothGrowth, aes(x=dose, y=len)) +
    geom_boxplot() +
    geom_text(
        y = max(ToothGrowth$len) * 1.1,
        data = extra,
        aes(x = dose, label = sprintf("%s\n%s", label, n)),
        hjust = 0) +
    coord_flip(clip = "off") +
    theme(plot.margin = unit(c(1, 5, 0.5, 0.5), "lines"))

введите описание изображения здесь

Объяснение: Мы помещаем текст вне области построения с помощью geom_text и отключаем обрезку с помощью clip = "off" внутри coord_flip. Наконец, мы увеличиваем поле графика, чтобы разместить дополнительные метки. Вы можете отрегулировать вертикальное y положение на поле (то есть горизонтальное положение на графике из-за переворота координат), изменив коэффициент в y = max(ToothGrowth$len) * 1.1.


В ответ на ваше изменение есть возможность

extra <- data.frame(
  dose=factor(rep(c(0.5,1,2), each=2)),
  group=factor(rep(c(1:2), 3)),
  label=c("Label1A", "Label1B", "Label2A", "Label2B", "Label3A", "Label3B"),
  n=c("n=12","n=30","n=20", "n=32","n=15","n=20")
)

library(tidyverse)
ToothGrowth %>%
    mutate(
        dose = as.factor(dose),
        group = as.factor(rep(1:2, nrow(ToothGrowth) / 2))) %>%
    ggplot(aes(x = dose, y = len, fill = group)) +
    geom_boxplot(position = position_dodge(width = 1)) +
    geom_text(
        data = extra %>%
            mutate(
                dose = as.factor(dose),
                group = as.factor(group),
                ymax = max(ToothGrowth$len) * 1.1),
        aes(x = dose, y = ymax, label = sprintf("%s\n%s", label, n)),
        position = position_dodge(width = 1),
        size = 3,
        hjust = 0) +
    coord_flip(clip = "off", ylim = c(0, max(ToothGrowth$len))) +
    theme(
        plot.margin = unit(c(1, 5, 0.5, 0.5), "lines"),
        legend.position = "bottom")

введите описание изображения здесь

Несколько комментариев:

  1. Мы гарантируем, что метки совпадают с уклоненными полосами, используя position_dodge(with = 1) внутри geom_text и geom_boxplot.
  2. Похоже, что position_dodge не нравится глобальный y (вне aes). Поэтому мы включаем положение y для меток в extra и используем его внутри aes. В результате нам нужно явно ограничить диапазон оси y. Мы можем сделать это внутри coord_flip с ylim = c(0, max(ToothGrowth$len)).
person Maurits Evers    schedule 09.08.2018
comment
Большое спасибо! Именно то, что мне нужно! - person Luc; 10.08.2018
comment
Привет, Мауриц, не могли бы вы взглянуть на мою расширенную проблему? См. Правки в исходном сообщении. - person Luc; 10.08.2018
comment
Вы легенда! - person Luc; 10.08.2018