Урок 5 Пакет dplyr: Добавление новых вычисляемых столбцов, mutate, mutate_if, mutate_at, mutate_all

5.1 Описание

В этом видео мы продолжаем знакомство с библиотекой tidyverse и пакетом dplyr. Мы разберём семейство функций mutate(), и научимся с их помощью добавлять в таблицу новые вычисляемые столбцы.

5.2 Видео

5.3 Материалы

Все материалы к данному уроку можно найти по ссылке.

5.4 Код

# подключение пакетов
library(vroom)
library(dplyr)

# загрузка данных
ga_data <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/code_example/from_excel_to_r/lesson_3/ga_nowember.csv")

# mutate
# добавл¤ем новый столбец
ga_data <- mutate(ga_data,
                  bounce_rate = bounces / sessions)

ga_data <- mutate(ga_data,
                  bounce_rate = bounces / sessions,
                  br_group    = if_else(bounce_rate > 0.6, "high_br", "normal_br"))

# примен¤ем преобразование к уже существующим столбцам
ga_data %>% mutate_if(is.character, toupper)

# преобразуем значени¤ существующих столбцов примен¤¤ регул¤рные выражени¤
ga_data %>% mutate_at(vars(matches("s$")), sqrt )

# transemute
# убираем все столбцы кроме преобразованных
transmute(ga_data,
          bounce_rate = bounces / sessions,
          date        = format(date, "%d %B %Y"),
          source)

# преобразовываем столбцы по их признаку и удал¤ем все остальные
transmute_if(ga_data, 
             is.character, toupper)

5.5 Тест