сгладить тибл в dplyr с NA

У меня есть следующие данные tibble,

 h <- structure(list(label = list(list(structure(list(id = 431676528L, 
    url = "https://api.github.com/repos/emergenzeHack/terremotocentro/labels/per%20sviluppatori", 
    name = "per sviluppatori", color = "d4c5f9", default = FALSE), .Names = c("id", 
"url", "name", "color", "default")), structure(list(id = 442034204L, 
    url = "https://api.github.com/repos/emergenzeHack/terremotocentro/labels/sito%20principale", 
    name = "sito principale", color = "5319e7", default = FALSE), .Names = c("id", 
"url", "name", "color", "default"))), list(structure(list(id = 442051239L, 
    url = "https://api.github.com/repos/emergenzeHack/terremotocentro/labels/mappa", 
    name = "mappa", color = "0052cc", default = FALSE), .Names = c("id", 
"url", "name", "color", "default")), structure(list(id = 431676528L, 
    url = "https://api.github.com/repos/emergenzeHack/terremotocentro/labels/per%20sviluppatori", 
    name = "per sviluppatori", color = "d4c5f9", default = FALSE), .Names = c("id", 
"url", "name", "color", "default")), structure(list(id = 442034204L, 
    url = "https://api.github.com/repos/emergenzeHack/terremotocentro/labels/sito%20principale", 
    name = "sito principale", color = "5319e7", default = FALSE), .Names = c("id", 
"url", "name", "color", "default"))), list(NA_character_)), mainId = c("216226960", 
"215647494", "242390063")), .Names = c("label", "mainId"), row.names = c(NA, 
-3L), class = c("tbl_df", "tbl", "data.frame"))

Я хотел бы сгладить значения из метки, сопоставляя их с mainId, чтобы я мог связать каждый подэлемент из label с его основным идентификатором. Я пытаюсь получить тиббл с заголовками : _4 _, _ 5_, name, color, mainId.

Решения для аналогичного вопроса работают нормально, если в подэлемент label

map_df(h, flatten_dfr)

Ошибка в bind_rows_ (x, .id): аргумент 1 должен иметь имена


person Dambo    schedule 11.02.2018    source источник
comment
Вы хотите, чтобы третий mainID был отброшен или оставил NA для других значений?   -  person alistaire    schedule 11.02.2018
comment
@alistaire Я бы хотел иметь НП   -  person Dambo    schedule 11.02.2018


Ответы (2)


Вот подход, который заменяет элемент, содержащий только NA_character_, списком из NA, названных как первый элемент первой строки. После этого bind_rows и unnest будут работать нормально.

library(tidyverse)

nested_names <- names(pluck(h, 'label', 1, 1))

h2 <- h %>% 
    mutate(label = map(label, map_if, 
                       ~is.null(names(.x)), 
                       ~setNames(rep(list(NA), length(nested_names)), 
                                 nested_names)), 
           label = map(label, bind_rows)) %>% 
    unnest()

h2
#> # A tibble: 6 x 6
#>   mainId           id url                           name     color default
#>   <chr>         <int> <chr>                         <chr>    <chr> <lgl>  
#> 1 216226960 431676528 https://api.github.com/repos… per svi… d4c5… FALSE  
#> 2 216226960 442034204 https://api.github.com/repos… sito pr… 5319… FALSE  
#> 3 215647494 442051239 https://api.github.com/repos… mappa    0052… FALSE  
#> 4 215647494 431676528 https://api.github.com/repos… per svi… d4c5… FALSE  
#> 5 215647494 442034204 https://api.github.com/repos… sito pr… 5319… FALSE  
#> 6 242390063        NA <NA>                          <NA>     <NA>  NA
person alistaire    schedule 11.02.2018

Вы можете сначала отфильтровать mainId с отсутствующими label, а затем добавить их обратно с full_join (или просто bind_rows, если ваши mainId уникальны).

library(tidyverse)

h_label_missing <- h %>% 
  filter(map_lgl(label, ~all(is.na(.)))) %>% 
  select(-label)

h %>% 
  filter(!map_lgl(label, ~all(is.na(.)))) %>% 
  mutate(label = map(label, bind_rows)) %>% 
  unnest() %>% 
  full_join(h_label_missing, by = "mainId")

# A tibble: 6 x 6
#     mainId         id url                                                                                  name             color  default
#       <chr>     <int> <chr>                                                                                <chr>            <chr>  <lgl>  
# 1 216226960 431676528 https://api.github.com/repos/emergenzeHack/terremotocentro/labels/per%20sviluppatori per sviluppatori d4c5f9 F      
# 2 216226960 442034204 https://api.github.com/repos/emergenzeHack/terremotocentro/labels/sito%20principale  sito principale  5319e7 F      
# 3 215647494 442051239 https://api.github.com/repos/emergenzeHack/terremotocentro/labels/mappa              mappa            0052cc F      
# 4 215647494 431676528 https://api.github.com/repos/emergenzeHack/terremotocentro/labels/per%20sviluppatori per sviluppatori d4c5f9 F      
# 5 215647494 442034204 https://api.github.com/repos/emergenzeHack/terremotocentro/labels/sito%20principale  sito principale  5319e7 F      
# 6 242390063        NA NA                                                                                   NA               NA     NA     
person kath    schedule 11.02.2018