Извлечь только слова, содержащие символы ASCII, из вектора строк

Я застрял с этим, поэтому, пожалуйста, любые советы приветствуются.

b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))

Возвращает список:

    List of 2
 $ : chr [1:2] "hello" "ring"
 $ : chr "trust"

Но я хочу иметь вектор со строками этих слов для каждого элемента вектора c('hello ringпрг','trust'), например "hello ring", "trust". Любые другие функции и пакеты также приветствуются.


person Shin    schedule 22.12.2016    source источник
comment
Невозможно извлекать только английские слова без словаря. Теперь, если вы действительно хотите извлечь символы ASCII...   -  person Roland    schedule 22.12.2016
comment
@ Роланд, ты прав, название отредактировано   -  person Shin    schedule 23.12.2016


Ответы (2)


Используйте sapply с paste как в:

b<-str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))

sapply(b, paste, collapse = " ")

## [1] "hello ring" "trust" 
person Tyler Rinker    schedule 22.12.2016

Мы можем использовать

unlist(str_extract_all(c('hello ringпрг','trust'), regex("[A-Za-z ]+", TRUE)))
#[1] "hello ring" "trust" 

Или используйте шаблон как "[[:ascii:]]+"

person akrun    schedule 22.12.2016