Вопросы по теме 'stringr'

R количество раз, когда слово появляется в элементе списка
У меня есть список, состоящий из слов. > head(splitWords2) [[1]] [1] "Some" "additional" "information" "that" "we" "would" "need" "to" "replicate" "the" [11] "experiment" "is"...
10278 просмотров
schedule 04.04.2022

Извлечение информации из текста в R
Я работаю над извлечением сущностей в R. У меня есть поля UniqueID и Text — нужно извлечь информацию о местоположении из текстового поля. Мое текстовое поле имеет описание с названиями местоположений text <- c("SERANGOON JC","Blk 4","SHELL...
777 просмотров
schedule 22.07.2022

Извлечение данных о местоположении с помощью регулярного выражения в R
Новичок здесь, у меня есть данные, которые выглядят примерно так: {'id': 19847005, 'profile_sidebar_fill_color': u'http://pbs.foo.com/profile_background', 'profile_text_color': u'333333', 'followers_count': 1105, 'location': u'San Diego, CA',...
203 просмотров
schedule 03.02.2023

Удаление символов после символа ЕВРО в R
У меня есть символ евро, сохраненный в переменной "евро": euro <- "\u20AC" euro #[1] "€" И переменная «европоиск» содержит «услуги, как определено в этом ТЗ, по цене 15 896,80 евро (если они выполняются для» . eurosearch [1] "services...
2692 просмотров
schedule 25.09.2022

dplyr: inner_join с частичным совпадением строки
Я хотел бы объединить два фрейма данных, если столбец seed в фрейме данных y частично совпадает со столбцом string в x . Этот пример должен иллюстрировать: # What I have x <- data.frame(idX=1:3, string=c("Motorcycle", "TractorTrailer",...
14586 просмотров
schedule 17.10.2022

Почему stringr меняет кодировку при работе со строками?
Это странное поведение stringr меня очень раздражает. stringr без предупреждения изменяет кодировку некоторых строк, содержащих экзотические символы, в моем случае ø, å, æ, é и некоторые другие... Если вы str_trim вектор символов, то те, что...
1402 просмотров
schedule 31.10.2022

Неожиданное поведение с str_replace NA
Я пытаюсь преобразовать строку символов в числовую и столкнулся с неожиданным поведением с str_replace . Вот минимальный рабочий пример: library(stringr) x <- c("0", "NULL", "0") # This works, i.e. 0 NA 0 as.numeric(str_replace(x, "NULL",...
1924 просмотров
schedule 30.01.2023

R Regex со Stringr: символ (0) Ошибка
Я пытаюсь воссоздать старый проект. Однако я предполагаю, что что-то изменилось в пакете stringr, потому что мой код больше не работает. Минимальный рабочий пример (MWE): library(httr) library(stringr) library(XML) url <-...
563 просмотров
schedule 22.04.2023

Извлечение текста из НА с помощью R и tidyr ()
У меня есть четыре столбца данных во фрейме данных. Эти столбцы указывают, находится ли запись (строка) в 4 разных частях Лондона в соответствии с разделением север / юг / восток / запад (НИКАКАЯ запись не присутствует более чем в ОДНОМ столбце),...
80 просмотров
schedule 07.02.2022

Использование stringr для извлечения одного или нескольких слов из текстовой строки в R
У меня есть следующий фрейм данных: df <- data.frame(city=c("in London", "in Manchester city", "in Sao Paolo")) Я использую str_extract и возвращаю слово после «in» в отдельном столбце. library(stringr) str_extract(df$city,...
2645 просмотров
schedule 13.02.2023

Заменить точку после цифры
Я столкнулся с проблемой, которая кажется простой, но решение, которое я нашел, не удовлетворяет. Я хочу заменить любую точку, за которой следует число, запятой. Например, strings <- c("22.222.222", "12.323", "don.t replace") будет...
130 просмотров
schedule 26.12.2023

Регулярное выражение с группой без захвата с использованием Stringr в R
Я пытаюсь использовать группы без захвата с функцией str_extract из пакета stringr . Вот пример: library(stringr) txt <- "foo" str_extract(txt,"(?:f)(o+)") Это возвращает "foo" пока я ожидаю, что он вернется только "oo"...
2137 просмотров
schedule 02.01.2023

Как разделить строку с помощью tidyr::separate в R и сохранить значения строки-разделителя?
У меня есть набор данных: crimes<-data.frame(x=c("Smith", "Jones"), charges=c("murder, first degree-G, manslaughter-NG", "assault-NG, larceny, second degree-G")) Я использую tidyr:separate, чтобы разделить столбец сборов на совпадение с...
7603 просмотров
schedule 04.10.2023

Р: Включает ли [:punct:] +?
Глядя на R документацию по регулярным выражениям , [:punct:] включает в себя следующие символы - Знаки препинания: ! " # $ % & ' ( ) * + , - . / : ; ‹ = > ? @ [ \ ] ^ _ ` { | } ~. Но когда я пытаюсь использовать это в...
28 просмотров
schedule 04.03.2023

Как заменить строки чисто числами как NA?
Я хотел бы заменить строки, содержащие чисто числа, с отсутствующим значением, NA. Я попробовал регулярные выражения ^ , которые соответствуют началу строки, [:digit:] , содержащие числа 0-9, и + для совпадения хотя бы 1 раз, но они не работают....
90 просмотров
schedule 06.06.2023

Обнаружение списка слов в строковой переменной и извлечение совпадающих слов в новую переменную во фрейме данных
У меня есть два кадра данных переменных, один из которых является вектором символов. Каждая строка в «MyVector» содержит строку с одним именем (например, «Пит»). Имя может отличаться по своему положению в строке символов. Я хочу создать код,...
3139 просмотров
schedule 06.03.2022

R наборы координат извлекаются из строки
Я пытаюсь извлечь наборы координат из строк и изменить формат. Я пробовал некоторые из пакетов stringr и ничего не добился с извлечением паттернов. Я впервые имею дело с регулярным выражением и все еще немного запутываю создание шаблона. Есть...
1143 просмотров
schedule 30.01.2023

stringr извлекает текст на основе заглавных букв и позиции
Я пытаюсь извлечь некоторые слова (названия стран) из строк. Строки являются элементами списка, например, myList <- list(associations = c("Madeup speciesone: \r\n\t\t\t\t", "Foobarae foobar: Russia - 123,",...
57 просмотров
schedule 24.05.2022

Как извлечь последние 4 цифры строки символов в R
Я хотел бы извлечь ПОСЛЕДНИЕ 4 цифры в заданной строке, но не могу понять. ПОСЛЕДНИЕ 4 цифры могут быть «XXXX» или «XXXX-». В конечном итоге у меня есть список разнородных записей, которые включают отдельные годы (например, 2001 или 2001), списки...
3798 просмотров
schedule 21.02.2022

Извлечь только слова, содержащие символы ASCII, из вектора строк
Я застрял с этим, поэтому, пожалуйста, любые советы приветствуются. b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE)) Возвращает список: List of 2 $ : chr [1:2] "hello" "ring" $ : chr "trust" Но я хочу...
140 просмотров
schedule 12.06.2022