Вопросы по теме 'stringr'
R количество раз, когда слово появляется в элементе списка
У меня есть список, состоящий из слов.
> head(splitWords2)
[[1]]
[1] "Some" "additional" "information" "that" "we" "would" "need" "to" "replicate" "the"
[11] "experiment" "is"...
10278 просмотров
schedule
04.04.2022
Извлечение информации из текста в R
Я работаю над извлечением сущностей в R. У меня есть поля UniqueID и Text — нужно извлечь информацию о местоположении из текстового поля. Мое текстовое поле имеет описание с названиями местоположений
text <- c("SERANGOON JC","Blk 4","SHELL...
777 просмотров
schedule
22.07.2022
Извлечение данных о местоположении с помощью регулярного выражения в R
Новичок здесь, у меня есть данные, которые выглядят примерно так:
{'id': 19847005, 'profile_sidebar_fill_color': u'http://pbs.foo.com/profile_background', 'profile_text_color': u'333333', 'followers_count': 1105, 'location': u'San Diego, CA',...
203 просмотров
schedule
03.02.2023
Удаление символов после символа ЕВРО в R
У меня есть символ евро, сохраненный в переменной "евро":
euro <- "\u20AC"
euro
#[1] "€"
И переменная «европоиск» содержит «услуги, как определено в этом ТЗ, по цене 15 896,80 евро (если они выполняются для» .
eurosearch
[1] "services...
2692 просмотров
schedule
25.09.2022
dplyr: inner_join с частичным совпадением строки
Я хотел бы объединить два фрейма данных, если столбец seed в фрейме данных y частично совпадает со столбцом string в x . Этот пример должен иллюстрировать:
# What I have
x <- data.frame(idX=1:3, string=c("Motorcycle", "TractorTrailer",...
14586 просмотров
schedule
17.10.2022
Почему stringr меняет кодировку при работе со строками?
Это странное поведение stringr меня очень раздражает. stringr без предупреждения изменяет кодировку некоторых строк, содержащих экзотические символы, в моем случае ø, å, æ, é и некоторые другие... Если вы str_trim вектор символов, то те, что...
1402 просмотров
schedule
31.10.2022
Неожиданное поведение с str_replace NA
Я пытаюсь преобразовать строку символов в числовую и столкнулся с неожиданным поведением с str_replace . Вот минимальный рабочий пример:
library(stringr)
x <- c("0", "NULL", "0")
# This works, i.e. 0 NA 0
as.numeric(str_replace(x, "NULL",...
1924 просмотров
schedule
30.01.2023
R Regex со Stringr: символ (0) Ошибка
Я пытаюсь воссоздать старый проект. Однако я предполагаю, что что-то изменилось в пакете stringr, потому что мой код больше не работает. Минимальный рабочий пример (MWE):
library(httr)
library(stringr)
library(XML)
url <-...
563 просмотров
schedule
22.04.2023
Извлечение текста из НА с помощью R и tidyr ()
У меня есть четыре столбца данных во фрейме данных. Эти столбцы указывают, находится ли запись (строка) в 4 разных частях Лондона в соответствии с разделением север / юг / восток / запад (НИКАКАЯ запись не присутствует более чем в ОДНОМ столбце),...
80 просмотров
schedule
07.02.2022
Использование stringr для извлечения одного или нескольких слов из текстовой строки в R
У меня есть следующий фрейм данных:
df <- data.frame(city=c("in London", "in Manchester city", "in Sao Paolo"))
Я использую str_extract и возвращаю слово после «in» в отдельном столбце.
library(stringr)
str_extract(df$city,...
2645 просмотров
schedule
13.02.2023
Заменить точку после цифры
Я столкнулся с проблемой, которая кажется простой, но решение, которое я нашел, не удовлетворяет. Я хочу заменить любую точку, за которой следует число, запятой. Например,
strings <- c("22.222.222", "12.323", "don.t replace")
будет...
130 просмотров
schedule
26.12.2023
Регулярное выражение с группой без захвата с использованием Stringr в R
Я пытаюсь использовать группы без захвата с функцией str_extract из пакета stringr . Вот пример:
library(stringr)
txt <- "foo"
str_extract(txt,"(?:f)(o+)")
Это возвращает
"foo"
пока я ожидаю, что он вернется только
"oo"...
2137 просмотров
schedule
02.01.2023
Как разделить строку с помощью tidyr::separate в R и сохранить значения строки-разделителя?
У меня есть набор данных:
crimes<-data.frame(x=c("Smith", "Jones"), charges=c("murder, first degree-G, manslaughter-NG", "assault-NG, larceny, second degree-G"))
Я использую tidyr:separate, чтобы разделить столбец сборов на совпадение с...
7603 просмотров
schedule
04.10.2023
Р: Включает ли [:punct:] +?
Глядя на R документацию по регулярным выражениям , [:punct:] включает в себя следующие символы -
Знаки препинания:
! " # $ % & ' ( ) * + , - . / : ; ‹ = > ? @ [ \ ] ^ _ ` { | } ~.
Но когда я пытаюсь использовать это в...
28 просмотров
schedule
04.03.2023
Как заменить строки чисто числами как NA?
Я хотел бы заменить строки, содержащие чисто числа, с отсутствующим значением, NA. Я попробовал регулярные выражения ^ , которые соответствуют началу строки, [:digit:] , содержащие числа 0-9, и + для совпадения хотя бы 1 раз, но они не работают....
90 просмотров
schedule
06.06.2023
Обнаружение списка слов в строковой переменной и извлечение совпадающих слов в новую переменную во фрейме данных
У меня есть два кадра данных переменных, один из которых является вектором символов. Каждая строка в «MyVector» содержит строку с одним именем (например, «Пит»). Имя может отличаться по своему положению в строке символов. Я хочу создать код,...
3139 просмотров
schedule
06.03.2022
R наборы координат извлекаются из строки
Я пытаюсь извлечь наборы координат из строк и изменить формат.
Я пробовал некоторые из пакетов stringr и ничего не добился с извлечением паттернов. Я впервые имею дело с регулярным выражением и все еще немного запутываю создание шаблона.
Есть...
1143 просмотров
schedule
30.01.2023
stringr извлекает текст на основе заглавных букв и позиции
Я пытаюсь извлечь некоторые слова (названия стран) из строк. Строки являются элементами списка, например,
myList <- list(associations = c("Madeup speciesone: \r\n\t\t\t\t", "Foobarae foobar: Russia - 123,",...
57 просмотров
schedule
24.05.2022
Как извлечь последние 4 цифры строки символов в R
Я хотел бы извлечь ПОСЛЕДНИЕ 4 цифры в заданной строке, но не могу понять. ПОСЛЕДНИЕ 4 цифры могут быть «XXXX» или «XXXX-». В конечном итоге у меня есть список разнородных записей, которые включают отдельные годы (например, 2001 или 2001), списки...
3798 просмотров
schedule
21.02.2022
Извлечь только слова, содержащие символы ASCII, из вектора строк
Я застрял с этим, поэтому, пожалуйста, любые советы приветствуются.
b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))
Возвращает список:
List of 2
$ : chr [1:2] "hello" "ring"
$ : chr "trust"
Но я хочу...
140 просмотров
schedule
12.06.2022