Вопросы по теме 'sparkr'
Сбой метода сбора SparkR с OutOfMemory в пространстве кучи Java
С помощью SparkR я пытаюсь использовать PoC для сбора RDD, который я создал из текстовых файлов, содержащих около 4 миллионов строк.
Мой кластер Spark работает в Google Cloud, развернут bdutil и состоит из 1 главного и 2 рабочих с 15 ГБ ОЗУ и 4...
1811 просмотров
schedule
29.06.2022
Ошибка при установке sparkR для R
Я пытаюсь установить пакет SparkR в моей версии Windows 7 R Studio.
Пока я получаю новейшую версию R (3.2.0). Студия R (0.98.1103). После этого я просматриваю разные источники, чтобы понять, как установить SparkR.
После этого я сначала...
404 просмотров
schedule
10.08.2023
Ошибка SparkR в sparkR.init(master=local) в RStudio
Я установил пакет SparkR из дистрибутива Spark в библиотеку R. Я могу вызвать следующую команду, и она работает правильно: library(SparkR)
Однако, когда я пытаюсь получить контекст Spark, используя следующий код,
sc <-...
2271 просмотров
schedule
27.07.2023
Использование столбцов sparkR
Столбец SparkR предоставляет длинный список полезных методов, например isNull, но в sparkR у меня возникла проблема с их использованием. Я запускаю sparkR в R вот так
cd /home/ole/R/spark-1.4.0 ./bin/sparkR --packages...
595 просмотров
schedule
21.12.2022
Вычесть все элементы в столбце в sparkR
У меня есть DataFrame 'res' в sparkR. 'res' содержит идентификатор и даты. Таким образом, первые записи выглядят так: «ID» = 1 2 3 ... и «дата» = «2012-6-5», «2013-5-5», «2015-10-11» ...
Я хочу создать новый набор данных, в котором все «даты»...
228 просмотров
schedule
29.07.2022
Как сделать функцию фильтра по датам в sparkR
'u' - это DataFrame, содержащий ID = 1, 2, 3 .. и время = "2010-01-01", "2012-04-06", .. ID и время имеют строковый тип. Я конвертирую тип времени» в «Дата»
u$time <- cast(u[[2]], "Date")
Я теперь хочу в первый раз в u.
first <-...
398 просмотров
schedule
20.06.2023
Как получить значение суммы, не делая его локальным
В SparkR у меня есть DataFrame u , который содержит
'amount' = 231,2,324,1213 ...
Для вычисления суммы в sparkR я использую
summa <- agg(u, amount="sum")
Теперь summa — это DataFrame. Я хочу узнать значение summa , и я могу...
25 просмотров
schedule
07.07.2022
Чтобы запустить функцию tabulate и which.max в sparkR
У меня есть DataFrame data в sparkR. Он содержит user = 12 311 12 320, ... и type = 1 2 3 4 . У нас 10000 пользователей.
Например, у одного пользователя тип = 1 2 3 4 4 4 2 4. Я хочу найти наиболее распространенное целое число для этого...
338 просмотров
schedule
24.08.2022
Как вычесть элементы в DataFrame
В SparkR у меня есть DataFrame data , содержащий id , amount_spent и amount_won .
Например, для id=1 у нас есть
head(filter(data, data$id==1))
и выход
1 30 10
1 40 100
1 22 80
1 14 2
Пока я хочу знать, выиграл ли...
90 просмотров
schedule
07.06.2023
SparkR: объединение двух фреймов данных при нескольких условиях соединения
СпаркР версии 1.4.1
Я пытаюсь присоединиться к двум кадрам данных df1 и df2 по двум условиям соединения, например:
df3 <- join(df1, df2, df1$col1==df2$col2 && df1$col3==df2$col4)
Однако это не удается с этой ошибкой:...
1474 просмотров
schedule
30.08.2022
Рассчитать размер кадра данных SparkR
У меня есть кадр данных, который я получил, выполнив запрос с использованием SQLContext :
> df <- sql(sqlContext, "SELECT * FROM myTable")
когда я пытаюсь получить его размер
> object.size(df)
1024 bytes
Я знаю, что это не...
783 просмотров
schedule
30.07.2022
различное поведение при использовании createDataFrame и read.df в SparkR
Я использую Спарк 1.5.1
Когда я делаю это
df <- createDataFrame(sqlContext, iris)
#creating a new column for category "Setosa"
df$Species1<-ifelse((df)[[5]]=="setosa",1,0)
head(df)
вывод: создан новый столбец...
349 просмотров
schedule
27.12.2022
Отсутствует значение временного ряда SparkR
Я работаю со SparkR над временными рядами, и у меня есть вопрос.
После некоторой операции я получил что-то вроде этого, где DayHour представляют день и час значения идентификатора.
DayHour ID Value
01 00 4704 10
01 01 4705 11
.
.
....
170 просмотров
schedule
04.06.2023
Ошибка при установке sparkR
Я пытаюсь установить SparkR
library(devtools)
install_github("amplab-extras/SparkR-pkg", subdir="pkg")
но потом я нахожу эту ошибку
Запуск sbt из sbt/sbt-launch-0.13.6.jar Недопустимый или поврежденный файл jar...
405 просмотров
schedule
13.05.2023
Можно ли использовать пакет R в sparkR?
Я изучаю sparkR и знаю, что в CRAN так много полезных пакетов R. Но похоже, что пакет R нельзя использовать в sparkR. Я не уверен в этом.
Это правда??? Если это не так, не могли бы вы объяснить, как импортировать пакет R в sparkR?
672 просмотров
schedule
12.08.2022
Замена специальных символов в столбце с помощью SparkR
У меня есть кадр данных, который содержит столбец. В этом столбце у меня есть строка, как показано ниже
<a href="mailto:[email protected]">[email protected]</a>
<a href="mailto:MICAHELBAHOU@YAHO">[email protected]</a>…
Но...
920 просмотров
schedule
16.03.2024
Как использовать write.df для хранения CSV-файла при использовании Sparkr и Rstudio?
Я изучаю Спаркр. У меня есть CSV-файл:
a <- read.df(sqlContext,"./mine/a2014.csv","csv")
Я хочу использовать write.df для хранения этого файла. Однако, когда я использую:
write.df(a,"mine/a.csv")
Я...
1138 просмотров
schedule
20.03.2023
Ошибка при попытке использовать textFile в sparkR
Я пытался следовать руководству, чтобы получить количество слов в «README.md» с помощью sparkR. Версия Spark: 1.6.1 Версия R: 3.3.0 Версия Ubuntu: 14 Однако, когда я делаю lines <- sc.textFile("README.md") , я получаю здесь ошибку
Error:...
584 просмотров
schedule
10.07.2023
Запуск SparkR через RStudio
Я использовал ссылку ниже, чтобы узнать, как запустить SparkR через RStudio:
http://blog.danielemaasit.com/2015/07/26/installing-and-starting-sparkr-locally-on-windows-8-1-and-rstudio/
У меня проблемы с разделом 4.5.
if...
936 просмотров
schedule
14.10.2023
Как объединить (объединить) два SparkDataFrame в SparkR и сохранить один из общих столбцов
у меня есть следующий Spark DataFrame:
aps=data.frame(agent=c('a','b','c','d','a','a','a','b','c','a','b'),product=c('P1','P2','P3','P4','P1','P1','P2','P2','P2','P3','P3'),...
996 просмотров
schedule
07.03.2023