Я пытаюсь получить некоторые данные из базы данных Impala, используя функцию sqlQuery из пакета RODBC. Результаты, которые я получаю, меняются от одного выполнения запроса к другому выполнению того же самого запроса.
Data.frame, который я получаю, не всегда имеет одинаковое количество строк:
library("RODBC")
conn <- odbcConnect("Cloudera Impala DSN;host=mydb;port=21050")
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 26600 220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 142561 220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 23500 220
Фактически этот запрос должен возвращать кадр данных размером 142561 x 220.
С другой стороны, следующий запрос всегда возвращает один и тот же (правильный) результат:
sqlQuery(conn, "select count(*) from hydr where flight= 'V0051' ")
count(*)
1 142561
believeNRows
значениеFALSE
? - person eminik   schedule 26.05.2016odbcConnect
, хотя этот файл существует по адресу указанный путь, аfile.exists("/opt/cloudera/impalaodbc/lib/32/libclouderaimpalaodbc32.so")
возвращаетTRUE
- person mdebbiche   schedule 27.05.2016