Я использую разъем Spark Cassandra. Для получения данных из таблицы Cassandra требуется 5-6 минут. В Spark я видел много задач и Executor в журнале. Причина может быть в том, что Spark разделил процесс на множество задач!
Ниже приведен пример моего кода:
public static void main(String[] args) {
SparkConf conf = new SparkConf(true).setMaster("local[4]")
.setAppName("App_Name")
.set("spark.cassandra.connection.host", "127.0.0.1");
JavaSparkContext sc = new JavaSparkContext(conf);
JavaRDD<Demo_Bean> empRDD = javaFunctions(sc).cassandraTable("dev",
"demo");
System.out.println("Row Count"+empRDD.count());
}