Для приведенного ниже набора данных мне нужно получить сводные данные на основе выбранного столбца. Образец набора данных содержит следующие данные ниже.
+---------+----------+--------+---------+
| Column1 | Column2 | Expend | Expend2 |
+---------+----------+--------+---------+
| School1 | Student1 | 5 | 10 |
+---------+----------+--------+---------+
| School1 | Student2 | 11 | 12 |
+---------+----------+--------+---------+
| School2 | Student1 | 6 | 8 |
+---------+----------+--------+---------+
| School2 | Student2 | 7 | 8 |
+---------+----------+--------+---------+
Мне нужно получить сводные данные для столбца 2, как показано ниже,
Обязательный формат
+---------+----------+--------+---------+
| Column1 | Column2 | Expend | Expend2 |
+---------+----------+--------+---------+
| School1 | Total | 16 | 22 |
+---------+----------+--------+---------+
| School1 | Student1 | 5 | 10 |
+---------+----------+--------+---------+
| School1 | Student2 | 11 | 12 |
+---------+----------+--------+---------+
| School2 | Total | 13 | 16 |
+---------+----------+--------+---------+
| School2 | Student1 | 6 | 8 |
+---------+----------+--------+---------+
| School2 | Student2 | 7 | 8 |
+---------+----------+--------+---------+
Я пытался использовать функцию куба в наборе данных, но это не дало ожидаемых результатов. Я получаю значения null
вместо Total
, что тоже нормально, но данные, которые я не получаю в указанном выше формате.
Я хотел попробовать использовать dataset.cube("Column2").agg(sum("Expend1"),sum("Expend2"))
;
Но эта приведенная выше строка кода дает мне только данные для Column2. Как я могу получить значения Column1 с указанными выше возвращаемыми данными.