перенос фасета нескольких столбцов / строк в altair

В ggplot2 легко создать фасетный график с фасетами, охватывающими как строки, так и столбцы. Есть ли "изящный" способ сделать это в altair? facet документация

Возможно отображение фасетов в один столбец,

import altair as alt
from vega_datasets import data
iris = data.iris

chart = alt.Chart(iris).mark_point().encode(
    x='petalLength:Q',
    y='petalWidth:Q',
    color='species:N'
).properties(
    width=180,
    height=180
).facet(
    row='species:N'
)

и в единственном ряду

chart = alt.Chart(iris).mark_point().encode(
    x='petalLength:Q',
    y='petalWidth:Q',
    color='species:N'
).properties(
    width=180,
    height=180
).facet(
    column='species:N'
)

но часто я просто хочу построить их в сетке, используя более одного столбца / строки, то есть те, которые выстраиваются в один столбец / строку, ничего конкретного не означают.

Например, см. facet_wrap из ggplot2: http://www.cookbook-r.com/Graphs/Facets_(ggplot2)/#facetwrap


person saladi    schedule 03.05.2018    source источник


Ответы (6)


В версии 3.1 Altair или более поздней (выпущенной в июне 2019 г.) фасеты в оболочке поддерживаются непосредственно в API Altair. Изменив пример радужной оболочки, вы можете обернуть фасеты двумя столбцами следующим образом:

import altair as alt
from vega_datasets import data
iris = data.iris()

alt.Chart(iris).mark_point().encode(
    x='petalLength:Q',
    y='petalWidth:Q',
    color='species:N'
).properties(
    width=180,
    height=180
).facet(
    facet='species:N',
    columns=2
)

введите описание изображения здесь

В качестве альтернативы та же диаграмма может быть указана с фасетом в качестве кодировки:

alt.Chart(iris).mark_point().encode(
    x='petalLength:Q',
    y='petalWidth:Q',
    color='species:N',
    facet=alt.Facet('species:N', columns=2)
).properties(
    width=180,
    height=180,
)

Аргумент столбцы может быть аналогичным образом указан для составных диаграмм в alt.concat() и повторяющихся диаграмм alt.Chart.repeat().

person jakevdp    schedule 11.06.2019
comment
Спасибо, наглядный пример. У меня был alt.layer(line, band, data=df).facet(column='series'), который произвел 8 граней, я хотел 4 ширины, поэтому попробовал alt.layer(line, band, data=df).facet(column='series', columns=4), что в ретроспективе не имеет смысла. column - это способ сделать макет динамическим / управляемым данными, а columns - статическим параметром, одновременное использование column и columns неоднозначно, но не является ошибкой. columns=4 игнорируется и отображает 8 графиков по горизонтали. alt.layer(line, band, data=df).facet(facet='series', columns=4) дал мне 2 ряда по 4 диаграммы, которые я хотел. - person Davos; 26.07.2019

Вы можете сделать это, указав .repeat() и список переменных row и column. Это ближе к facet_grid() ggplot, чем к facet_wrap(), но API очень элегантен. (См. Обсуждение здесь.) API - это здесь

iris = data.iris()

alt.Chart(iris).mark_circle().encode(
    alt.X(alt.repeat("column"), type='quantitative'),
    alt.Y(alt.repeat("row"), type='quantitative'),
    color='species:N'
).properties(
    width=250,
    height=250
).repeat(
    row=['petalLength', 'petalWidth'],
    column=['sepalLength', 'sepalWidth']
).interactive()

Что производит:

введите описание изображения здесь

Обратите внимание, что весь набор интерактивен в тандеме (увеличение, уменьшение).

Обязательно ознакомьтесь с RepeatedCharts и FacetedCharts в документации.

Создание сетки графиков в стиле facet_wrap()

Если вы хотите, чтобы лента диаграмм располагалась одна за другой (не обязательно сопоставляя столбец или строку с переменными в вашем фрейме данных), вы можете сделать это, заключив комбинацию hconcat() и vconcat() поверх списка графиков Альтаира.

Я уверен, что есть более элегантные способы, но я сделал это так.

Логика, использованная в приведенном ниже коде:

  1. Сначала создайте base диаграмму Альтаира
  2. Используйте transform_filter(), чтобы отфильтровать данные по нескольким подзаголовкам
  3. Определитесь с количеством участков в одной строке и разрежьте этот список на части.
  4. Прокрутите список списков, выкладывая по одной строке за раз.

-

import altair as alt
from vega_datasets import data
from altair.expr import datum

iris = data.iris()

base = alt.Chart(iris).mark_point().encode(
    x='petalLength:Q',
    y='petalWidth:Q',
    color='species:N'
).properties(
    width=60,
    height=60
)

#create a list of subplots
subplts = []
for pw in iris['petalWidth'].unique():
    subplts.append(base.transform_filter(datum.petalWidth == pw))


def facet_wrap(subplts, plots_per_row):
    rows = [subplts[i:i+plots_per_row] for i in range(0, len(subplts), plots_per_row)]
    compound_chart = alt.hconcat()
    for r in rows:
        rowplot = alt.vconcat() #start a new row
        for item in r:
            rowplot |= item #add suplot to current row as a new column
        compound_chart &= rowplot # add the entire row of plots as a new row
    return compound_chart


compound_chart = facet_wrap(subplts, plots_per_row=6)    
compound_chart

производить:

введите описание изображения здесь

person Ram Narasimhan    schedule 04.05.2018
comment
Спасибо! Я хотел добавить статический оверлей и заголовок к каждому второстепенному сюжету и понял, что мне нужен subplts.append(base.transform_filter(datum ...) + static_plot).properties(title=...). - person Nickolay; 31.05.2018

Вот общее решение, в котором есть место для добавления слоев. DataFrame в этом случае состоит из трех столбцов и имеет длинную форму.

numcols=3 # specify the number of columns you want 
all_categories=df['Category_Column'].unique() # array of strings to use as your filters and titles

rows=alt.vconcat(data=df)
numrows=int(np.ceil(len(all_categories) / numcols))
pointer=0
for _ in range(numrows):

  row=all_categories[pointer:pointer+numcols]
  cols=alt.hconcat()

  for a_chart in row:

     # add your layers here
     # line chart
     line=alt.Chart().mark_line(point=True).encode(
        x='variable',
        y='value'
     ).transform_filter(datum.Category_Column == a_chart).properties(
        title=a_chart, height=200, width=200)

     # text labels
     text=alt.Chart().mark_text().encode(
        x='variable', 
        y='value'
     ).transform_filter(datum.Category_Column == a_chart)

     both = line + text
     cols |= both

  rows &= cols
  pointer += numcols

rows

введите здесь описание изображения

person campo    schedule 12.09.2018

Начиная с ответа Рама и используя более функциональный подход, вы также можете попробовать:

import altair as alt
from vega_datasets import data
from altair.expr import datum

iris = data.iris()

base = alt.Chart(iris).mark_point().encode(
    x='petalLength:Q',
    y='petalWidth:Q',
    color='species:N'
)

# chart factory
def make_chart(base_chart, pw, options):
    title = 'Petal Width {:.2f}'.format(pw)
    chart = base_chart\
      .transform_filter(datum.petalWidth == pw)\
      .properties(width=options['width'], height=options['height'], title=title)
    return chart

# create all charts
options = {'width': 50, 'height': 60}
charts = [make_chart(base, pw, options) for pw in sorted(iris['petalWidth'].unique())]

# make a single row
def make_hcc(row_of_charts):
    hconcat = [chart for chart in row_of_charts]
    hcc = alt.HConcatChart(hconcat=hconcat)
    return hcc

# take an array of charts and produce a facet grid
def facet_wrap(charts, charts_per_row):
    rows_of_charts = [
        charts[i:i+charts_per_row] 
        for i in range(0, len(charts), charts_per_row)]        
    vconcat = [make_hcc(r) for r in rows_of_charts]    
    vcc = alt.VConcatChart(vconcat=vconcat)\
      .configure_axisX(grid=True)\
      .configure_axisY(grid=True)
    return vcc

# assemble the facet grid
compound_chart = facet_wrap(charts, charts_per_row=6)
compound_chart.properties(title='My Facet grid')

Фасетная сетка из 22 диаграмм, по 6 в каждой строке

Таким образом, должно быть легко настроить код и передать некоторые параметры конфигурации для всех ваших графиков (например, показать / скрыть галочки, установить одинаковые нижние / верхние пределы для всех графиков и т. Д.).

person jackdbd    schedule 29.08.2018

Я обнаружил, что выполнение конкатенации длиной более двух в любом направлении приводит к искажению данных и выпадению из окна. Я решил это, рекурсивно разбив массив подзаголовков на квадранты и выполнив чередование конкатенаций строк и столбцов. Если у вас нет этой проблемы, хорошо для вас: вы можете использовать одну из уже опубликованных более простых реализаций. Но если вы это сделаете, я надеюсь, что это поможет.

def facet_wrap(subplots, plots_per_row):
    # base cases
    if len(subplots) == 0 or plots_per_row == 0:
        return None
    if len(subplots) == 1:
        return subplots[0]

    # split subplots list into quadrants
    # we always fill top and left first
    quadrants = [[], [], [], []] # tl, tr, bl, br
    for subplot_index, subplot in enumerate(subplots):
        right_half = (subplot_index % plots_per_row) >= plots_per_row // 2
        lower_half = subplot_index >= len(subplots) / 2
        quadrants[2 * lower_half + right_half].append(subplot)

    # recurse on each quadrant
    # we want a single chart or None in place of each quadrant
    m = plots_per_row % 2 # if plots_per_row is odd then we need to split it unevenly
    quadplots = [
        facet_wrap(q, plots_per_row // 2 + m * (0 == (i % 2))) \
        for i, q in enumerate(quadrants)
    ]

    # join the quadrants
    rows = [quadplots[:2], quadplots[2:]]
    colplot = alt.hconcat()
    for row in rows:
        rowplot = alt.vconcat()
        for item in row:
            if item != None:
                rowplot = rowplot | item
        colplot &= rowplot
    return colplot
person Barry McNamara    schedule 24.02.2019

Не используйте column или row в repeat, но repeat следующим образом:

import altair as alt
from vega_datasets import data

cars = data.cars.url

alt.Chart(cars, width=200, height=150).mark_bar().encode(
    x=alt.X(alt.repeat('repeat'), type='quantitative', bin=alt.Bin(maxbins=20)),
    y='count()'
).repeat(
    repeat=["Horsepower", "Miles_per_Gallon", "Acceleration", "Displacement"], 
    columns=2
)

введите описание изображения здесь

person Mattijn    schedule 05.03.2021