Как извлечь столбец из многомерного массива?

Кто-нибудь знает, как извлечь столбец из многомерного массива в Python?


person Community    schedule 24.05.2009    source источник


Ответы (18)


>>> import numpy as np
>>> A = np.array([[1,2,3,4],[5,6,7,8]])

>>> A
array([[1, 2, 3, 4],
    [5, 6, 7, 8]])

>>> A[:,2] # returns the third columm
array([3, 7])

См. Также: numpy.arange и reshape для выделения памяти.

Пример: (Размещение массива с формированием матрицы (3x4))

nrows = 3
ncols = 4
my_array = numpy.arange(nrows*ncols, dtype='double')
my_array = my_array.reshape(nrows, ncols)
person Andre Luiz    schedule 28.09.2011
comment
Мне потребовалось 2 часа, чтобы обнаружить [:, 2], угадайте, этой функции нет в официальной литературе по нарезке? - person niken; 19.03.2017
comment
Что означает запятая? - person Phil; 24.11.2017
comment
@ Фил [row, col]. запятая разделяет. - person AsheKetchum; 11.12.2017
comment
Как у этого ответа столько голосов? OP никогда не говорил, что это массивный массив - person sziraqui; 29.04.2018
comment
для извлечения 2 столбцов: A [:, [1,3]] например извлечение второго и четвертого столбца - person sadalsuud; 23.01.2019
comment
@sziraqui Хорошо, что тогда есть решения, отличные от numpy. Numpy невероятно полезен при работе с матрицами в Python и в значительной степени является стандартом, и это всего лишь его пример (производительность - еще одна причина). - person Jeppe; 30.04.2020
comment
Превосходно! Он имеет очень хорошую производительность для извлечения столбцов! - person Felipe Toledo; 01.09.2020

Может быть, вы используете Массив NumPy? В Python есть модуль array, но он не поддерживает многомерные массивы. Обычные списки Python тоже одномерные.

Однако, если у вас есть простой двумерный список вроде этого:

A = [[1,2,3,4],
     [5,6,7,8]]

тогда вы можете извлечь такой столбец:

def column(matrix, i):
    return [row[i] for row in matrix]

Извлечение второго столбца (индекс 1):

>>> column(A, 1)
[2, 6]

Или просто:

>>> [row[1] for row in A]
[2, 6]
person Martin Geisler    schedule 24.05.2009
comment
Это должен быть главный ответ. Он отвечает на заданный вопрос, указывая на альтернативу в NumPy. - person Marko; 06.12.2020
comment
[row[1] for row in A] это элегантно. Проголосуйте за это. - person Simon Z.; 04.03.2021

Если у вас есть массив вроде

a = [[1, 2], [2, 3], [3, 4]]

Затем вы извлекаете первый столбец следующим образом:

[row[0] for row in a]

Результат выглядит так:

[1, 2, 3]
person Andrei Arsenin    schedule 14.10.2011

проверить это!

a = [[1, 2], [2, 3], [3, 4]]
a2 = zip(*a)
a2[0]

это то же самое, что и выше, за исключением того, что он более аккуратный, zip выполняет свою работу, но требует одиночных массивов в качестве аргументов, синтаксис * a распаковывает многомерный массив в одиночные аргументы массива

person Mac D    schedule 22.11.2012
comment
Что выше? Помните, что ответы не всегда отсортированы одинаково. - person Muhd; 13.03.2013
comment
Это чисто, но может быть не самым эффективным, если производительность вызывает беспокойство, поскольку переносит всю матрицу. - person IceArdor; 07.05.2014
comment
К вашему сведению, это работает в python 2, но в python 3 вы получите объект-генератор, который, конечно, не подлежит подписке. - person Rishabh Agrahari; 29.12.2016
comment
@RishabhAgrahari В любом случае, чтобы сделать этот zip в Py3? - person CtrlAltF2; 15.05.2019
comment
@WarpDriveEnterprises да, вам нужно будет преобразовать объект-генератор в список, а затем выполнить индексирование. пример: a2 = zip(*a); a2 = list(a2); a2[0] - person Rishabh Agrahari; 16.05.2019
comment
Или просто list(zip(*a))[0] - person Tomerikoo; 15.02.2020
comment
Для python 3 выполните next(zip(*a)), чтобы получить первый столбец в виде кортежа. Чтобы получить тот же результат в форме списка, я думаю, что быстрее использовать понимание списка. - person Escape0707; 28.04.2020

>>> x = arange(20).reshape(4,5)
>>> x array([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]])

если вам нужен второй столбец, вы можете использовать

>>> x[:, 1]
array([ 1,  6, 11, 16])
person mrkasri    schedule 02.05.2018
comment
Это использует numpy? - person Foreever; 02.04.2019
comment
Я не могу найти никакой документации для arange() в Python3 за пределами numpy. Кто угодно? - person Kevin W Matthews; 18.08.2019
comment
Я думаю, это тензорный поток, @KevinWMatthews - person nerkn; 15.11.2020

def get_col(arr, col):
    return map(lambda x : x[col], arr)

a = [[1,2,3,4], [5,6,7,8], [9,10,11,12],[13,14,15,16]]

print get_col(a, 3)

Функция map в Python - еще один вариант.

person Peter Paul    schedule 21.10.2017

Если у вас есть двумерный массив в Python (не numpy), вы можете извлечь все столбцы следующим образом:

data = [
['a', 1, 2], 
['b', 3, 4], 
['c', 5, 6]
]

columns = list(zip(*data))

print("column[0] = {}".format(columns[0]))
print("column[1] = {}".format(columns[1]))
print("column[2] = {}".format(columns[2]))

Выполнение этого кода даст,

>>> print("column[0] = {}".format(columns[0]))
column[0] = ('a', 'b', 'c')

>>> print("column[1] = {}".format(columns[1]))
column[1] = (1, 3, 5)

>>> print("column[2] = {}".format(columns[2]))
column[2] = (2, 4, 6)

Конечно, вы можете извлечь один столбец по индексу (например, columns[0])

person Russell    schedule 16.01.2020

Оператор itemgetter также может помочь, если вам нравится python в стиле map-reduce, а не понимание списков, для небольшого разнообразия!

# tested in 2.4
from operator import itemgetter
def column(matrix,i):
    f = itemgetter(i)
    return map(f,matrix)

M = [range(x,x+5) for x in range(10)]
assert column(M,1) == range(1,11)
person Gregg Lind    schedule 24.05.2009
comment
используйте itertools.imap для больших данных - person Paweł Polewicz; 25.05.2009
comment
Подход itemgetter работал примерно в 50 раз быстрее, чем подход со списком для моего варианта использования. Python 2.7.2, вариант использования заключался в большом количестве итераций в матрице с несколькими сотнями строк и столбцов. - person joelpt; 19.03.2012

Вы также можете использовать это:

values = np.array([[1,2,3],[4,5,6]])
values[...,0] # first column
#[1,4]

Примечание: это не работает для встроенного массива и не выровненного (например, np.array ([[1,2,3], [4,5,6,7]]))

person Sergey    schedule 06.02.2015

Я думаю, вы хотите извлечь столбец из массива, например массива ниже

import numpy as np
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])

Теперь, если вы хотите получить третий столбец в формате

D=array[[3],
[7],
[11]]

Тогда вам нужно сначала сделать массив матрицей

B=np.asmatrix(A)
C=B[:,2]
D=asarray(C)

И теперь вы можете выполнять поэлементные вычисления так же, как в Excel.

person danielinthelionsden    schedule 20.03.2015
comment
Хотя это мне очень помогло, я думаю, что ответ может быть намного короче: 1. A = np.array ([[1,2,3,4], [5,6,7,8], [9,10, 11,12]]) 2. Массив [:, 1] ›› ([2, 6, 10]) - person Ufos; 09.12.2017

скажем, у нас есть n X m матрица (n строк и m столбцов), скажем, 5 строк и 4 столбца

matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],[17,18,19,20]]

Чтобы извлечь столбцы в python, мы можем использовать понимание списка следующим образом

[ [row[i] for row in matrix] for in range(4) ]

Вы можете заменить 4 любым количеством столбцов в вашей матрице. Результат

[ [1,5,9,13,17],[2,10,14,18],[3,7,11,15,19],[4,8,12,16,20] ]

person Serge_k    schedule 20.11.2016
comment
Создает ли это совершенно новый список? - person Kevin W Matthews; 18.08.2019

Еще один способ использования матриц

>>> from numpy import matrix
>>> a = [ [1,2,3],[4,5,6],[7,8,9] ]
>>> matrix(a).transpose()[1].getA()[0]
array([2, 5, 8])
>>> matrix(a).transpose()[0].getA()[0]
array([1, 4, 7])
person Shashwat    schedule 25.10.2013

Если вы хотите получить более одного столбца, просто используйте slice:

 a = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
    print(a[:, [1, 2]])
[[2 3]
[5 6]
[8 9]]
person Molina12    schedule 29.01.2018

Просто используйте transpose (), и вы сможете получить столбцы так же просто, как и строки.

matrix=np.array(originalMatrix).transpose()
print matrix[NumberOfColum]
person David Tatis    schedule 30.10.2019

Несмотря на использование zip(*iterable) для транспонирования вложенного списка, вы также можете использовать следующее, если вложенные списки различаются по длине:

map(None, *[(1,2,3,), (4,5,), (6,)])

приводит к:

[(1, 4, 6), (2, 5, None), (3, None, None)]

Таким образом, первый столбец:

map(None, *[(1,2,3,), (4,5,), (6,)])[0]
#>(1, 4, 6)
person Lorenz Lo Sauer    schedule 31.08.2013

Ну, немного поздно ...

В случае, если производительность имеет значение и ваши данные имеют прямоугольную форму, вы также можете сохранить их в одном измерении и получать доступ к столбцам с помощью регулярных срезов, например. ...

A = [[1,2,3,4],[5,6,7,8]]     #< assume this 4x2-matrix
B = reduce( operator.add, A ) #< get it one-dimensional

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx::dimX]

def row1d( matrix, dimX, rowIdx ):
  return matrix[rowIdx:rowIdx+dimX] 

>>> column1d( B, 4, 1 )
[2, 6]
>>> row1d( B, 4, 1 )
[2, 3, 4, 5]

Приятно то, что это действительно быстро. Однако отрицательные индексы здесь не работают! Таким образом, вы не можете получить доступ к последнему столбцу или строке по индексу -1.

Если вам нужна отрицательная индексация, вы можете немного настроить функции доступа, например

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx % dimX::dimX]

def row1d( matrix, dimX, dimY, rowIdx ):
  rowIdx = (rowIdx % dimY) * dimX
  return matrix[rowIdx:rowIdx+dimX]
person Zappotek    schedule 03.09.2013
comment
Я проверил этот метод, и стоимость извлечения столбца намного дешевле, чем вложенные циклы. Однако уменьшение 2d-матрицы до 1d является дорогостоящим, если матрица большая, скажем, 1000 * 1000. - person Zhongjun 'Mark' Jin; 01.08.2016

Я предпочитаю следующий совет: иметь матрицу с именем matrix_a и использовать column_number, например:

import numpy as np
matrix_a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
column_number=2

# you can get the row from transposed matrix - it will be a column:
col=matrix_a.transpose()[column_number]
person Vik Ermolenko    schedule 28.03.2018

Все столбцы из матрицы в новый список:

N = len(matrix) 
column_list = [ [matrix[row][column] for row in range(N)] for column in range(N) ]
person user136036    schedule 28.04.2014