панды, применяются с аргументами, которые являются записями строк данных

У меня есть кадр данных pandas «df» с двумя столбцами «A» и «B», у меня есть функция с двумя аргументами

def myfunction(B, A):
    # do something here to get the result
    return result

и я хотел бы применить его построчно к df, используя функцию «применить»

df['C'] = df['B'].apply(myfunction, args=(df['A'],))

но я получаю ошибку

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

то, что здесь происходит, кажется, что df['A'] - это целая серия! не только запись строки из этой серии, как требуется.


person Runner Bean    schedule 02.10.2016    source источник


Ответы (1)


Я думаю, вам нужно:

import pandas as pd
df = pd.DataFrame({'A':[1,2,3],
                   'B':[4,5,6]})

print (df)
   A  B
0  1  4
1  2  5
2  3  6

def myfunction(B, A):
    #some staff  
    result = B + A 
    # do something here to get the result
    return result

df['C'] = df.apply(lambda x: myfunction(x.B, x.A), axis=1)
print (df)
   A  B  C
0  1  4  5
1  2  5  7
2  3  6  9

Or:

def myfunction(x):

    result = x.B + x.A
    # do something here to get the result
    return result

df['C'] = df.apply(myfunction, axis=1)
print (df)
   A  B  C
0  1  4  5
1  2  5  7
2  3  6  9
person jezrael    schedule 02.10.2016
comment
почему я не могу использовать аргумент «аргументы» для функции применения? - person Runner Bean; 02.10.2016
comment
@RunnerBean, вы можете отлично передавать аргументы. apply принимает kwargs, поэтому вы можете передавать такие аргументы: df['B'].apply(myfunction, A=df['A']) Но в этом случае это плохая идея, поскольку вы будете передавать всю серию функции, применяемой к каждой строке. - person piRSquared; 02.10.2016