Python и lmfit: как уместить несколько наборов данных с общими параметрами?

Я хотел бы использовать модуль lmfit для соответствия функции переменной количество наборов данных, с некоторыми общими и некоторыми индивидуальными параметрами.

Вот пример генерации гауссовых данных и индивидуальной подгонки к каждому набору данных:

import numpy as np
import matplotlib.pyplot as plt
from lmfit import minimize, Parameters, report_fit

def func_gauss(params, x, data=[]):
    A = params['A'].value
    mu = params['mu'].value
    sigma = params['sigma'].value
    model = A*np.exp(-(x-mu)**2/(2.*sigma**2))

    if data == []:
        return model
    return data-model

x  = np.linspace( -1, 2, 100 )
data = []
for i in np.arange(5):
    params = Parameters()
    params.add( 'A'    , value=np.random.rand() )
    params.add( 'mu'   , value=np.random.rand()+0.1 )
    params.add( 'sigma', value=0.2+np.random.rand()*0.1 )
    data.append(func_gauss(params,x))

plt.figure()
for y in data:
    fit_params = Parameters()
    fit_params.add( 'A'    , value=0.5, min=0, max=1)
    fit_params.add( 'mu'   , value=0.4, min=0, max=1)
    fit_params.add( 'sigma', value=0.4, min=0, max=1)
    minimize(func_gauss, fit_params, args=(x, y))
    report_fit(fit_params)

    y_fit = func_gauss(fit_params,x)
    plt.plot(x,y,'o',x,y_fit,'-')
plt.show()


# ideally I would like to write:
#
# fit_params = Parameters()
# fit_params.add( 'A'    , value=0.5, min=0, max=1)
# fit_params.add( 'mu'   , value=0.4, min=0, max=1)
# fit_params.add( 'sigma', value=0.4, min=0, max=1, shared=True)
# minimize(func_gauss, fit_params, args=(x, data))
#
# or:
#
# fit_params = Parameters()
# fit_params.add( 'A'    , value=0.5, min=0, max=1)
# fit_params.add( 'mu'   , value=0.4, min=0, max=1)
#
# fit_params_shared = Parameters()
# fit_params_shared.add( 'sigma', value=0.4, min=0, max=1)
# call_function(func_gauss, fit_params, fit_params_shared, args=(x, data))

Merlin 02.12.2013 источник

Ответы (2)

arrow_upward
17
arrow_downward

Я думаю, ты почти достиг цели. Вам необходимо поместить наборы данных в массив или структуру, которые можно использовать в единой глобальной целевой функции, которую вы дадите для минимизации () и которая подходит для всех наборов данных с одним набором параметров для всех наборов данных. Вы можете делиться этим набором между наборами данных по своему усмотрению. Немного расширяя ваш пример, приведенный ниже код действительно работает, чтобы выполнить единственную подгонку для 5 различных функций Гаусса. В качестве примера связывания параметров между наборами данных я использовал почти одинаковое значение для сигмы, для 5 наборов данных одно и то же значение. Я создал 5 разных параметров сигмы ('sig_1', 'sig_2', ..., 'sig_5'), но затем заставил их иметь одинаковые значения, используя математическое ограничение. Таким образом, в задаче 11 переменных, а не 15.

import numpy as np
import matplotlib.pyplot as plt
from lmfit import minimize, Parameters, report_fit

def gauss(x, amp, cen, sigma):
    "basic gaussian"
    return amp*np.exp(-(x-cen)**2/(2.*sigma**2))

def gauss_dataset(params, i, x):
    """calc gaussian from params for data set i
    using simple, hardwired naming convention"""
    amp = params['amp_%i' % (i+1)].value
    cen = params['cen_%i' % (i+1)].value
    sig = params['sig_%i' % (i+1)].value
    return gauss(x, amp, cen, sig)

def objective(params, x, data):
    """ calculate total residual for fits to several data sets held
    in a 2-D array, and modeled by Gaussian functions"""
    ndata, nx = data.shape
    resid = 0.0*data[:]
    # make residual per data set
    for i in range(ndata):
        resid[i, :] = data[i, :] - gauss_dataset(params, i, x)
    # now flatten this to a 1D array, as minimize() needs
    return resid.flatten()

# create 5 datasets
x  = np.linspace( -1, 2, 151)
data = []
for i in np.arange(5):
    params = Parameters()
    amp   =  0.60 + 9.50*np.random.rand()
    cen   = -0.20 + 1.20*np.random.rand()
    sig   =  0.25 + 0.03*np.random.rand()
    dat   = gauss(x, amp, cen, sig) + np.random.normal(size=len(x), scale=0.1)
    data.append(dat)

# data has shape (5, 151)
data = np.array(data)
assert(data.shape) == (5, 151)

# create 5 sets of parameters, one per data set
fit_params = Parameters()
for iy, y in enumerate(data):
    fit_params.add( 'amp_%i' % (iy+1), value=0.5, min=0.0,  max=200)
    fit_params.add( 'cen_%i' % (iy+1), value=0.4, min=-2.0,  max=2.0)
    fit_params.add( 'sig_%i' % (iy+1), value=0.3, min=0.01, max=3.0)

# but now constrain all values of sigma to have the same value
# by assigning sig_2, sig_3, .. sig_5 to be equal to sig_1
for iy in (2, 3, 4, 5):
    fit_params['sig_%i' % iy].expr='sig_1'

# run the global fit to all the data sets
result = minimize(objective, fit_params, args=(x, data))
report_fit(result)

# plot the data sets and fits
plt.figure()
for i in range(5):
    y_fit = gauss_dataset(fit_params, i, x)
    plt.plot(x, data[i, :], 'o', x, y_fit, '-')

plt.show()

Что бы это ни стоило, я бы подумал о том, чтобы хранить несколько наборов данных в словаре или списке класса DataSet вместо многомерного массива. В любом случае, я надеюсь, что это поможет вам разобраться в том, что вам действительно нужно делать.

Community 03.12.2013

comment

Это отличный пример! Это действительно показывает, насколько полезен аргумент expr для параметров. - Merlin; 03.12.2013

comment

Я что-то не понимаю. Когда вы делаете глобальную подгонку, вы хотите найти наиболее общие параметры, которые лучше всего подходят для ваших множественных наборов данных. Разве при таком подходе вы просто не говорите всем остальным сигмам приравнять их к первой? Как можно найти глобальный минимум, что это было? - iasonas; 03.03.2016

comment

Кроме того, в последней версии lmfit 0.9 объект параметров не изменяется, а копируется. Итак, чтобы этот скрипт работал правильно, вы должны изменить последние строки: minim (objective, fit_params, args = (x, data)) - ›result = minim (objective, fit_params, args = (x, data) ) и где: fit_params - ›result.params - iasonas; 06.03.2016

comment

iasonas: 1. В исходном вопросе был задан вопрос, как установить для всех сигм одинаковое значение. Иногда это именно то, что вам нужно. 2 .. Вы правы, что пример был для lmfit до версии 0.9. Я изменил пример. - M Newville; 11.03.2017

comment

Фактически, я попытался отредактировать исходный ответ, чтобы исправить задокументированное и измененное поведение API между 0.8 и 0.9, которое было указано в недавнем комментарии. Как ведущий автор рассматриваемого программного обеспечения, я думаю, что это было бы приемлемо. Он был отклонен тремя рецензентами SO, которые предпочли оставить неправильный ответ, чем обновить ответ, чтобы отразить измененный API. Иногда кажется, что ТАК предпочитает дезинформацию .... - M Newville; 14.03.2017

comment

Просто заменил result.fit_params на fit_params (result.fit_params не работает под python 3.8 и lmfit==1.0.1) - ecjb; 17.12.2020

comment

@ecjb благодарит за указание на неправильность этого старого примера. Но использование report_fit(fit_params) просто запишет входные значения для параметров. Лучше всего было бы использовать report_fit(result.params), а еще лучше report_fit(result), который будет сообщать о наиболее подходящих параметрах и давать статистику соответствия. - M Newville; 18.12.2020

arrow_upward
1
arrow_downward

Я использовал простой подход: определение функции firs n (= cargsnum) аргументов является общим для всех наборов данных, остальные являются индивидуальными {

def likelihood_common(var, xlist, ylist, mlist, cargsnum):
    cvars = var[:cargsnum]
    iargnum = [model.func_code.co_argcount - 1 - cargsnum for model in mlist]
    argpos = [cargsnum,] + list(np.cumsum(iargnum[:-1]) + cargsnum)
    args = [list(cvars) + list(var[pos:pos+iarg]) for pos, iarg in zip(argpos, iargnum)]
    res = [likelihood(*arg) for arg in zip(args, xlist, ylist, mlist)]
    return np.sum(res)

} здесь предполагается, что каждый набор данных имеет одинаковый вес. Проблема, с которой я столкнулся в этом подходе, - это утомительно низкая скорость вычислений и нестабильность в случае большого количества подобранных параметров и наборов данных.

andrey 11.02.2014

Python и lmfit: как уместить несколько наборов данных с общими параметрами?

Ответы (2)

Похожие вопросы