R nlsLM / nls качество подгонки с низким числом точек данных

Хотя я некоторое время использовал nlsLM из minpack.lm с отличными результатами, теперь я столкнулся с неожиданной проблемой с точки зрения качества подгонки с меньшим количеством предоставленных точек данных.

В примере вы видите один фитинг с 750 точками данных и один примерно с 50.

http://i66.tinypic.com/33cn9jq.jpg

http://i64.tinypic.com/14cb4a0.jpg

Это моноэкспоненциальная подгонка B(1-exp(-x*tm))+C, где C и B предварительно определены, а tm — это время.

Пример данных:

mxf <- structure(list(tm = c(0.604, 0.705, 0.805, 0.905, 1.005, 1.105, 
1.205, 1.305, 1.405, 1.505, 1.605, 1.705, 1.805, 1.905, 2.005, 
2.104, 2.204, 2.304, 2.405, 2.505, 2.605, 2.705, 2.805, 2.905, 
3.005, 3.105, 3.205, 3.305, 3.405, 3.505, 3.605, 3.705, 3.805, 
3.905, 4.005, 4.105, 4.205, 4.305, 4.405, 4.505, 4.605, 4.705, 
4.804, 4.904, 5.004), mxxp1m = c(15.2, 24.5, 30.1, 35.3, 38.6, 
40.9, 42.7, 46.3, 47.1, 47.8, 48, 48.6, 51.1, 51.7, 52.6, 52.3, 
52.2, 51.8, 54.4, 54, 52.7, 51.7, 54.4, 52.5, 53.5, 52.8, 54, 
53.5, 52.5, 53.4, 52, 52.9, 52.7, 52.4, 53.7, 52.3, 53.1, 52.2, 
52.8, 53.1, 52.9, 53, 53.3, 51, 52.5)), .Names = c("tm", "mxxp1n"
), class = "data.frame", row.names = c("1", "2", "3", "4", "5", 
"6", "7", "8", "9", "10", "11", "12", "13", "14", "15", "16", 
"17", "18", "19", "20", "21", "22", "23", "24", "25", "26", "27", 
"28", "29", "30", "31", "32", "33", "34", "35", "36", "37", "38", 
"39", "40", "41", "42", "43", "44", "45"))

Это код, который я использовал в обоих примерах:

    mxf = data.frame(mxf,b,c)
    ## c = 0.2 (y starting point)
    ## d = 0.6 (y - span from start to end)

    fit = nlsLM(mxxp1m ~ b-(b*exp(-x*tm))+c, data = mxf, start = list(x=0.5))

Я уже думал о взвешивании значений или изменении параметров maxiter, но не получил достаточно лучших результатов.


r nls
person Robin K    schedule 02.02.2016    source источник
comment
Привет, добро пожаловать в SO. Было бы очень полезно, если бы вы могли предоставить минимальный воспроизводимый пример (см. здесь). Это можно сделать с помощью dput(head(tm)) или предоставить какие-то поддельные данные, и вдобавок показать нам, какие параметры установлены (например, b <- 5 или что-то в этом роде).   -  person slamballais    schedule 02.02.2016
comment
@Laterow: я обновил раздел кода и загрузил таблицу данных .csv с ненормированным, но в остальном таким же набором данных, как в примере выше: we.tl/ihv1jPLH1r   -  person Robin K    schedule 02.02.2016
comment
Спасибо, я поместил данные во вступительный пост, чтобы другие пользователи могли получить к ним прямой доступ. Хотя b и c по-прежнему отсутствуют, суть я понял. Так как лично у меня нет опыта работы с nlsLM и так как через ?nlsLM тоже ничего не могу найти, то ничем особо не могу вам помочь. Будем надеяться, что кто-то еще откликнется.   -  person slamballais    schedule 03.02.2016


Ответы (1)


Наконец найти решение самостоятельно:

Проблема заключается в том, что алгоритм подгонки nls не может обрабатывать значения x-start (здесь на временной шкале)> 0. Если точки данных начинаются с t = 0,6, подгонка просто работает неправильно. Если затем установить t = t-t[1], все работает нормально.

Поэтому всегда изменяйте вектор t так, чтобы он начинался с t = 0, а не с t = 0,603.

person Robin K    schedule 04.02.2016