Использование scipy.optimize.curve_fit внутри класса

У меня есть класс, описывающий математическую функцию. Класс должен иметь возможность подгонять себя методом наименьших квадратов к передаваемым данным. то есть вы можете вызвать такой метод:

classinstance.Fit(x,y)

и он корректирует свои внутренние переменные, чтобы лучше всего соответствовать данным. Я пытаюсь использовать для этого scipy.optimize.curve_fit, и мне нужно передать функцию модели. Проблема в том, что модельная функция находится внутри класса и нуждается в доступе к переменным и членам класса для вычисления данных. Однако кривая_fit не может вызывать функцию, у которой первым параметром является self. Есть ли способ заставить curve_fit использовать метод класса в качестве функции модели?

Вот минимальный исполняемый фрагмент, показывающий проблему:

import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit

# This is a class which encapsulates a gaussian and fits itself to data.
class GaussianComponent():
    # This is a formula string showing the exact code used to produce the gaussian.  I
    # It has to be printed for the user, and it can be used to compute values.
    Formula = 'self.Amp*np.exp(-((x-self.Center)**2/(self.FWHM**2*np.sqrt(2))))'

    # These parameters describe the gaussian.
    Center = 0
    Amp = 1
    FWHM = 1

    # HERE IS THE CONUNDRUM: IF I LEAVE SELF IN THE DECLARATION, CURVE_FIT
    # CANNOT CALL IT SINCE IT REQUIRES THE WRONG NUMBER OF PARAMETERS.
    # IF I REMOVE IT, FITFUNC CAN'T ACCESS THE CLASS VARIABLES.
    def FitFunc(self, x, y, Center, Amp, FWHM):
        eval('y - ' + self.Formula.replace('self.', ''))

    # This uses curve_fit to adjust the gaussian parameters to best match the
    # data passed in.
    def Fit(self, x, y):
        #FitFunc = lambda x, y, Center, Amp, FWHM: eval('y - ' + self.Formula.replace('self.', ''))
        FitParams, FitCov = curve_fit(self.FitFunc, x, y, (self.Center, self.Amp, self.FWHM))
        self.Center = FitParams[0]
        self.Amp = FitParams[1]
        self.FWHM = FitParams[2]

    # Give back a vector which describes what this gaussian looks like.
    def GetPlot(self, x):
        y = eval(self.Formula)
        return y

# Make a gausssian with default shape and position (height 1 at the origin, FWHM 1.
g = GaussianComponent()

# Make a space in which we can plot the gaussian.
x = np.linspace(-5,5,100)
y = g.GetPlot(x)

# Make some "experimental data" which is just the default shape, noisy, and
# moved up the y axis a tad so the best fit will be different.
ynoise = y + np.random.normal(loc=0.1, scale=0.1, size=len(x))

# Draw it
plt.plot(x,y, x,ynoise)
plt.show()

# Do the fit (but this doesn't work...)
g.Fit(x,y)

И это создает следующий график, а затем падает, поскольку функция модели неверна, когда она пытается выполнить подгонку.

введите здесь описание изображения

Заранее спасибо!


person ZSG    schedule 07.05.2015    source источник


Ответы (2)


Я потратил некоторое время на просмотр вашего кода и, к сожалению, опоздал на 2 минуты. В любом случае, чтобы сделать вещи немного интереснее, я немного отредактировал ваш класс. Вот что я придумал:

import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit

class GaussianComponent():

    def __init__(self, func, params=None):
        self.formula = func
        self.params = params

    def eval(self, x):
        allowed_locals = {key: self.params[key] for key in self.params}
        allowed_locals["x"] = x
        allowed_globals = {"np":np}
        return eval(self.formula, allowed_globals, allowed_locals)

    def Fit(self, x, y):
        FitParams, FitCov = curve_fit(self.eval, x, y, self.params)
        self.fitparams = fitParams


# Make a gausssian with default shape and position (height 1 at the origin, FWHM 1.
g = GaussianComponent("Amp*np.exp(-((x-Center)**2/(FWHM**2*np.sqrt(2))))", 
                      params={"Amp":1, "Center":0, "FWHM":1})

**SNIPPED FOR BREVITY**

Я полагаю, вы, возможно, найдете это более удовлетворительным решением?

В настоящее время все ваши параметры гаусса являются атрибутами класса, это означает, что если вы попытаетесь создать второй экземпляр своего класса с другими значениями параметров, вы также измените значения для первого класса. Помещая все параметры в качестве атрибутов экземпляра, вы избавляетесь от этого. Вот почему у нас есть классы в первую очередь.

Ваша проблема с self связана с тем, что вы пишете self в своем Formula. Теперь вам больше не нужно. Я думаю, что это имеет немного больше смысла, потому что, когда вы создаете экземпляр объекта класса, вы можете добавить столько параметров к объявленной вами функции, сколько захотите. Теперь это даже не должно быть гауссовым (в отличие от раньше).

Просто закиньте все параметры в словарь, как это делает curve_fit, и забудьте о них.

Явно указывая, что может использовать eval, вы помогаете убедиться, что злоумышленникам будет труднее взломать ваш код. Это все еще возможно, это всегда с eval.

Удачи, спрашивайте, если вам нужно что-то уточнить.

person ljetibo    schedule 08.05.2015

Ах! На самом деле это была ошибка в моем коде. Если я изменю эту строку:

def FitFunc(self, x, y, Center, Amp, FWHM):

to

def FitFunc(self, x, Center, Amp, FWHM):

Тогда мы в порядке. Таким образом, curve_fit правильно обрабатывает параметр self, но моя функция модели не должна включать y.

(Смущенный!)

person ZSG    schedule 08.05.2015
comment
для меня нет понятия, что curve_fit правильно справляется с этим... - person Saullo G. P. Castro; 08.05.2015