Правильное форматирование данных для рекуррентной нейронной сети lstm в R/mxnet

Я хочу обучить нейронную сеть lstm, используя функцию mx.lstm в пакете R mxnet. Мои данные состоят из n векторов признаков, вектора помеченных классов и вектора времени, как в этом фиктивном примере, где X1, X2, X3 — это признаки:

dat <- data.frame(
  X1 = rnorm(100, 1, sd = 1),
  X2 = rnorm(100, 2, sd = 1),
  X3 = rnorm(100, 3, sd = 1),
  class = sample(c(1,0), replace = T, 100),
  time =  seq(0.01,1,0.01))

В справке по mx.lstm указано, что для аргумента train.data требуется «mx.io.DataIter или list(data=R.array, label=R.array) The Training set».

Я пробовал это:

library(mxnet)

# Convert dummy data into suitable format
trainDat <- list(data = array(c(dat$X1, dat$X2, dat$X3), dim = c(100,3)), 
label = array(dat[,4], dim = c(100,1)))

# Set the basic network parameters for the lstm (arbitrary for this example)
batch.size = 32
seq.len = 32
num.hidden = 16
num.embed = 16
num.lstm.layer = 1
num.round = 1
learning.rate = 0.1
wd = 0.00001
clip_gradient = 1
update.period = 1

# Run the model
model <- mx.lstm(train.data = trainDat,
             ctx=mx.cpu(),
             num.round=num.round, 
             update.period=update.period,
             num.lstm.layer=num.lstm.layer, 
             seq.len=seq.len,
             num.hidden=num.hidden, 
             num.embed=num.embed, 
             num.label=vocab,
             batch.size=batch.size, 
             input.size=vocab,
             initializer=mx.init.uniform(0.1), 
             learning.rate=learning.rate,
             wd=wd,
             clip_gradient=clip_gradient)

Что возвращает «Ошибка в mx.io.internal.arrayiter(as.array(data), as.array(label), unif.rnds,: basic_string::_M_replace_aux»

На веб-сайте mxnet есть пример lstm, но используемые данные сильно отличаются от моих, и я не могу их понять.

http://mxnet.io/tutorials/r/charRnnModel.html

Итак, мой вопрос: как мне преобразовать мои данные в формат, подходящий для mx.lstm?


person RCW    schedule 23.12.2016    source источник


Ответы (1)


Я попытался воспроизвести вашу ошибку и получил более подробное сообщение:

Ошибка в mx.io.internal.arrayiter(as.array(data), as.array(label), unif.rnds, : io.cc:50: Кажется, X, y был передан в основном виде строки, MXNetR принимает основное соглашение о столбцах. Вместо этого передайте транспонирование X

Я исправил ошибку, передав данные и массивы меток в aperm().

trainDat <- list(data = aperm(array(c(dat$X1, dat$X2, dat$X3), dim = c(100,3))), label = aperm(array(dat[,4], dim = c(100,1))))
person lynguyen    schedule 27.12.2016