Как загрузить модель из моей архитектуры?

Я сделал этот код, и мне нужно загрузить модель, чтобы работать с ней позже, но когда я пытаюсь использовать load_model(), ошибка: Модель не найдена в файле конфигурации. И когда я пытаюсь загрузить веса, возникает ошибка «Невозможно загрузить веса, сохраненные в формате HDF5, в подклассовую модель, которая еще не создала свои переменные». Сначала вызовите модель, затем загрузите веса.

это мой код

class Sampling(layers.Layer):
    """Uses (z_mean, z_log_var) to sample z, the vector encoding a digit."""

    def call(self, inputs):
        z_mean, z_log_var = inputs
        batch = tf.shape(z_mean)[0]
        dim = tf.shape(z_mean)[1]
        epsilon = tf.keras.backend.random_normal(shape=(batch, dim))
        return z_mean + tf.exp(0.5 * z_log_var) * epsilon

Я определил кодировщик и декодер, которые я буду использовать позже в

class VAE(keras.Model):
    def __init__(self, encoder, decoder, **kwargs):
        super(VAE, self).__init__(**kwargs)
        self.encoder = encoder
        self.decoder = decoder

    def train_step(self, data):
        if isinstance(data, tuple):
            data = data[0]
        with tf.GradientTape() as tape:
            z_mean, z_log_var, z = encoder(data)
            reconstruction = decoder(z)
            reconstruction_loss = tf.reduce_mean(
                keras.losses.binary_crossentropy(data, reconstruction)
            )
            reconstruction_loss *= 64 * 64 * 3
            kl_loss = 1 + z_log_var - tf.square(z_mean) - tf.exp(z_log_var)
            kl_loss = tf.reduce_mean(kl_loss)
            kl_loss *= -0.5
            total_loss = reconstruction_loss + kl_loss
        grads = tape.gradient(total_loss, self.trainable_weights)
        self.optimizer.apply_gradients(zip(grads, self.trainable_weights))
        return {
            "loss": total_loss,
            "reconstruction_loss": reconstruction_loss,
            "kl_loss": kl_loss,
        }
    
    def test_step(self, data):
        if isinstance(data, tuple):
            data = data[0]
        with tf.GradientTape() as tape:
            z_mean, z_log_var, z = encoder(data)
            reconstruction = decoder(z)
            reconstruction_loss = tf.reduce_mean(
                keras.losses.binary_crossentropy(data, reconstruction)
            )
            reconstruction_loss *= 64 * 64 * 3
            kl_loss = 1 + z_log_var - tf.square(z_mean) - tf.exp(z_log_var)
            kl_loss = tf.reduce_mean(kl_loss)
            kl_loss *= -0.5
            total_loss = reconstruction_loss + kl_loss
        grads = tape.gradient(total_loss, self.trainable_weights)
        self.optimizer.apply_gradients(zip(grads, self.trainable_weights))
        return {
            "loss": total_loss,
            "reconstruction_loss": reconstruction_loss,
            "kl_loss": kl_loss,
        }

Наконец, вот как я его использую и создаю модель

model_name = 'car_racing_VAE.h5'

vae = VAE(encoder, decoder)
vae.compile(optimizer=keras.optimizers.Adam(0.001))

checkpointer = keras.callbacks.ModelCheckpoint(filepath=model_name, monitor='val_loss', verbose=1, save_best_only=True, mode='min', save_freq='epoch')

history = vae.fit(train, train,
                epochs=150,
                batch_size = 128,
                shuffle=True,
                validation_data=(val, val), validation_batch_size=128,
                callbacks=[checkpointer])

Итак, как я могу загрузить модель и использовать ее позже?

model = load_model(model_name)
vae.load_weights(model_name)

Ни один из них не работает


person Marisol Rodriguez    schedule 18.11.2020    source источник
comment
Итак, где находится ваш путь кодировщика? И не могли бы вы прикрепить ошибку, с которой вы столкнулись?   -  person dtlam26    schedule 18.11.2020
comment
какой полный путь вы использовали для сохранения модели? Загляните в это место и посмотрите, есть ли там файл .h5.   -  person Gerry P    schedule 18.11.2020
comment
Файл .h5 - это проект. Я попытался создать папку и назвать ее, поэтому попробовал vae.load_weights(model_name) и vae.load_weights('/tmp/my_model.h5'). Я получаю сообщение об ошибке Unable to load weights saved in HDF5 format into a subclassed Model which has not created its variables yet. Call the Model first, then load the weights. или No model found in config file. при использовании model = load_model('my_model.h5')   -  person Marisol Rodriguez    schedule 18.11.2020


Ответы (1)


Судя по ошибке, это похоже на проблему с загрузкой сохраненной модели из пути.

Как предложил Джерри П. в комментарии, проверьте местоположение сохраненной модели и загрузите ее из того же места.

Вы можете использовать приведенный ниже код, чтобы избежать проблемы с местоположением.

#saving model
model = ...  # Get model 
model.save('path/to/location')

#loading the model back
from tensorflow import keras
model = keras.models.load_model('path/to/location')
person TFer    schedule 25.11.2020