Что означает image_resizer в конфигурационном файле Tensorflow Faster RCNN

Что будет делать image_resizer с входным изображением при обучении модели с использованием Tensorflow Faster RCNN? Предположим, что image_resizer в конфигурационном файле Faster_RCNN установлен как

image_resizer {
  keep_aspect_ratio_resizer {
    min_dimension: 1000
    max_dimension: 1000
  }
}

У меня есть одно входное изображение A.jpg размером 1000*1000 пикселей, затем я увеличиваю данные, изменяя размер (увеличивая) это изображение в коэффициенте 1,2 с помощью стороннего инструмента, который дает мне другое изображение < strong>B.jpg размером 1200*1200 пикселей.

Когда эти два изображения будут загружены в модель Faster RCNN, что изменение размера изображения сделает с A.jpg и B.jpg? Если я правильно понял, A.jpg останется как есть, B.jpg будет изменен до размера 1000*1000, что означает, что измененный размер B.jpg будет точно таким же, как A.jpg?! Итак, такое изменение размера изображения для увеличения данных бесполезно?


person user11552884    schedule 24.05.2019    source источник


Ответы (1)


Если я правильно понял, вы увеличиваете изображение, чтобы иметь более крупные объекты, верно? Однако вы должны иметь в виду, что в любое время, если размер больше, чем размер ввода, он будет изменен на ввод, и вы можете потерять эффект увеличения.

person Mohammad Akbarzadeh    schedule 27.12.2019