Я хотел бы реализовать задание SSIS, которое может загружать большие файлы CSV, расположенные в удаленном кластере Hadoop. Конечно, наличие обычного FTP-сервера в системе Hadoop не раскрывает файлы HDFS, поскольку он использует локальную файловую систему.
Я хотел бы знать, существует ли реализация FTP-сервера поверх HDFS. Я бы предпочел этот подход, а не копировать файлы из HDFS в локальную ФС, а затем иметь FTP-сервер, обслуживающий это, потому что мне нужно будет выделить больше места для хранения.