ฉันต้องการใช้งาน SSIS ที่สามารถดาวน์โหลดไฟล์ CSV ขนาดใหญ่ที่อยู่บนคลัสเตอร์ Hadoop ระยะไกลได้ แน่นอนว่าการมีเซิร์ฟเวอร์ FTP ปกติบนระบบ Hadoop จะไม่เปิดเผยไฟล์ HDFS เนื่องจากใช้ระบบไฟล์ในเครื่อง
ฉันต้องการทราบว่ามีการใช้งานเซิร์ฟเวอร์ FTP ที่อยู่เหนือ HDFS หรือไม่ ฉันชอบวิธีนี้มากกว่าที่จะต้องคัดลอกไฟล์จาก HDFS ไปยัง FS ในเครื่อง แล้วให้เซิร์ฟเวอร์ FTP ทำหน้าที่นี้เพราะฉันจะต้องจัดสรรพื้นที่จัดเก็บข้อมูลเพิ่มเติม