S3 Sync กับการจำลองแบบข้ามภูมิภาค
ฉันมีข้อมูล ~1.5PB ใน S3 us-west-1 ฉันต้องการคัดลอกสิ่งนี้ไปยังภูมิภาค us-east-2 ฉันควรใช้การจำลองข้ามภูมิภาคหรือ S3 Sync หรือไม่ และข้อดีข้อเสียของการใช้ทั้งสองตัวเลือกคืออะไร?
ฉันค้นคว้าเธรด AWS สองสามเธรดและพบว่าเธรดเหล่านั้นอธิบายแต่ละเธรดโดยละเอียดมาก (เช่น https://aws.amazon.com/premiumsupport/knowledge-center/s3-large-transfer-between-buckets/ และ https://aws.amazon.com/premiumsupport/knowledge-center/s3-bucket-migrate-region/) โดยไม่อธิบายความแตกต่างระหว่างทั้งสอง
โปรดทราบว่านโยบายความปลอดภัยของเราไม่อนุญาต Snowball Edge
ใครสามารถช่วยฉันได้บ้าง?
person
awsuser2021
schedule
09.10.2020
source
แหล่งที่มา
คำตอบ (2)
เมื่อคุณเพิ่มการจำลองไปยังบัคเก็ตของคุณ ออบเจ็กต์ที่มีอยู่ก่อนหน้านี้จะไม่ถูกคัดลอกไปยังบัคเก็ตอื่น การจำลองจะไม่อนุญาตให้คุณทำซ้ำหากออบเจ็กต์สร้างขึ้นด้วยการเข้ารหัสฝั่งเซิร์ฟเวอร์โดยใช้คีย์การเข้ารหัสที่ลูกค้าจัดเตรียม (SSE-C) สำหรับรายละเอียดเพิ่มเติม คุณควรอ่านสิ่งนี้
ดังนั้นในกรณีนี้ คุณสามารถใช้คำสั่ง AWS S3 Sync หรือคำสั่ง cp ของ AWCCLi ได้ (จะช้ากว่า) หรือใช้ Snowball Edge (ซึ่งคุณไม่สามารถทำได้ตามคำอธิบาย)
aws s3 cp --recursive s3://<bucket>>
aws s3 sync s3://<bucket> s3://<bucket>>
AWS Sync เหมาะสำหรับอ็อบเจ็กต์/บัคเก็ตขนาดเล็ก แต่อย่างที่คุณบอกว่าคุณมีข้อมูลหลายเพตะไบต์ ฉันจะเสนอโซลูชันให้คุณสองรายการ:
- การดำเนินการแบตช์ S3: คุณสามารถใช้การดำเนินการแบบแบตช์ของ Amazon S3 เพื่อคัดลอกออบเจ็กต์หลายรายการด้วยคำขอเดียว
- S3DistCp: การดำเนินการ S3DistCp บน Amazon EMR สามารถทำการคัดลอกแบบขนานได้ ของอ็อบเจ็กต์จำนวนมากทั่วทั้งบัคเก็ต Amazon S3 อ่านเพิ่มเติม
เมื่อคุณคัดลอกข้อมูลของคุณไปยังบัคเก็ต S3 อื่นแล้ว คุณสามารถเปิดใช้งานการจำลองซึ่งจะจำลองออบเจ็กต์ใหม่ทั้งหมด
หมายเหตุ: โซลูชันเหล่านี้อาจมีราคาแพง ดังนั้นโปรดอ่านเกี่ยวกับต้นทุนหากใช้การดำเนินการเหล่านี้
person
KayD
schedule
09.10.2020
การจำลองจะคัดลอกออบเจ็กต์ PUT ใหม่ลงในที่เก็บข้อมูลปลายทาง
การซิงค์จะคัดลอกออบเจ็กต์ที่มีอยู่ไปยังที่เก็บข้อมูลปลายทาง
โดยทั่วไปคุณจะเปิดใช้งานการจำลองแล้วเรียกใช้การซิงค์หนึ่งครั้งเพื่อคัดลอกออบเจ็กต์ที่มีอยู่
person
Greg
schedule
09.10.2020