เพียงเพิ่มรายละเอียดเพิ่มเติมที่นี่เพราะฉันพบว่านี่เป็นช่วงการเรียนรู้ที่ยากมาก และฉันต้องการบันทึกสิ่งนี้เพื่อประโยชน์ของฉันและคนอื่นๆ
รับไฟล์ตัวอย่างเช่นนี้ (ในกรณีนี้ไม่มีนามสกุล) ในที่เก็บข้อมูล Blob
ZZZZ_20170727_1324
เราจะเห็นว่าส่วนตรงกลางอยู่ในรูปแบบ yyyyMMdd
ไฟล์นี้อัปโหลดไปยังโฟลเดอร์ Landing
ภายในคอนเทนเนอร์ MyContainer
นี่เป็นส่วนหนึ่งของคำจำกัดความชุดข้อมูลของฉัน::
"typeProperties": {
"folderPath": "MyContainer/Landing/ZZZZ_{DayCode}",
"format": {
"type": "TextFormat",
"columnDelimiter": "\u0001"
},
"partitionedBy": [
{
"name": "DayCode",
"value": {
"type": "DateTime",
"date": "SliceStart",
"format": "yyyyMMdd"
}
}
]
},
โปรดทราบว่านี่คือ 'คำนำหน้า' ซึ่งคุณจะเห็นในบันทึก/ข้อความแสดงข้อผิดพลาด หากคุณสามารถหาเจอได้ (โชคดี)
หากคุณต้องการทดสอบการโหลดไฟล์นี้โดยเฉพาะ คุณจะต้องกดปุ่ม 'ไดอะแกรม' จากนั้นเจาะเข้าไปในไปป์ไลน์ของคุณจนกว่าคุณจะพบชุดข้อมูล เป้าหมาย ซึ่งเป็นชุดข้อมูลที่กำลังโหลด ลงใน< /em> (ฉันกำลังโหลดสิ่งนี้ลงใน SQL Azure) คลิกที่ชุดข้อมูลเป้าหมาย จากนั้นไปค้นหาช่วงเวลา ที่ถูกต้อง ในกรณีของฉัน ฉันจำเป็นต้องค้นหาไทม์ลิซด้วย ไทม์สไลซ์เริ่มต้นที่ 20170727 และเรียกใช้อันนั้น
สิ่งนี้จะทำให้แน่ใจว่าไฟล์ที่ถูกต้องถูกหยิบขึ้นมาและโหลดลงใน SQL Azure
ลืมการรันไปป์ไลน์หรือกิจกรรมด้วยตนเองไปได้เลย นั่นไม่ใช่วิธีการทำงานอีกต่อไป คุณต้องเรียกใช้ชุดข้อมูลเอาต์พุตภายใต้ช่วงเวลาเพื่อดึงข้อมูลออกมา
person
Nick.McDermaid
schedule
27.07.2017