ฉันต้องการสร้างลูปใน pyspark โดยที่ฉันให้เวลาหนึ่งเดือนและควรเลือกตาราง ณ สิ้นเดือนและสิ้นเดือนของเดือนก่อนหน้า การเลือกเดือนทำด้วยสตริง ดังนั้นฉันจึงให้ '201901' และควรเลือก '20190131' และ '20181231'
และถ้าเป็นไปได้ควรทำงานโดยอัตโนมัติและเลือกสิ้นเดือนก่อนหน้าตั้งแต่วันนี้และสิ้นเดือนก่อนหน้าของวันนี้ ดังนั้นวันนี้เราคือ 2020-05-07 ดังนั้นจึงควรเลือก '20200430' และ '20200331'
def selectTables(date):
i = 0
for i in range(len(date)):
recentDate = .... # should be for the first iteration '20190131'
previousDate = .... # should be for the first iteration '20181231'
recent = spark.read.parquet('table.parquet/date=' + recentDate[i])
previous = spark.read.parquet('table.parquet/date=' + previousDate[i])
selectTables(['201901', '201902'])