สิ่งพิมพ์ตามแท็ก pyspark-dataframes [pyspark, apache-spark-sql, pyspark-dataframes, python, apache-spark]

คำถามในหัวข้อ 'pyspark-dataframes'

150 มุมมอง

pyspark apache-spark-sql pyspark-dataframes

11.12.2023

จะอ่านไฟล์บรรทัด json ที่ถูกบีบอัด gzip ใน PySpark dataframe ได้อย่างไร

ฉันมีไฟล์บรรทัด JSON ที่ฉันต้องการอ่านลงในเฟรมข้อมูล PySpark ไฟล์ถูกบีบอัดด้วย gzip ชื่อไฟล์มีลักษณะดังนี้: file.jl.gz ฉันรู้วิธีอ่านไฟล์นี้ในกรอบข้อมูลแพนด้า: df= pd.read_json('file.jl.gz', lines=True, compression='gzip) ฉันยังใหม่กับ...

702 มุมมอง

python apache-spark pyspark apache-spark-sql pyspark-dataframes

24.10.2023