Pertanyaan tentang topik tersebut 'pyspark-dataframes'

Buat vektor renggang kosong di PySpark
Saya memiliki kerangka data DF1 yang terlihat seperti ini: +-------+------+ |user_id|meta | +-------+------+ | 1| null| | 11| null| | 15| null| +-------+------+ Skema: root |-- user_id: string (nullable = true) |--...
150 dilihat

Bagaimana cara membaca file baris json terkompresi gzip ke dalam kerangka data PySpark?
Saya memiliki file baris JSON yang ingin saya baca ke dalam bingkai data PySpark. file dikompresi dengan gzip. Nama filenya terlihat seperti ini: file.jl.gz Saya tahu cara membaca file ini ke dalam bingkai data pandas: df=...
702 dilihat