Я создаю новый кадр данных pyspark из списка строк. Как должен выглядеть мой код?
Это мой список: ['там', 'есть', 'один', 'это', 'команды'] и это то, что я хочу в идеале:
слова (заголовок)
1-й ряд: ['там', 'есть', 'один', 'тот', 'команды'] 2-й ряд: ['испытать', 'попробовать'
Я пробовал следующие коды, но ни один из них не дал мне именно то, что я хотел.
test_list=['hi','bye','thanks']
test_list=sc.parallelize(test_list)
schema = StructType([StructField("name", StringType(), True)])
df3 = sqlContext.createDataFrame(test_list, schema)
А ТАКЖЕ
test_list=['hi','bye','thanks']
test_list=sc.parallelize(test_list)
df3 = sqlContext.createDataFrame(row(test_list), schema)
Я не могу заставить кадры данных отображаться с помощью df.show().