Я запускаю Spark 1.6.1 так:
./pyspark --master local[4] --packages com.databricks:spark-csv_2.10:1.0.3
Я могу загрузить файл CSV без каких-либо ошибок, например:
df = sqlContext.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load('/home/SparkTest.csv')
но когда я пытаюсь увидеть такие данные:
df.head()
Я получаю такие ошибки:
16/04/07 10:41:49 ERROR CsvRelation$: Exception while parsing line: 5,2012-01-01,53,Lucky Charms. java.lang.ClassCastException
16/04/07 10:41:49 ERROR CsvRelation$: Exception while parsing line: 6,2012-02-01,14,Cap'n Crunch. java.lang.ClassCastException
SparkTest.csv
? - person Milad Khajavi   schedule 07.04.2016