Read Parquet File Error Spark on Azure Synapse Workspace

Question

I am running a pyspark job using azure synpase workspace. My Spark Job is failing with following error. Can someone help me in debugging this error?

This error is coming in spark application run by Pipeline on Azure Synapse

Stacktrace: An error occurred while calling o1394.execute.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 94.0 failed 4 times, most recent failure: Lost task 0.3 in stage 94.0 (TID 2313) (vm-1d164027 executor 3): java.io.EOFException
    at org.apache.parquet.bytes.BytesUtils.readIntLittleEndian(BytesUtils.java:85)
    at org.apache.parquet.hadoop.ParquetFileReader.readFooter(ParquetFileReader.java:520)
    at org.apache.parquet.hadoop.ParquetFileReader.readFooter(ParquetFileReader.java:505)
    at org.apache.parquet.hadoop.ParquetFileReader.readFooter(ParquetFileReader.java:499)
    at org.apache.parquet.hadoop.ParquetFileReader.readFooter(ParquetFileReader.java:476)
    at

Read Parquet File Error Spark on Azure Synapse Workspace

Answers (1)

Related Questions