How to compare 2 columns in pyspark dataframe using asserts functions

Question

I am using the below code to compare 2 columns in data frame. I dont want to do it in pandas. Can someone help how to compare using spark data frames?

    df1=context.spark.read.option("header",True).csv("./test/input/test/Book1.csv",) 
    df1=df1.withColumn("Curated", dataclean.clean_email(col("email")))
    df1.show()
    assert_array_almost_equal(df1['expected'], df1['Curated'],verbose=True)

How to compare 2 columns in pyspark dataframe using asserts functions

Answers (1)

Related Questions