Where are the PySpark docs' DataFrames df, df2, df3 etc. defined?

Question

In the PySpark docs, I see many examples working on sample DataFrames like df4 here.

Where are they defined? I'd like to see them in full to better understand the docs.

notNull · Accepted Answer

They are defined in _test() method in Class GroupedData(...)

from pyspark.sql import Row

df4 = sc.parallelize([Row(course="dotNET", year=2012, earnings=10000),
                                   Row(course="Java",   year=2012, earnings=20000),
                                   Row(course="dotNET", year=2012, earnings=5000),
                                   Row(course="dotNET", year=2013, earnings=48000),
                                   Row(course="Java",   year=2013, earnings=30000)]).toDF()

Where are the PySpark docs' DataFrames df, df2, df3 etc. defined?

Answers (1)

Related Questions

Where are the PySpark docs&#39; DataFrames df, df2, df3 etc. defined?

Answers (1)

Related Questions

Where are the PySpark docs' DataFrames df, df2, df3 etc. defined?