Generate repeating N row number for a PySpark DataFrame

Question

I want to create a new column in PySpark DataFrame with N repeating row numbers irrespective of other columns in the data frame.

Original data:

I want to have a new column with N repeating row number, consider N=3.

Expected Output:

name year  rownumber
A   2010   1
A   2011   1
A   2011   1
A   2013   2
A   2014   2
A   2015   2
A   2016   3
A   2018   3
B   2018   3
B   2019   4

Generate repeating N row number for a PySpark DataFrame

Answers (1)

Related Questions