Reputation: 67

How to sort without column name,using pandas

My data is:

import pandas
A=pandas.read_csv(r'D:\AUL_prediction\Merge_file\plasmid',sep='   ',header=None, engine='python')
print A

result is:

                 0     1                 2            3  
                 0     plasmid.gb        NC021289.1    75   
                 1     plasmid.gb        NC016815.1   763   
                 2     plasmid.gb      NZCP011480.1   102   
                 3     plasmid.gb        NC017324.1  1278   
                 4     plasmid.gb        NC007488.2    32   
                 5     plasmid.gb        NC019848.2   632   
                 6     plasmid.gb      NZCP007644.1   208   
                 7     plasmid.gb        NC007336.1    46   
                 8     plasmid.gb      NZCP012748.1   402   
                 9     plasmid.gb      NZCP011248.1   353

I want to sort this data based on the A[3],and A[2], any one knows how to do this? I tried sort_values, however, it does not recognize column name '0' or '1'

Upvotes: 2

Answers (3)

Carson

Reputation: 8088

I'm not sure why you insist on not using the header

If that is the original data are like so then that isn't problems

you can assign the title to the DataFrame, and that is more readable for programmers.

import pandas as pd
from io import StringIO

data = """
plasmid.gb,NC021289.1,75   
plasmid.gb,NC016815.1,763   
plasmid.gb,NZCP011480.1,102   
plasmid.gb,NC017324.1,1278   
plasmid.gb,NC007488.2,32   
plasmid.gb,NC019848.2,632   
plasmid.gb,NZCP007644.1,208   
plasmid.gb,NC007336.1,46   
plasmid.gb,NZCP012748.1,402   
plasmid.gb,NZCP011248.1,3
"""

df = pd.read_csv(StringIO(data), sep=',', header=None, engine='python')
print('BEFORE\n', df)
df.columns = ['file', 'event-id', 'value']
print('\nAFTER\n', df.sort_values(['value', 'event-id'], ascending=[False, True]))

output

BEFORE
             0             1     2
0  plasmid.gb    NC021289.1    75
1  plasmid.gb    NC016815.1   763
2  plasmid.gb  NZCP011480.1   102
3  plasmid.gb    NC017324.1  1278
4  plasmid.gb    NC007488.2    32
5  plasmid.gb    NC019848.2   632
6  plasmid.gb  NZCP007644.1   208
7  plasmid.gb    NC007336.1    46
8  plasmid.gb  NZCP012748.1   402
9  plasmid.gb  NZCP011248.1     3

AFTER
          file      event-id  value
3  plasmid.gb    NC017324.1   1278
1  plasmid.gb    NC016815.1    763
5  plasmid.gb    NC019848.2    632
8  plasmid.gb  NZCP012748.1    402
6  plasmid.gb  NZCP007644.1    208
2  plasmid.gb  NZCP011480.1    102
0  plasmid.gb    NC021289.1     75
7  plasmid.gb    NC007336.1     46
4  plasmid.gb    NC007488.2     32
9  plasmid.gb  NZCP011248.1      3

Upvotes: 1