[FIXED] Wie formatiere ich Pandas-Datenrahmen, um nur eine Zeile pro ID zu behalten?

Ausgabe

Ich habe so einen Pandas-Datenrahmen:

id feature1 feature feature3
A 1 0 0
A 0 1 0
B 0 1 0
B 1 0 0
B 0 0 1
C 0 0 1

Dies bedeutet also, dass es sich um einen One-Hot-codierten Datenrahmen handelt. Ich möchte es jetzt in einem anderen Format erhalten, um nur eine Zeile pro ID zu haben:

id feature1 feature feature3
A 1 1 0
B 1 1 1
C 0 0 1

Wie kann ich das machen?

Lösung

Verwendung groupby.max:

out = df.groupby('id', as_index=False).max()

Ausgang:

  id  feature1  feature  feature3
0  A         1        1         0
1  B         1        1         1
2  C         0        0         1


Beantwortet von –
mozway


Antwort geprüft von –
Mary Flores (FixError Volunteer)

0 Shares:
Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like