Ausgabe
Ich habe so einen Pandas-Datenrahmen:
id feature1 feature feature3
A 1 0 0
A 0 1 0
B 0 1 0
B 1 0 0
B 0 0 1
C 0 0 1
Dies bedeutet also, dass es sich um einen One-Hot-codierten Datenrahmen handelt. Ich möchte es jetzt in einem anderen Format erhalten, um nur eine Zeile pro ID zu haben:
id feature1 feature feature3
A 1 1 0
B 1 1 1
C 0 0 1
Wie kann ich das machen?
Lösung
Verwendung groupby.max
:
out = df.groupby('id', as_index=False).max()
Ausgang:
id feature1 feature feature3
0 A 1 1 0
1 B 1 1 1
2 C 0 0 1
Beantwortet von – mozway
Antwort geprüft von – Mary Flores (FixError Volunteer)