Ausgabe
Ich habe den Code:
to_test[‘averageRating’].unique() array([5.8, 5.2, 5. , 6.5, 5.5, 7.3, 7.2, 4.2, 6.4, 7.1, 6.6, 5.4, 6.9, 6. , 6.1, 8.1, 6.3, 7.8 , 3.9, 6.8, 6.2, 7.9, 7. , 4.9, 5.9, 7.5, 6.7, 8. , 5.7, 3.2, 4.8, 5.6, 7.4, 4.5, 3.6, 4.3, 3.4, 5.1, 4.4, 4.7, 7.7, 5.3 , 4. , 8.4, 7.6, 3.3, 2.2, 3.7, 8.2, 4.1, 8.3, 1.7, 9. , 4.6, 8.5, 3.1, 3.8, 3.5, 1.9, 2.9, 2.8, 2.7, 9.2, 1.2, 2.1, 3 ., 1.3, 1.1, 8.6, 2.5, 1. , 9.8, 8.7, 1.5, 9.3])
`
Erstellen Sie eine Liste unserer Bedingungen
Bedingungen = [(to_test.loc[(to_test[‘averageRating’]>=0.0) & (to_test[‘averageRating’] <= 3.3)]), (to_test.loc[(to_test[‘averageRating’]>=3.4) & (zum_test[‘durchschnittlicheBewertung’] <=6.6)]), (zum_test.loc[(zum_test[‘durchschnittlicheBewertung’]>=6.7) & (zum_test[‘durchschnittlicheBewertung’] <=10)])]
Erstellen Sie eine Liste der Werte, die wir jeder Bedingung zuweisen möchten
Werte = [‘Gruppe1’, ‘Gruppe2’, ‘Gruppe3’]
Erstellen Sie eine neue Spalte und verwenden Sie np.select, um ihr Werte zuzuweisen, indem Sie unsere Listen als Argumente verwenden
to_test[‘group’] = np.select(conditions, values)
aktualisierten DataFrame anzeigen
to_test.head()`
aber es funktioniert nicht
Lösung
Dies ist ein klassischer Fall der Verwendung von cut
. Beispielcode
df = pd.DataFrame({'averageRating' : np.random.uniform(0,10,100)})
df['group_using_cut'] = pd.cut(df['averageRating'],
[0,3.3,6.6,10],
labels=['group1','group2','group3'])
np.select
Wenn Sie Nutzungsbedingungen ohne loc
Beispielcode verwenden möchten
conds = [
(df['averageRating']>=0.0) & (df['averageRating'] <= 3.3),
(df['averageRating']>=3.4) & (df['averageRating'] <= 6.6),
(df['averageRating']>=6.7) & (df['averageRating'] <= 10),
]
df['group_using_selec'] = np.select(conds,['group1','group2','group3'])
Ausgabedf.head()
Beantwortet von – sayan dasgupta
Antwort geprüft von – Candace Johnson (FixError Volunteer)