Ausgabe
Ich führe einen Code aus, um PDF-Tabellen zu extrahieren, um CSV zu trennen. Ich habe das mit Tabula Py gemacht um die csv-tabellen jetzt zu bereinigen..
so bekomme ich tabellen tabellen helfen mir, die richtige zu finden. Wie soll ich mein df so codieren, dass es so aussieht … wenn das unbenannte im Spaltennamen vorhanden ist … sollte das unbenannte durch den unmittelbar nächsten gewünschten Namen außer unbenannt ersetzt werden, wenn die nächste Spalte auch unbenannt ist, überspringe und schaue die nächste Spalte und so weiter…
Manchmal bekomme ich auch leere Daten für die Spalte, in einigen Spalten können Nullwerte oder leer sein, die nicht gestört werden sollten
Ich habe eine Lösung, um die Spalte zu löschen, die einen unbenannten Spaltennamen mit Nullwerten hat: aber ich brauche eine Lösung für das Obige
Lösung
# select all columns that are not nameed as 'unnamed'
cols=df.columns[~df.columns.str.contains('Unnamed')]
# create a new data filtering count of columns that are not unnamed
df2=df.iloc[:,:len(cols)]
#rename the column names
df2.columns = cols
df2
id Length Types Name Value Comments
0 1 5 3 Company Assigned fan
Beantwortet von – Naveed
Antwort geprüft von – Gilberto Lyons (FixError Admin)