DataFrame ist eine Datenstruktur, die in der Python-Bibliothek zum Analysieren von Daten verwendet wird pandas. Mit Hilfe DataFrame Sie können Daten aus verschiedenen Quellen laden, Datenoperationen durchführen und die Ergebnisse in verschiedenen Formaten speichern. Eines der beliebtesten Formate zum Speichern von Daten ist Excel.
Erhaltung DataFrame im Format Excel sehr nützlich, besonders wenn Sie Daten mit anderen Benutzern austauschen möchten, die es vorziehen, mit zu arbeiten Excel. Außerdem, Excel bietet umfangreiche Möglichkeiten zum Formatieren und Visualisieren von Daten.
In diesem Artikel werden wir uns ansehen, wie man exportiert DataFrame im Format Excel mit der Bibliothek pandas. Wir werden uns einige Möglichkeiten ansehen, wie Sie Ihre behalten können DataFrame in Datei Excel mit verschiedenen Optionen und Optionen.
Die Ansätze, die wir untersuchen werden, umfassen die Verwendung der Methode to_excel() aus der Bibliothek pandas sowie die Möglichkeit, die Datenformatierung anzupassen und mehrere Blätter in einer Datei zu erstellen Excel. Darüber hinaus betrachten wir die Möglichkeit, verschiedene Objekte im Format zu speichern Excel wie Grafiken und Bilder.
Wie speichere ich einen DataFrame in Excel
Die Pandas-Bibliothek in Python bietet eine praktische Möglichkeit, Daten aus einem DataFrame in eine Excel-Datei zu speichern. Dies kann nützlich sein, wenn Sie die Ergebnisse der Datenanalyse speichern oder die Daten mit Kollegen oder Kunden teilen möchten.
Um einen DataFrame in einer Excel-Datei zu speichern, müssen Sie die openpyxl-Bibliothek installieren, mit der Sie mit Excel-Dateien arbeiten können. Sie können diese Bibliothek mit pip installieren:
- pip install openpyxl
Nachdem Sie die openpyxl-Bibliothek installiert haben, müssen Sie die erforderlichen Module importieren:
- import pandas as pd
- from openpyxl import Workbook
Erstellen Sie den DataFrame, den Sie speichern möchten:
- data =
- df = pd.DataFrame(data)
Erstellen Sie als Nächstes eine neue Excel-Arbeitsmappe, und speichern Sie den DataFrame in dieser Arbeitsmappe:
- wb = Workbook()
- ws = wb.active
- for row in dataframe_to_rows(df, index=False, header=True):
- ws.append(row)
Speichern Sie schließlich Ihre Excel-Arbeitsmappe auf Ihrem Computer:
- wb.save('Dateiname.xlsx')
Jetzt können Sie die Excel-Datei öffnen und sehen, dass Ihr DataFrame erfolgreich als Tabelle gespeichert wurde. Sie können auch verschiedene Optionen zum Speichern von Daten in Excel festlegen, z. B. den Namen des Arbeitsblatts, die Datenformatierung usw.
Hier ist eine einfache Möglichkeit, einen DataFrame in einer Excel-Datei zu speichern. Sie können die Pandas- und openpyxl-Dokumentation untersuchen, um mehr über die erweiterten Funktionen zum Speichern von Daten in Excel zu erfahren.
Installieren der benötigten Bibliotheken
Sie können den Pip-Batch-Manager verwenden, der mit Python geliefert wird, um diese Bibliotheken zu installieren. Um Pandas und openpyxl zu installieren, müssen Sie den folgenden Befehl an einer Eingabeaufforderung oder einem Terminal ausführen:
pip install pandas openpyxl
Nachdem die Bibliotheken erfolgreich installiert wurden, können wir mit dem Exportieren des DataFrames nach Excel beginnen.
Erstellen eines DataFrame
Es gibt mehrere Möglichkeiten, einen DataFrame zu erstellen:
1. Erstellen eines DataFrames aus einer Liste:
import pandas as pd
data = [['Alice', 25], ['Bob', 30], ['Charlie', 35]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
2. Erstellen eines DataFrame aus einem Wörterbuch:
import pandas as pd
3. Erstellen eines DataFrame aus einem NumPy-Array:
import pandas as pd
import numpy as np
data = np.array([['Alice', 25], ['Bob', 30], ['Charlie', 35]])
df = pd.DataFrame(data, columns=['Name', 'Age'])
4. Erstellen eines DataFrames aus einer CSV-Datei:
import pandas as pd
Nachdem Sie einen DataFrame erstellt haben, können Sie verschiedene Pandas-Methoden verwenden, um die Daten zu analysieren und zu manipulieren.
Im folgenden Artikel werden wir uns ansehen, wie ein DataFrame nach Excel exportiert wird.
Exportieren eines DataFrames nach Excel
Sie können die Pandas-Bibliothek verwenden, um einen DataFrame nach Excel zu exportieren. Pandas verfügt über eine Funktion namens to_excel(), mit der Sie DataFrame-Daten im Excel-Format speichern können.
Führen Sie die folgenden Schritte aus, um einen DataFrame nach Excel zu exportieren:
- Pandas-Bibliothek importieren: import pandas as pd
- Erstellen Sie einen DataFrame mit Daten
- Rufen Sie die Funktion to_excel() auf, um den DataFrame nach Excel zu exportieren
Hier ist ein Beispielcode:
import pandas as pd# Создание DataFrame с даннымиdata = df = pd.DataFrame(data)# Экспорт DataFrame в Exceldf.to_excel('dataframe.xlsx', index=False)
In diesem Beispiel wird ein DataFrame mit Daten zu Personen erstellt. Der DataFrame wird dann mithilfe der Funktion to_excel() in eine Excel-Datei exportiert. Dadurch wird eine Dataframe-Datei erstellt.xlsx mit Daten aus einem DataFrame.
Mit der Funktion to_excel() können Sie auch den Dateipfad, den Dateinamen und andere Exportoptionen angeben. Sie können beispielsweise einen Arbeitsblattnamen in einer Excel-Datei festlegen oder die Daten beim Export ausrichten.
Wenn Sie den DataFrame nach Excel exportieren, können Sie die Daten speichern, um sie in anderen Programmen weiterzuverwenden oder an Kollegen weiterzugeben.
Exportoptionen
Wenn Sie einen DataFrame nach Excel exportieren, gibt es verschiedene Optionen, mit denen Sie die Formatierung und Struktur der resultierenden Datei anpassen können. Hier sind einige von ihnen:
| Option | Die Beschreibung |
|---|---|
| sheet_name | Gibt den Namen des Arbeitsblatts in Excel an, in das der DataFrame exportiert werden soll. |
| index | Bestimmt, ob Indizes aus dem DataFrame in die exportierte Datei aufgenommen werden. |
| header | Bestimmt, ob Spaltennamen aus dem DataFrame in die exportierte Datei aufgenommen werden. |
| startrow und startcol | Definieren Sie die Anfangskoordinaten (Zeile und Spalte) in Excel, um die Daten zu platzieren. |
| na_rep | Gibt das Zeichen an, das zum Darstellen von fehlenden Werten (NaN) in Excel verwendet wird. |
| float_format | Gibt das Format von Gleitkommazahlen beim Export nach Excel an. |
Dies sind nur einige der verfügbaren Optionen. Eine vollständigere Liste finden Sie in der Dokumentation der Pandas-Bibliothek.
Wie speichere ich einen DataFrame in einem bestimmten Arbeitsblatt
Wenn Sie einen DataFrame nach Excel exportieren, müssen Sie ihn manchmal in einem bestimmten Arbeitsblatt speichern. Dazu können Sie das Pandas-Modul in Verbindung mit der openpyxl-Bibliothek verwenden.
- Importieren Sie die erforderlichen Module:
import pandas as pdfrom openpyxl import load_workbook
- Laden Sie den DataFrame in Excel:
df = pd.DataFrame()filename = 'output.xlsx'df.to_excel(filename, index=False)
- Öffnen Sie die Excel-Datei, und rufen Sie das Workbook-Objekt ab:
book = load_workbook(filename)
- Erstellen oder wählen Sie das Arbeitsblatt aus, in dem der DataFrame gespeichert werden soll:
sheet_name = 'Sheet2'writer = pd.ExcelWriter(filename, engine='openpyxl')writer.book = bookwriter.sheets = df.to_excel(writer, sheet_name=sheet_name, index=False)writer.save()
In diesem Beispiel wird ein neues Arbeitsblatt mit dem Namen 'Sheet2' erstellt und der DataFrame wird in dieses Arbeitsblatt exportiert. Wenn Sie den DataFrame in einem bereits vorhandenen Arbeitsblatt speichern möchten, geben Sie anstelle von 'Sheet2' den gewünschten Arbeitsblattnamen an.
Der DataFrame wird nun im angegebenen Arbeitsblatt in der Excel-Ausgabedatei gespeichert.xlsx . Wenn die Datei bereits vorhanden ist, wird das Blatt erstellt oder überschrieben.
Speichern eines DataFrames in verschiedenen Arbeitsblättern
Sie können die Pandas-Bibliothek verwenden, um DataFrame-Daten in verschiedenen Arbeitsblättern in einer Excel-Datei zu speichern. Verwenden Sie dazu die to_excel() -Methode und übergeben Sie den sheet_name-Parameter, der auf den Namen des Arbeitsblatts verweist.
import pandas as pd# Создание DataFramedata = df = pd.DataFrame(data)# Сохранение в файл Excel с разными листамиwith pd.ExcelWriter('dataframe.xlsx') as writer:df.to_excel(writer, sheet_name='Лист 1')# Создание нового DataFrame для второго листаdata2 = df2 = pd.DataFrame(data2)df2.to_excel(writer, sheet_name='Лист 2')
In diesem Beispiel wird mithilfe der ExcelWriter() -Methode ein Writer-Objekt erstellt, mit dem Daten in eine Excel-Datei geschrieben werden können. Mit der to_excel() -Methode werden die Daten dann in verschiedenen Arbeitsblättern gespeichert, die im sheet_name-Parameter angegeben sind.
Nachdem dieser Code ausgeführt wurde, wird eine Dataframe-Datei erstellt.xlsx mit zwei Blättern: "Blatt 1" und "Blatt 2". Im ersten Arbeitsblatt werden die Daten aus dem ersten DataFrame und im zweiten Arbeitsblatt die Daten aus dem zweiten DataFrame gespeichert.
Auf diese Weise können Sie die Pandas-Bibliothek verwenden, um Daten aus einem DataFrame einfach in verschiedenen Arbeitsblättern in einer Excel-Datei zu speichern.