Zum Hauptinhalt springen

So speichern Sie Daten aus einem Datenrahmen in Excel: Eine detaillierte Anleitung zur Verwendung

Excel ist eines der beliebtesten und am häufigsten verwendeten Werkzeuge für die Arbeit mit Tabellen und numerischen Daten. Wenn Sie Daten als Datenrahmen haben und Sie sie zur weiteren Analyse oder Präsentation in Excel speichern möchten, hilft Ihnen dieser Leitfaden bei der Durchführung dieser Aufgabe.

Zunächst müssen Sie die erforderliche Pandas-Bibliothek installieren, mit der Sie mit den Daten arbeiten können, die als Tabelle dargestellt werden. Wenn Sie es nicht haben, installieren Sie es mit dem Befehl !pip install pandas.

Nach der Installation von Pandas können Sie mit der Arbeit an Ihrem Datenrahmen beginnen. Wenn Sie bereits Daten haben, laden Sie sie je nach Datenformat mit der Funktion read_csv oder read_excel hoch. Verwenden Sie dann verschiedene Pandas-Methoden, um die Daten zu manipulieren, z. B. Filtern, Sortieren, Aggregieren usw., je nach Ihren Bedürfnissen.

Sie können beispielsweise die Methoden head() oder tail() verwenden, um die Anfangs- oder Endzeilen der Daten anzuzeigen, die Methode describe(), um grundlegende statistische Merkmale abzurufen, und die Methode loc(), um auf einen bestimmten Teil der Daten basierend auf einer Bedingung zuzugreifen.

Wie exportiere ich Daten aus einem Datenrahmen nach Excel

Wenn Sie mit Daten in einem Pandas-Datenrahmen arbeiten und diese in einer Excel-Datei speichern müssen, gibt es mehrere Möglichkeiten, dies zu tun.

Der erste Weg besteht darin, die to_excel() -Methode zu verwenden. Standardmäßig werden die Daten in einer neuen Excel-Datei gespeichert. Sie können einen Dateinamen angeben, indem Sie den Parameter "path" in dieser Methode angeben. Zum Beispiel:

import pandas as pd# Создаем Data Framedf = pd.DataFrame()# Сохраняем данные в Exceldf.to_excel('output.xlsx')

Die zweite Methode besteht darin, das openpyxl-Modul zusammen mit der save() -Methode zu verwenden, um die Daten in einer vorhandenen Excel-Datei zu speichern. Um dies zu tun, müssen Sie zuerst das openpyxl-Modul mit dem Befehl pip install openpyxl installieren, falls es noch nicht auf Ihrem System vorhanden ist.

import pandas as pdfrom openpyxl import load_workbook# Создаем Data Framedf = pd.DataFrame()# Открываем существующий файл Excelbook = load_workbook('output.xlsx')# Загружаем его в Pandas Data Framewriter = pd.ExcelWriter('output.xlsx', mode='a')writer.book = book# Сохраняем данныеdf.to_excel(writer, sheet_name='Sheet2', index=False)# Закрываем файлwriter.save()writer.close()

Die dritte Möglichkeit besteht darin, das xlsxwriter-Modul zu verwenden, um eine Excel-Datei zu erstellen. Sie müssen dieses Modul mit dem Befehl pip install xlsxwriter installieren, falls es noch nicht installiert ist.

import pandas as pd# Создаем Data Framedf = pd.DataFrame()# Создаем новый файл Excelwriter = pd.ExcelWriter('output.xlsx', engine='xlsxwriter')# Сохраняем данныеdf.to_excel(writer, sheet_name='Sheet1', index=False)# Закрываем файлwriter.save()

Jetzt kennen Sie mehrere Möglichkeiten, Daten aus einem Datenrahmen in eine Excel-Datei zu exportieren. Wählen Sie das für Ihre Bedürfnisse geeignete aus und speichern Sie Ihre Daten in einem für Sie geeigneten Format!

Verwenden von Pandas und der Openpyxl-Bibliothek

openpyxl - dies ist eine Python-Bibliothek für die Arbeit mit Excel-Dateien (.xlsx), mit dem Sie Daten in Tabellenkalkulationen lesen, schreiben und ändern können. In Kombination mit Pandas bietet openpyxl die Möglichkeit, Daten aus einem DataFrame in Excel zu speichern.

Um Pandas und openpyxl zu verwenden, müssen Sie diese auf Ihrem System installieren. Sie können Pandas mit dem folgenden Befehl installieren:

pip install pandas

Und openpyxl kann wie folgt installiert werden:

pip install openpyxl

Nach der Installation von Pandas und openpyxl können Sie mit dem Exportieren von Daten aus einem DataFrame nach Excel beginnen.

Zuerst müssen Sie die erforderlichen Module importieren:

import pandas as pdfrom openpyxl import Workbook

Erstellen Sie dann einen DataFrame mit Ihren Daten.

data = df = pd.DataFrame(data)

Jetzt können Sie den DataFrame mit dem folgenden Code in Excel speichern:

filename = 'dataframe.xlsx'df.to_excel(filename, index=False)

In diesem Beispiel wird eine Datei mit dem Namen "dataframe" erstellt.xlsx", in dem Daten aus dem DataFrame `df` gespeichert werden. Der Parameter 'index=False' gibt an, dass Indizes von den zu speichernden Daten ausgeschlossen werden sollen. Wenn Sie die Indizes beibehalten müssen, entfernen Sie einfach diese Option.

Nachdem dieser Code ausgeführt wurde, werden die Daten aus dem DataFrame in der Excel-Datei "dataframe" gespeichert.xlsx".

Sie können auch Daten zu einer vorhandenen Excel-Datei hinzufügen. Dazu müssen Sie das Workbook-Objekt aus der openpyxl-Bibliothek verwenden:

from openpyxl import load_workbook# Загрузка существующего файла Excelbook = load_workbook(filename)# Выбор нужного листаwriter = pd.ExcelWriter(filename, engine='openpyxl')writer.book = book# Добавление данных в листdf.to_excel(writer, sheet_name='Sheet1', index=False)# Сохранение измененийwriter.save()writer.close()

Die Daten aus dem DataFrame 'df' werden dem Arbeitsblatt "Sheet1" der vorhandenen Excel-Datei hinzugefügt.

Mit Pandas und der openpyxl-Bibliothek können Sie Daten aus einem DataFrame in Excel-Dateien speichern und vorhandene Dateien ändern, um die Arbeit mit Daten flexibler und effizienter zu gestalten.

Erforderliche Pakete installieren

Sie können den Befehl verwenden, um das Pandas-Paket zu installieren:

pip install pandas

Nach der Installation von pandas müssen Sie möglicherweise einige weitere Pakete installieren, die mit dem Exportieren von Daten nach Excel verbunden sind. Eines dieser Pakete - openpyxl. Es ermöglicht Ihnen, mit Dateien im Excel-Format zu arbeiten (.xlsx).

Die Installation des openpyxl-Pakets erfolgt über den Befehl:

pip install openpyxl

Es ist auch erwähnenswert, dass Sie möglicherweise ein Paket benötigen, um mit Excel-Dateien zu arbeiten xlrd. Es ermöglicht Ihnen, Daten aus Excel-Formatdateien zu lesen.

Die Installation des xlrd-Pakets erfolgt mit folgendem Befehl:

pip install xlrd

Nachdem Sie die erforderlichen Pakete erfolgreich installiert haben, können Sie mit dem nächsten Schritt fortfahren, indem Sie die Daten aus dem Datenrahmen in Excel speichern.

Erstellen eines Datenrahmens und Füllen mit Daten

Bevor Sie Daten in Excel speichern können, müssen Sie einen Datenrahmen in der Programmiersprache Python erstellen und füllen. Ein Datenrahmen ist eine Tabelle mit Zeilen und Spalten, in der jede Spalte einen Datentyp enthält. Verwenden wir die Pandas-Bibliothek, um einen Datenrahmen zu erstellen und zu bearbeiten.

1. Pandas-Bibliothek installieren (falls noch nicht installiert):

pip install pandas

2. Importieren einer Bibliothek und Erstellen eines leeren Datenrahmens:

import pandas as pddf = pd.DataFrame()

3. Füllen von Daten im Datenrahmen:

Sie können Daten in einem Datenrahmen aus verschiedenen Quellen ausfüllen, z. B. aus einer Liste, einem Wörterbuch oder einem anderen Datenrahmen. Im Folgenden finden Sie einige Beispiele für das Ausfüllen von Daten:

    Aus der Liste ausfüllen:
data = [['John', 25], ['Jane', 30], ['Alex', 35]]df = pd.DataFrame(data, columns=['Name', 'Age'])
data = df = pd.DataFrame(data)
df1 = pd.DataFrame([['John', 25], ['Jane', 30]], columns=['Name', 'Age'])df2 = pd.DataFrame([['Alex', 35], ['Bob', 40]], columns=['Name', 'Age'])df = pd.concat([df1, df2], ignore_index=True)

Nachdem Sie die Daten im Datenrahmen ausgefüllt haben, können Sie mit dem Speichern der Daten in Excel fortfahren.