Die Pandas-Bibliothek ist eine der beliebtesten Bibliotheken für die Arbeit mit Daten in der Programmiersprache Python. Eine der wichtigsten Funktionen besteht darin, Daten aus verschiedenen Quellen zu lesen und zu schreiben, einschließlich Excel-Dateien. In diesem Artikel werden wir uns ansehen, wie Sie die Namen von Arbeitsblättern in einer Excel-Datei mit Pandas abrufen können.
Zuerst müssen Sie die Pandas-Bibliothek importieren:
import pandas as pd
Dann können Sie die Funktion verwenden ExcelFile() zum Lesen einer Excel-Datei:
excel_file = pd.ExcelFile('filename.xlsx')
Danach können Sie die Liste der Blattnamen in der Datei mithilfe des Attributs abrufen sheet_names:
sheet_names = excel_file.sheet_names
Jetzt, in einer Variablen sheet_names enthält die Namen aller Arbeitsblätter in einer Excel-Datei und kann zur weiteren Verarbeitung der Daten verwendet werden.
Pandas: So lesen Sie den Namen eines Arbeitsblatts in Excel
Sie können den folgenden Code verwenden, um den Namen eines Blattes mit Pandas zu lesen:
import pandas as pd excel_file = pd.ExcelFile('Dateiname.xlsx') sheet_names = excel_file.sheet_names
In diesem Code wird zuerst die Pandas-Bibliothek mit dem abgekürzten Namen "pd" importiert.
Mit der zweiten Zeile wird ein ExcelFile-Objekt erstellt, das eine Excel-Datei mit dem angegebenen Namen "Dateiname" öffnet.xlsx".
Als nächstes können Sie mit der sheet_names-Methode eine Liste aller verfügbaren Blätter in der Datei abrufen. Diese Liste wird in der Variablen sheet_names gespeichert.
Nachdem Sie die Namen der Arbeitsblätter gelesen haben, können Sie das gewünschte Arbeitsblatt für die weitere Arbeit mit den Daten auswählen. Sie können beispielsweise den folgenden Code verwenden, um Daten aus Blatt1 zu lesen:
In diesem Code wird die parse-Methode des ExcelFile-Objekts verwendet, an die der Arbeitsblattname 'Tabelle1' übergeben wird. Die parse-Methode liest die Daten aus dem angegebenen Arbeitsblatt und gibt sie als DataFrame-Objekt zurück, das in der Variablen dataframe gespeichert wird.
Jetzt wissen Sie, wie Sie den Namen eines Arbeitsblatts in einer Excel-Datei mit der Pandas-Bibliothek lesen können. Dadurch können Sie das gewünschte Arbeitsblatt auswählen und mit den darin enthaltenen Daten arbeiten.
Arbeitsvorbereitung
Bevor Sie mit der Pandas-Bibliothek beginnen und den Arbeitsblattnamen in Excel lesen können, müssen Sie Pandas auf Ihrem Computer installieren.
1. Installieren Sie Python, wenn es noch nicht auf Ihrem Computer vorhanden ist.
2. Öffnen Sie eine Eingabeaufforderung und geben Sie den Befehl ein, um Pandas zu installieren: pip install pandas .
Nach der Installation ist die Bibliothek einsatzbereit.
Sie müssen auch eine Excel-Datei haben, aus der wir die Daten lesen werden. Dafür:
1. Laden Sie eine Excel-Datei mit den erforderlichen Daten herunter oder erstellen Sie sie.
2. Stellen Sie sicher, dass die Datei eine Erweiterung hat .xlsx und enthält mehrere Blätter.
Der nächste Schritt besteht darin, die Pandas-Bibliothek in den Code Ihres Programms zu importieren. Verwenden Sie dazu die folgende Codezeile:
import pandas as pd
Jetzt können Sie mit der Pandas-Bibliothek beginnen und mit dem Lesen des Arbeitsblattnamens in Excel beginnen. Im nächsten Abschnitt werden wir die Details dieses Prozesses untersuchen.
Möglicherweise benötigen Sie eine Tabelle, in die die Daten geschrieben werden. Im Folgenden finden Sie eine ungefähre Tabellenstruktur, die Sie verwenden können:
| Spalte 1 | Spalte 2 | Spalte 3 |
|---|---|---|
| Wert 1 | Wert 2 | Wert 3 |
| Wert 4 | Wert 5 | Wert 6 |
| Wert 7 | Wert 8 | Wert 9 |
Installieren und Importieren der benötigten Bibliotheken
Um mit dem Lesen des Arbeitsblattnamens in Excel zu arbeiten, müssen wir die Bibliotheken installieren Pandas und Openpyxl. Diese Bibliotheken ermöglichen es uns, Daten im Excel-Format zu verarbeiten und Informationen über die Arbeitsblätter in einer Datei zu erhalten.
Die Installation der Bibliotheken erfolgt über den Paketmanager pip. Öffnen Sie eine Eingabeaufforderung, und führen Sie die folgenden Befehle aus:
pip install pandas
pip install openpyxl
Nachdem die Bibliotheken erfolgreich installiert wurden, können wir sie wie folgt in unseren Code importieren:
import pandas as pd
from openpyxl import load_workbook
Jetzt haben wir alle notwendigen Werkzeuge, um den Arbeitsblattnamen in einer Excel-Datei mit den Pandas- und Openpyxl-Bibliotheken zu lesen.
Lesen einer Excel-Datei mit Pandas
Die Pandas-Bibliothek bietet eine einfache und bequeme Möglichkeit, Excel-Dateien zu lesen. Dazu müssen Sie die Bibliothek mit dem Befehl pip install pandas installieren und in Ihr Python-Skript importieren.
Die Pandas-Bibliothek bietet die Funktion read_excel() , mit der Sie Daten aus Excel-Dateien lesen können. Diese Funktion kann verschiedene Optionen zum Anpassen des Lesens einer Datei verwenden, z. B. Dateiname, Blattname usw.
Hier ist ein Beispiel für die Verwendung der Funktion read_excel() zum Lesen einer Excel-Datei:
import pandas as pd# Чтение Excel-файлаdf = pd.read_excel('имя_файла.xlsx', sheet_name='имя_листа')
In diesem Beispiel lesen wir Daten aus einer Excel-Datei mit dem Namen 'Dateiname'.xlsx' und ein Arbeitsblatt mit dem Namen 'Listenname'. Das Ergebnis des Datenlesens wird in der Variablen df gespeichert, mit der wir die Daten analysieren können.
Es ist wichtig zu beachten, dass der Dateiname und der Arbeitsblattname korrekt angegeben werden müssen. Wenn kein Blattname angegeben ist, wird standardmäßig das erste Blatt in der Datei gelesen. Sie können auch eine Blattnummer angeben, die mit 0 beginnt.
Wenn Daten in die Variable df gelesen werden, können wir verschiedene Pandas-Methoden verwenden, um diese Daten zu analysieren, z. B. Filtern, Sortieren, Aggregieren usw.
Die Verwendung der Pandas-Bibliothek zum Lesen von Excel-Dateien erleichtert das Arbeiten mit Excel-Daten und ermöglicht den schnellen Zugriff auf den Inhalt dieser Dateien in Ihren Python-Skripten.
Die folgende Tabelle zeigt die aus einer Excel-Datei gelesenen Daten an:
| Spalte 1 | Spalte 2 | Spalte 3 |
|---|---|---|
| Wert 1 | Wert 2 | Wert 3 |
| Wert 4 | Wert 5 | Wert 6 |
Überprüfen von Arbeitsblattnamen in Excel
Wenn Sie mit der Pandas-Bibliothek arbeiten, können Sie die Namen aller Arbeitsblätter in einer Excel-Datei mithilfe der Funktion überprüfen sheet_names.
Dazu müssen Sie die Pandas-Bibliothek importieren und die Methode verwenden ExcelFile um eine Excel-Datei zu lesen. Dann können Sie die Funktion aufrufen sheet_names um eine Liste der Blattnamen abzurufen.
Beispielcode zum Überprüfen von Arbeitsblattnamen in Excel:
import pandas as pd# Указываем путь к Excel-файлуexcel_file = 'путь_к_файлу.xlsx'# Чтение Excel-файлаxls = pd.ExcelFile(excel_file)# Получение списка имен листовsheet_names = xls.sheet_names# Вывод списка имен листовfor sheet_name in sheet_names:print(sheet_name)
Wenn Sie diesen Code ausführen, werden die Namen aller Arbeitsblätter in der Excel-Datei angezeigt.
Daher ist die Validierung von Blattnamen in Excel ein wichtiger Schritt beim Arbeiten mit Daten mit der Pandas-Bibliothek. Auf diese Weise können Sie ganz einfach bestimmen, welche Arbeitsblätter verfügbar sind, und das gewünschte Arbeitsblatt zum Lesen der Daten auswählen.
Beispielcode zum Lesen eines Arbeitsblattnamens in Excel
Sie können das ExcelFile-Modul verwenden, um mit Excel-Dateien in der Pandas-Bibliothek zu arbeiten. Es folgt ein Codebeispiel, mit dem Sie eine Liste der Namen aller Arbeitsblätter in einer Excel-Datei abrufen können:
import pandas as pd
# Geben Sie den Pfad zur Datei an
# Erstellen Sie ein Objekt der ExcelFile-Klasse
# Wir erhalten eine Liste aller Blattnamen
# Die Namen der Blätter werden angezeigt
print("Arbeitsblattnamen in Excel-Datei:")
for name in sheet_names:
In diesem Beispiel importieren wir die Pandas-Bibliothek und geben den Pfad zur Excel-Datei an. Erstellen Sie dann ein Objekt der ExcelFile-Klasse, indem Sie den Dateipfad an dieses Objekt übergeben. Die sheet_names-Methode gibt eine Liste der Namen aller Arbeitsblätter in einer Excel-Datei zurück. Als nächstes geben wir die Namen der Blätter mit einer Schleife aus.
Daher können Sie mit diesem Code die Namen aller Arbeitsblätter in einer Excel-Datei abrufen, was beim späteren Lesen, Analysieren oder Bearbeiten von Daten nützlich sein kann.