Zum Hauptinhalt springen

Wie man die Indizes der Serie ausgibt: Eine detaillierte Anleitung für Anfänger

Series - dies ist eine der beliebtesten und wichtigsten Datenstrukturen in der Programmiersprache Python. Es ist eine geordnete Sammlung von Elementen, die von jedem Datentyp sein können. Jedes Element in series hat seinen eigenen eindeutigen Index, daher spielen Indizes eine wichtige Rolle bei der Arbeit mit Daten in series.

Schritt 1: Verbinden Sie die Pandas-Bibliothek. Bevor Sie beginnen, stellen Sie sicher, dass Sie die Pandas-Bibliothek installiert haben. Importieren Sie es mit dem Befehl import pandas as pd. Jetzt können Sie alle Funktionen und Methoden verwenden, die von der Bibliothek bereitgestellt werden, um mit series zu arbeiten.

Schritt 2: Erstellen Sie eine series mit Indizes. Sie können Indizes explizit angeben, wenn Sie eine series mit einem Parameter erstellen index. Wenn Sie beispielsweise eine series mit Indizes zwischen 0 und 4 erstellen möchten, können Sie den folgenden Code verwenden:

import pandas as pd data = [10, 20, 30, 40, 50] series = pd.Series(data, index=[0, 1, 2, 3, 4])

Jetzt haben wir eine Serie mit Indizes von 0 bis 4. Lassen Sie uns diese series ableiten, um sicherzustellen, dass die Indizes tatsächlich erstellt wurden:

0 101 202 303 404 50dtype: int64

Wie Sie sehen können, werden die Indizes links von den Elementen angezeigt. Wenn Sie nur Indizes ausgeben möchten, können Sie das Attribut verwenden index series:

RangeIndex(start=0, stop=5, step=1)

Auf diese Weise können Sie die series-Indizes mit einfachen Befehlen und Methoden der Pandas-Bibliothek ausgeben. Auf diese Weise können Sie leicht durch die Daten navigieren und eine Vielzahl von Indexoperationen durchführen.

Wie man mit Series-Indizes arbeitet: Eine detaillierte Anleitung für Anfänger

Lassen Sie uns zunächst eine einfache series erstellen:

import pandas as pddata = series = pd.Series(data)

In diesem Beispiel haben wir eine series erstellt, bei der die Schlüssel die Buchstaben 'a', 'b' und 'c' und die Werte die Zahlen 1, 2 und 3 sind.

Sie können nun eckige Klammern verwenden, um einen Wert zu erhalten, der einem bestimmten Index entspricht:

value = series['a']print(value)

In der Ausgabe erhalten wir die Zahl 1, da der Index 'a' dem Wert 1 entspricht.

Wenn Sie mehrere Werte für Indizes abrufen möchten, können Sie eine Liste von Indizes in eckigen Klammern übergeben:

values = series[['a', 'c']]print(values)

In diesem Beispiel erhalten wir in der Ausgabe eine series, die die Werte 1 und 3 enthält, die den Indizes 'a' und 'c' entsprechen.

Sie können auch Bedingungen verwenden, um Werte nach Indizes zu filtern:

filtered_values = series[series > 1]print(filtered_values)

In diesem Beispiel erhalten wir in der Ausgabe eine series, in der nur Werte größer als 1 verbleiben.

Außerdem können Sie die Werte nach Indizes wie folgt ändern:

series['a'] = 10print(series)

In diesem Beispiel haben wir den Wert, der dem Index 'a' entspricht, in die Zahl 10 geändert.

Wie Sie sehen können, ist die Arbeit mit series-Indizes ziemlich einfach und ermöglicht verschiedene Datenoperationen. Beachten Sie, dass die Indizes in Pandas nicht nur numerische, sondern auch String- oder andere Datentypen sein können. Dies macht die Arbeit mit Indizes noch flexibler und bequemer.

Verstehen von Series-Indizes

Indizes können numerische Werte, Zeichenfolgen oder sogar andere Objekte sein. Sie können beim Erstellen einer Series explizit festgelegt oder automatisch zugewiesen werden, wenn kein explizit spezifizierter Index angegeben ist.

Eines der wichtigsten Merkmale von Series-Indizes ist ihre Einzigartigkeit. Jeder Indexwert muss für jedes Element in der Series eindeutig sein. Wenn zwei Elemente denselben Indexwert haben, kann dies beim Zugriff auf die Daten zu Mehrdeutigkeiten oder Fehlern führen.

Indizes ermöglichen eine schnelle und effiziente Ausführung von Vorgängen wie Suchen, Sortieren und Zusammenführen von Daten. Sie erleichtern den Zugriff auf die gewünschten Elemente und ermöglichen Operationen nur mit Daten, die bestimmte Kriterien erfüllen.

Index-WertElement-Wert
010
120
230
340

In der obigen Tabelle beginnen die Indizes beispielsweise bei 0 und werden für jedes nächste Element um 1 erhöht. Indizes können verwendet werden, um auf bestimmte Elemente zuzugreifen, z. B. ein Element mit dem Index 2, das den Wert 30 hat.

Das Verständnis von Series-Indizes ist ein wichtiger Aspekt der Arbeit mit Daten. Sie helfen dabei, Daten zu strukturieren und zu kategorisieren, wodurch sie leichter analysiert und verarbeitet werden können. Die korrekte Verwendung und das Verständnis von Indizes kann die Effizienz bei der Arbeit mit Series-Objekten erheblich verbessern.

Erstellen eines neuen series-Index

Um einen neuen Index für die Series in Pandas zu erstellen, müssen Sie die set_index() -Methode verwenden. Mit dieser Methode können Sie einen neuen Index für eine oder mehrere Dataframe-Spalten festlegen.

Beispiel für die Verwendung der set_index() -Methode :

import pandas as pd

Durch die Ausführung dieses Codes wird ein neuer Index mit der Spalte Name erstellt. Die Series würde wie folgt aussehen:

NameAlter
Alexej30
Maria25
Iwan35
Elena28

Die Spalte 'Name' ist jetzt der Index der Serie.

Wenn Sie jedoch einen Index mit mehreren Spalten erstellen müssen, können Sie die Liste der Spaltennamen an die Methode set_index() übergeben. Zum Beispiel:

df = df.set_index(['Name', 'Alter'])
print(df)

Das Ergebnis der Ausführung ist wie folgt:

NameAlter
Alexej30
Maria25
Iwan35
Elena28

Mit der Methode set_index() können Sie daher in Pandas einfach einen neuen Index für Ihre Series erstellen.

Hinzufügen von Daten zum series-Index

Sie müssen die Methode verwenden, um Daten zum series-Index hinzuzufügen.loc[]. Mit dieser Methode können Sie dem Index neue Werte hinzufügen, indem Sie die entsprechenden Indexbezeichnungen angeben.

Der Prozess zum Hinzufügen von Daten zum series-Index kann in die folgenden Schritte unterteilt werden:

  1. Wählen Sie die gewünschte Position im Index aus, an die Sie den neuen Wert hinzufügen möchten.
  2. Verwenden Sie die Methode .loc[] Geben Sie die Indexbezeichnung an und weisen Sie einen neuen Wert zu.
import pandas as pd# Создание seriesdata = series = pd.Series(data)print("Оригинальная series:")print(series)# Добавление нового значения в индексseries.loc['D'] = 4print("Обновленная series:")print(series)

In diesem Beispiel wird dem Index der Serie ein neuer Wert mit der Bezeichnung 'D' hinzugefügt. Daher enthält die aktualisierte series am Ende des Index einen neuen Wert:

A 1B 2C 3D 4dtype: int64

Mit der Methode .loc[]. Sie können dem series-Index überall neue Werte hinzufügen. Geben Sie einfach die gewünschte Indexbezeichnung an und weisen Sie einen neuen Wert zu.

Abrufen von Daten aus einem series-Index

Ein Index in einem Series-Objekt ist ein Satz von Beschriftungen für jedes Element in der Serie. Es kann ein numerischer, String- oder anderer Typ sein. Das Abrufen von Daten aus einem Index ermöglicht den Zugriff auf bestimmte Elemente der Serie.

Sie können den eckigen Klammern-Operator verwenden, um Daten aus einem Index abzurufen [] die die Beschriftung des zu extrahierenden Elements angeben. Sie können beispielsweise den folgenden Code verwenden, um ein Serienelement anhand seines Index 2 abzurufen:

Sie können auch mehrere Elemente einer Serie extrahieren, indem Sie ihre Indizes in einem eckigen Klammern-Operator als Liste angeben, z. B.:

Beim Abrufen von Daten aus einem Index können Sie auch die Boolesche Indizierung verwenden, mit der nur die Elemente der Serie abgerufen werden können, für die die Bedingung wahr ist. Wenn Sie beispielsweise alle Elemente einer Serie abrufen möchten, deren Werte größer als 5 sind, können Sie den folgenden Code verwenden:

Durch das Extrahieren von Daten aus einem Index können Sie die gewünschten Elemente effizient aus der Serie abrufen und nach Bedarf verarbeiten.

Aktualisieren von Daten im series-Index

Sie müssen mehrere Schritte ausführen, um die Daten im series-Index zu aktualisieren:

  1. Wählen Sie den zu aktualisierenden Index aus.
  2. Bestimmen, welche Informationen geändert werden sollen.
  3. Wenden Sie die entsprechende Methode an, um die Daten zu aktualisieren:
    • Die at-Methode aktualisiert den Wert am angegebenen Index.
    • Die loc-Methode aktualisiert die Werte anhand der Filterbedingung.
    • iloc-Methode - aktualisiert Werte nach einem numerischen Index.
    • Die mask-Methode aktualisiert die in der Maske angegebenen Werte.
    • Die where-Methode aktualisiert die in der Bedingung angegebenen Werte.
  4. Überprüfen Sie, ob die Daten erfolgreich aktualisiert wurden.

Das Aktualisieren der Daten im series-Index kann nützlich sein, wenn Sie mit einer großen Menge an Informationen arbeiten oder wenn Sie die Daten zur weiteren Analyse oder Verarbeitung ändern möchten.

Löschen von Daten aus einem series-Index

Wenn Sie mit Series-Indizes in Python arbeiten, müssen Sie möglicherweise häufig einige Daten löschen, um den Index zu löschen oder bestimmte Elemente zu löschen. In diesem Abschnitt werden wir verschiedene Möglichkeiten zum Löschen von Daten aus dem series-Index untersuchen.

  • Verwenden Sie die drop() -Methode, um Elemente nach ihrem Index zu löschen:
  • series.drop(index)
  • Verwenden Sie die drop() -Methode mit einer Liste von Indizes, um mehrere Elemente zu entfernen:
  • series.drop([index1, index2, . ])
  • Verwenden Sie die drop() -Methode mit einer Bedingung, um Elemente zu entfernen, die eine bestimmte Bedingung erfüllen:
  • series.drop(series[condition])

Mit diesen Methoden können Sie die benötigten Daten leicht aus dem series-Index entfernen, um nur die Elemente zu speichern, die Sie wirklich benötigen. Es ist wichtig sich daran zu erinnern, dass die Daten direkt aus dem Index gelöscht werden, also seien Sie vorsichtig und stellen Sie sicher, dass die Löschung zum richtigen Zeitpunkt und auf der richtigen Ebene stattfindet.

Filtern von Daten im series-Index

Sie können die loc-Methode oder den Zugriffsoperator verwenden, um Daten nach Index zu filtern [] . Sie können beispielsweise Code verwenden, um alle Werte auszuwählen, die einem bestimmten Index entsprechen:

series.loc[index]
series[index]

Sie können logische Operatoren und die loc-Methode verwenden, um bedingungsbasierte Filter durchzuführen. Um beispielsweise alle Werte auszuwählen, die größer als ein bestimmter Schwellenwert sind, können Sie Code verwenden:

series.loc[series > threshold]

Oder Sie können einen Zugriffsoperator verwenden [] :

series[series > threshold]

Sie können auch mehrere Bedingungen kombinieren, indem Sie logische Operatoren wie & (und), | (oder) und ~ (nicht) verwenden. Um beispielsweise alle Werte auszuwählen, die größer als oder kleiner als ein anderer Schwellenwert sind, können Sie Code verwenden:

series.loc[(series > threshold1) & (series < threshold2)]
series[(series > threshold1) & (series < threshold2)]

Durch das Filtern der Daten im series-Index können Sie effizient mit großen Datenmengen arbeiten und nur die Werte auswählen, die für die Analyse oder Visualisierung benötigt werden.

Sortieren von Daten im series-Index

Wenn Sie mit einem series-Objekt in Python arbeiten, kann die Reihenfolge der Daten im Index eine wichtige Rolle spielen. Wenn Sie die Daten nach Index sortieren möchten, können Sie die Methode sort_index() verwenden.

Die Methode sort_index() sortiert den Index der series-Daten standardmäßig in alphabetischer Reihenfolge. Wenn Sie die Sortierreihenfolge ändern oder andere Sortierungen angeben möchten, können Sie Methodenargumente verwenden.

import pandas as pddata = df = pd.DataFrame(data)s = pd.Series(data['A'])print("Исходный series:")print(s)# Сортировка данных в индексе по умолчаниюsorted_s = s.sort_index()print("Отсортированный series по индексу:")print(sorted_s)
Исходный series:0 11 42 2dtype: int64Отсортированный series по индексу:0 11 42 2dtype: int64

Die sort_index() -Methode kann auch Argumente verwenden, um die Sortierreihenfolge zu ändern. Sie können den Index beispielsweise in umgekehrter Reihenfolge sortieren, indem Sie das Argument ascending=False hinzufügen :

# Сортировка индекса в обратном порядкеsorted_s_reverse = s.sort_index(ascending=False)print("Отсортированный series в обратном порядке:")print(sorted_s_reverse)
Отсортированный series в обратном порядке:2 21 40 1dtype: int64

Das Sortieren der Daten im series-Index macht es daher einfach, die Reihenfolge der Daten zu ändern und in einem praktischen Format mit ihnen zu arbeiten.

Indizieren mehrerer Spalten in Series

Wenn wir mit Series in Pandas arbeiten, können wir mehrere Spalten indizieren, um einen flexibleren Datenzugriff zu erhalten. Die Indizierung ermöglicht es uns, bestimmte Werte oder Teilmengen von Daten aus der Series unter bestimmten Bedingungen auszuwählen.

Für die Indizierung mehrerer Spalten in Series können wir zwei Methoden verwenden – die Indexierung nach Beschriftung und die Indexierung nach Position.

Durch die Indexierung nach Beschriftungen können wir Werte mithilfe von Indexbeschriftungen auswählen. Wir können ein Paar von Beschriftungswerten verwenden, um mehrere Spalten zu indizieren. Zum Beispiel:

  • series[['column1', 'column2']]

Hier geben wir eine Liste von Spalten an – 'column1' und 'column2', und wir erhalten eine neue Series, die nur diese Spalten enthält.

Durch die Indexierung nach Position können wir Werte anhand der Positionen der Elemente in der Series auswählen. Wir können Slices verwenden, um mehrere Spalten nach ihren Positionen auszuwählen. Zum Beispiel:

  • series.iloc[:, 1:3]

Hier geben wir die Scheibe an [:, 1:3], die alle Zeilen und Spalten mit den Positionen 1 bis 3 auswählt (ohne die Endposition).

Das Indizieren mehrerer Spalten in einer Series ist sehr nützlich, wenn wir nur mit bestimmten Datenspalten arbeiten oder eine neue Series basierend auf mehreren Spalten erstellen müssen.