Python: Daten normalisieren – So gehts

Die Normalisierung von Daten ist ein wichtiger Schritt in der Datenverarbeitung, um sicherzustellen, dass alle Werte in einem bestimmten Bereich liegen und vergleichbar sind. In diesem Beitrag zeige ich dir eine Schritt-für-Schritt-Anleitung, wie du Daten in Python normalisieren kannst.

Schritt 1: Importiere die notwendigen Bibliotheken

Um mit der Datennormalisierung in Python zu beginnen, musst du zuerst die benötigten Bibliotheken importieren. Hauptsächlich verwendest du die numpy-Bibliothek für numerische Berechnungen und die sklearn-Bibliothek für Datenmanipulation.

Python
import numpy as np
from sklearn.preprocessing import MinMaxScaler

Schritt 2: Erstelle ein Beispiel-Dataset

Um den Normalisierungsprozess zu demonstrieren, erstelle ein Beispiel-Dataset. Nehmen wir an, wir haben eine Liste von Größen von Autos in Zentimetern:

Python
data = np.array([150, 160, 170, 180, 190])

Schritt 3: Reshape das Dataset

Da das MinMaxScaler-Objekt ein 2D-Array erwartet, müssen wir das eindimensionale Array in ein 2D-Array umformen. Das erreichen wir mit der reshape()-Funktion:

Python
data = data.reshape(-1, 1)

Schritt 4: Initialisiere den Normalisierungsobjekt

Jetzt können wir das MinMaxScaler-Objekt initialisieren, das für die Normalisierung der Daten verantwortlich ist:

Python
scaler = MinMaxScaler()

Schritt 5: Führe die Normalisierung durch

Um die Daten tatsächlich zu normalisieren, rufen wir die fit_transform()-Methode des Normalisierungsobjekts auf und übergeben das Dataset:

Python
normalized_data = scaler.fit_transform(data)

Schritt 6: Zeige die normalisierten Daten an

Zum Abschluss können wir die normalisierten Daten anzeigen lassen:

Python
print(normalized_data)

Schritt 7: Teste mit realen Daten

Du kannst diese Schritte auch auf realen Daten anwenden, indem du einfach das Dataset entsprechend deiner Dienstleistung oder deinem Problem anpasst.

Fazit:

Die Normalisierung von Daten in Python ist ein wichtiger Schritt, um sicherzustellen, dass die Daten vergleichbar und in einem bestimmten Wertebereich liegen. Mit der MinMaxScaler-Funktion aus der sklearn-Bibliothek kannst du Daten einfach normalisieren. Befolge einfach die Schritt-für-Schritt-Anleitung, um deine Daten erfolgreich zu normalisieren.

    python   

Über Mich


Weitere Beiträge auf Blogseite.com




Kennst du schon diese Memes?