Python: Daten normalisieren – So gehts

Die Normalisierung von Daten ist ein wichtiger Schritt in der Datenverarbeitung, um sicherzustellen, dass alle Werte in einem bestimmten Bereich liegen und vergleichbar sind. In diesem Beitrag zeige ich dir eine Schritt-für-Schritt-Anleitung, wie du Daten in Python normalisieren kannst.

Schritt 1: Importiere die notwendigen Bibliotheken

Um mit der Datennormalisierung in Python zu beginnen, musst du zuerst die benötigten Bibliotheken importieren. Hauptsächlich verwendest du die numpy-Bibliothek für numerische Berechnungen und die sklearn-Bibliothek für Datenmanipulation.

import numpy as np
from sklearn.preprocessing import MinMaxScaler

Schritt 2: Erstelle ein Beispiel-Dataset

Um den Normalisierungsprozess zu demonstrieren, erstelle ein Beispiel-Dataset. Nehmen wir an, wir haben eine Liste von Größen von Autos in Zentimetern:

data = np.array([150, 160, 170, 180, 190])

Schritt 3: Reshape das Dataset

Da das MinMaxScaler-Objekt ein 2D-Array erwartet, müssen wir das eindimensionale Array in ein 2D-Array umformen. Das erreichen wir mit der reshape()-Funktion:

data = data.reshape(-1, 1)

Schritt 4: Initialisiere den Normalisierungsobjekt

Jetzt können wir das MinMaxScaler-Objekt initialisieren, das für die Normalisierung der Daten verantwortlich ist:

scaler = MinMaxScaler()

Schritt 5: Führe die Normalisierung durch

Um die Daten tatsächlich zu normalisieren, rufen wir die fit_transform()-Methode des Normalisierungsobjekts auf und übergeben das Dataset:

normalized_data = scaler.fit_transform(data)

Schritt 6: Zeige die normalisierten Daten an

Zum Abschluss können wir die normalisierten Daten anzeigen lassen:

print(normalized_data)

Schritt 7: Teste mit realen Daten

Du kannst diese Schritte auch auf realen Daten anwenden, indem du einfach das Dataset entsprechend deiner Dienstleistung oder deinem Problem anpasst.

Fazit:

Die Normalisierung von Daten in Python ist ein wichtiger Schritt, um sicherzustellen, dass die Daten vergleichbar und in einem bestimmten Wertebereich liegen. Mit der MinMaxScaler-Funktion aus der sklearn-Bibliothek kannst du Daten einfach normalisieren. Befolge einfach die Schritt-für-Schritt-Anleitung, um deine Daten erfolgreich zu normalisieren.

    python   

Über Mich


Weitere Beiträge auf Blogseite.com




Kennst du schon diese Memes?