II. Entwicklung des Modells

Modell  entwickeln 




In dieser Phase wird das überwachte Lernmodell trainiert. Dabei sind folgende Schritte notwendig:

  1. Aufteilen des Datensatzes in Trainings- und Testdaten:
    Bevor ein überwachter Lernalgorithmus angewendet werden kann, muss der Datensatz in Trainings- und Testdaten unterteilt werden. Der Trainingsdatensatz dient dazu, das Modell zu entwickeln. Anschließend wird der Testdatensatz verwendet, um zu überprüfen, ob das Modell verlässliche und gültige Vorhersagen für neue, bislang unbekannte Daten treffen kann.

  2. Auswahl eines geeigneten Algorithmus für überwachtes Lernen:
    Zur Entwicklung des Modells kann aus einer Vielzahl von Algorithmen gewählt werden – etwa lineare Regression, Entscheidungsbaum, logistische Regression, Random Forest, Support Vector Machine, Naive Bayes oder K-Nearest Neighbors.



Play icon Teilen Sie den Datensatz in Trainings- und Testdatensätze auf: In unserer Aufgabe müssen wir unsere Daten auch in Trainings- und Testdaten aufteilen.
 
!    



Führen Sie die Codezellen im Unterabschnitt „4.1 Aufteilung von Trainings- und Testdatensätzen“ in Google Colab aus und beantworten Sie dann das folgende Quiz.

Tipp





Play icon 

Auswahl eines geeigneten Algorithmus für überwachtes Lernen:
Bevor wir einen Algorithmus festlegen, müssen wir uns überlegen, welche Art von Problem wir mit der Methode des überwachten Lernens lösen möchten. Grundsätzlich lassen sich zwei Problemtypen unterscheiden, die sich mit überwachten Lernalgorithmen bearbeiten lassen: Regression und Klassifizierung.



!    



Führen Sie die Codezellen im Unterabschnitt „4.2 Anwendung überwachter Lernalgorithmen“ in Google Colab aus und beantworten Sie dann das folgende Quiz.

Tipp