V. Unimodale Systeme vs. Multimodale Systeme
Abschlussbedingungen
1. GENERATIVE KI
Unimodale Systeme vs. Multimodale Systeme
Unimodale Systeme
Bei ihrer ersten Veröffentlichung basierten beliebte generative KI-Systeme wie ChatGPT auf unimodalen Modellen (d. h. Modellen, die nur mit einer einzigen Art von Daten (Datenmodalität) arbeiten können – im Fall von ChatGPT waren nur Texteingaben und Textausgaben möglich).
Multimodale Systeme
In den letzten Jahren haben die Modelle hinter diesen Systemen ihre Fähigkeiten erweitert und sind multimodal geworden (d. h., sie können verschiedene Datenmodalitäten als Eingabe verarbeiten und unterschiedliche Datenmodalitäten als Ausgabe generieren). Beliebte generative KI-Systeme sind derzeit multimodal, wie beispielsweise ChatGPT, Claude und Gemini.

Multimodale Systeme bieten eine Vielzahl von Möglichkeiten. Zum Beispiel können Sie ihnen ein Bild geben, und das System generiert daraufhin eine detaillierte Bildbeschreibung, oder Sie geben dem System einen Text und bitten es, ein entsprechendes Bild (z.B., Midjourney, DALL-E) oder sogar ein Video (z.B. Runway, Sora) zu erstellen. Unten sehen Sie einige Beispiele: