Künstliche Intelligenz einfach erklärt
Was steckt wirklich hinter ChatGPT, Machine Learning und Co? Hier erfährst du die Grundlagen — ohne Fachchinesisch, mit echten Beispielen.
Was ist Künstliche Intelligenz?
Künstliche Intelligenz (KI) ist eines der meistgenutzten Schlagworte unserer Zeit — aber was bedeutet es eigentlich? Eine klare Definition hilft, das Rauschen auszusortieren.
Künstliche Intelligenz bezeichnet Computerprogramme oder Systeme, die Aufgaben ausführen, die normalerweise menschliche Intelligenz erfordern würden: Sprache verstehen, Bilder erkennen, Entscheidungen treffen oder Texte schreiben.
Das klingt abstrakt, ist im Alltag aber längst angekommen:
Der Begriff KI wird oft als Sammelbegriff verwendet und umfasst mehrere Teilbereiche. Die wichtigsten Unterschiede zeigen wir im nächsten Abschnitt.
Quelle: Russell, S. & Norvig, P. (2021). Artificial Intelligence: A Modern Approach. Pearson. — Das Standardlehrbuch für Künstliche Intelligenz, das diese Definition zugrunde legt.
Machine Learning, Deep Learning & Generative KI
Die Begriffe werden oft durcheinandergeworfen. Dabei lassen sie sich ganz einfach voneinander abgrenzen — wie russische Puppen, die ineinanderstecken.
🧠 Machine Learning (ML)
Der übergeordnete Bereich: Ein Programm lernt aus Daten, statt für jede Aufgabe explizit programmiert zu werden.
- Beispiel: Ein ML-Modell lernt aus tausenden E-Mails, welche Spam sind und welche nicht — ohne dass ein Mensch jede Spam-Regel von Hand schreibt.
💡 Deep Learning
Eine spezielle Methode innerhalb von ML — mit künstlichen neuronalen Netzen, die grob am menschlichen Gehirn orientiert sind.
- Beispiel: Ein Deep-Learning-Modell erkennt auf Fotos, ob eine Katze oder ein Hund zu sehen ist — auch wenn das Bild unscharf ist oder die Katze nur halb zu sehen ist.
✨ Generative KI
Der aktuell bekannteste Zweig: KI-Systeme, die neue Inhalte erstellen — Texte, Bilder, Musik, Videos oder Code. Sie lernen nicht nur, Muster zu erkennen, sondern selbst ähnliche Inhalte zu produzieren.
- Text: ChatGPT, Claude, Gemini — schreiben Aufsätze, E-Mails, Gedichte oder Programmiercode
- Bilder: Midjourney, DALL-E, Stable Diffusion — erzeugen Grafiken aus Textbeschreibungen
- Musik: Suno, Udio — komponieren Lieder mit Text und Melodie
- Video: Runway, Sora — generieren kurze Videoclips aus Text
Ein normales Programm folgt festen Regeln, die ein Mensch geschrieben hat. Wenn du einem Taschenrechner »5 + 3« eingibst, hat ein Programmierer die Additionslogik von Hand codiert.
Ein KI-System lernt die Regeln selbst aus Beispielen. Wenn du ChatGPT »Schreib mir eine E-Mail an meinen Chef« sagst, hat niemand explizit programmiert, wie eine gute E-Mail aussehen muss. Das Modell hat es aus Millionen Beispiel-E-Mails gelernt.
Deshalb kann KI auch Dinge, die sich nicht einfach in feste Regeln fassen lassen — wie Gesichter erkennen, Sprache verstehen oder kreative Texte schreiben.
Nicht zwingend. Es gibt KI-Methoden (wie Few-Shot- oder Transfer-Learning), die mit sehr wenigen Beispielen auskommen, weil sie auf bestehendem Wissen aufbauen. Aber die großen, leistungsfähigen Modelle wie GPT-4 oder Claude wurden tatsächlich mit Milliarden von Textpassagen trainiert — das ist ein zentraler Grund für ihre beeindruckenden Fähigkeiten.
Wie funktionieren Large Language Models?
Large Language Models (LLMs) wie GPT-4, Claude oder Gemini sind der Motor hinter modernen KI-Assistenten. Aber wie genau arbeiten sie — und was passiert da eigentlich technisch?
💡 Das Grundprinzip: Nächstes Wort vorhersagen
LLMs sind im Kern extrem ausgeklügelte Text-Vervollständigungsmaschinen. Das klingt fast zu einfach, ist aber die zentrale Idee:
- Du gibst einen Text ein: »Die Hauptstadt von Österreich ist«
- Das Modell berechnet, welches Wort am wahrscheinlichsten als Nächstes kommt: »Wien«
- Dann berechnet es das nächste Wort nach »Wien« — und so weiter, Wort für Wort
- Aus dieser simplen Mechanik entstehen ganze Aufsätze, Gedichte, E-Mails oder Programmiercode
📊 Training auf riesigen Textmengen
Damit ein LLM sinnvolle Vorschläge machen kann, muss es trainiert werden — und zwar mit enormen Mengen an Text:
- Bücher (Belletristik, Sachbücher, wissenschaftliche Texte)
- Webseiten (Wikipedia, Nachrichtenartikel, Blogs, Foren)
- Wissenschaftliche Publikationen und Paper
- Programmiercode (GitHub & ähnliche Quellen)
- Social Media Beiträge und Diskussionen
Während des Trainings passiert Folgendes: Das Modell bekommt Milliarden von Textausschnitten und muss immer wieder das nächste Wort vorhersagen. Bei jeder falschen Vorhersage passt es seine internen Berechnungen minimal an — so lange, bis die Vorhersagen immer besser werden.
⚙️ Was sind Parameter?
Wenn von LLMs die Rede ist, fallen immer wieder Zahlen wie 175 Milliarden Parameter (GPT-3) oder 1,8 Billionen Parameter (GPT-4). Aber was bedeutet das?
Parameter sind die inneren Stellschrauben des Modells — vergleichbar mit den Verbindungen zwischen Neuronen im menschlichen Gehirn. Jeder Parameter speichert eine winzige Gewichtung, die beeinflusst, wie das Modell auf bestimmte Eingaben reagiert.
Faustregel: Mehr Parameter bedeuten mehr Wissen und bessere Fähigkeiten — aber auch höhere Kosten und längere Antwortzeiten. Die größten Modelle können nicht einmal auf einem einzelnen Computer betrieben werden, sondern laufen verteilt über hunderte Hochleistungsrechner (GPUs).
🧬 Der Kontext: Das Kurzzeitgedächtnis des LLMs
Jedes LLM hat eine Kontextfenster-Grenze — so viele Zeichen (Tokens) kann es auf einmal verarbeiten und merken. Ältere Modelle kamen auf 2.000–8.000 Tokens (ca. 1.500–6.000 Wörter). Aktuelle Modelle wie Claude schaffen bis zu 200.000 Tokens — das entspricht etwa 500 Seiten Text oder einem ganzen dicken Roman.
Was sind Trainingsdaten und warum sind sie wichtig?
Ein KI-Modell ist nur so gut wie die Daten, mit denen es trainiert wurde. Das klingt banal, ist aber eine der wichtigsten und am häufigsten übersehenen Wahrheiten über KI.
Trainingsdaten sind die Beispiele, anhand derer ein KI-Modell lernt. Stell dir vor, du möchtest jemandem beibringen, Hunde von Katzen zu unterscheiden. Du würdest viele Bilder zeigen und sagen: »Das ist ein Hund« oder »Das ist eine Katze«. Genau so funktioniert KI-Training — nur im gigantischen Maßstab.
Welche Probleme können durch schlechte Trainingsdaten entstehen?
- Verzerrungen (Bias): Wenn ein Bewerbungs-KI hauptsächlich mit Daten von männlichen Führungskräften trainiert wurde, lernt sie fälschlicherweise, dass Frauen weniger für Führungspositionen geeignet sind — so geschehen bei einem bekannten Amazon-Recruiting-Tool (Quelle: Reuters, 2018).
- Halluzinationen: Wenn die Trainingsdaten unvollständig sind oder das Modell zu wenig Beispiele für ein Thema hat, erfindet es überzeugend klingende Antworten, die komplett falsch sein können.
- Reproduktion von Vorurteilen: Ein KI-Chatbot, der auf Internettexten trainiert wurde, reproduziert automatisch die dort vorhandenen gesellschaftlichen Vorurteile — von rassistischen Überzeugungen bis zu sexistischen Stereotypen.
Das entscheiden die Unternehmen, die die Modelle entwickeln — OpenAI, Google, Anthropic, Meta und andere. Sie kuratieren die Datenquellen, filtern unerwünschte Inhalte und entscheiden, welche Themen überrepräsentiert werden. Transparenz ist hier ein großes Thema: Kein Unternehmen veröffentlicht seinen vollständigen Trainingsdatensatz, weil das oft urheberrechtlich und wettbewerblich heikel ist.
In Österreich und der EU wird aktuell intensiv darüber diskutiert, ob und wie Trainingsdaten urheberrechtlich geschützt sein müssen — der AI Act der EU bringt hier erste Transparenzregeln für KI-Anbieter.
Quelle: Europäische Kommission (2024). Artificial Intelligence Act. — Regelt unter anderem Transparenzpflichten für Trainingsdaten.
Ja, und das ist ein entscheidender Schritt. Nach dem großen Training durchlaufen die meisten Modelle eine Verfeinerungsphase (Fine-Tuning). Dabei wird das Modell mit kuratierten, hochwertigen Daten weitertrainiert — oft von Menschen erstellte Frage-Antwort-Paare oder nach Qualität bewertete Antworten. Dieser Schritt (Reinforcement Learning from Human Feedback, RLHF) ist maßgeblich dafür verantwortlich, dass ChatGPT brauchbare Antworten gibt statt einfach nur wahrscheinliche nächste Wörter zu produzieren.
Geschichte der KI in Kürze
Künstliche Intelligenz ist älter als viele denken. Die ersten Ideen stammen aus den 1950er-Jahren — der Weg bis zu ChatGPT war lang und voller Überraschungen.
Nach Turings grundlegender Arbeit in den 1950ern erlebte die KI-Forschung in den 1960ern und 1970ern erste Erfolge: Schachprogramme, Sprachverarbeitung und Expertensysteme entstanden. Aber die damalige Hardware war viel zu schwach, die Versprechungen zu groß — es folgte der erste KI-Winter (1974–1980), eine Zeit, in der Forschungsgelder massiv gekürzt wurden, weil die Erwartungen nicht erfüllt werden konnten.
Der IBM-Computer Deep Blue besiegte 1997 Garri Kasparow im Schach — damals eine Sensation. Allerdings war Deep Blue keine lernende KI im heutigen Sinn, sondern ein extrem schneller Rechner, der Millionen von Zugmöglichkeiten pro Sekunde durchrechnete. Es war mehr rohe Rechenleistung als echte Intelligenz, aber es zeigte der Welt, was mit Computern möglich ist.
2011 brachte Apple Siri auf den Markt — der erste Sprachassistent für Millionen von Menschen. 2016 schockierte AlphaGo (DeepMind/Google) die Welt, indem es den Go-Weltmeister Lee Sedol besiegte — eine jahrtausendealte asiatische Strategiespiel, das als zu komplex für KI galt.
Der eigentliche Game-Changer kam 2017: Google-Forscher veröffentlichten das Paper »Attention Is All You Need« und stellten die Transformer-Architektur vor. Diese Erfindung ist die technische Basis für alle heutigen großen Sprachmodelle — von GPT bis Claude. Ohne Transformer gäbe es ChatGPT nicht.
Quelle: Vaswani, A. et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30.
Nach dem ChatGPT-Launch im November 2022 überschlugen sich die Ereignisse: Google brachte Gemini (früher Bard), Anthropic veröffentlichte Claude, Meta stellte Llama als Open-Source-Modell zur Verfügung. Die EU beschloss mit dem AI Act das weltweit erste umfassende KI-Gesetz. China entwickelte eigene Modelle (DeepSeek, Qwen). Open-Source-Modelle wie Llama und Mistral wurden so leistungsfähig, dass sie mit kommerziellen Anbietern konkurrieren konnten.
Seit 2024 können auch kleine Unternehmen und Privatpersonen leistungsfähige KI-Modelle auf eigener Hardware betreiben — ein Trend, der sich 2025 weiter verstärkt hat und die Abhängigkeit von den großen US-Anbietern reduziert.
Was du dir merken solltest
KI ist keine Magie, sondern eine Technologie — mit Stärken, Schwächen und einem konkreten Funktionsprinzip, das jeder verstehen kann.
- KI erkennt Muster in Daten — sie denkt nicht wie ein Mensch, sondern berechnet Wahrscheinlichkeiten auf Basis von Milliarden von Beispielen.
- Machine Learning ist der Überbegriff, Deep Learning eine Methode darin, Generative KI eine spezielle Anwendung davon.
- LLMs sind Text-Vervollständigungsmaschinen — sie sagen Wort für Wort das wahrscheinlichste nächste Token vorher.
- Trainingsdaten entscheiden über die Qualität — schlechte Daten führen zu schlechten Ergebnissen (Garbage In, Garbage Out).
- Die Geschichte der KI reicht bis in die 1950er — ChatGPT ist der vorläufige Höhepunkt einer jahrzehntelangen Entwicklung.
- Hinterfrage KI-Antworten — besonders bei Fakten, Daten und aktuellen Ereignissen. KI halluziniert gern und überzeugend.