🤖 KI-Grundlagen

Künstliche Intelligenz einfach erklärt

Was steckt wirklich hinter ChatGPT, Machine Learning und Co? Hier erfährst du die Grundlagen — ohne Fachchinesisch, mit echten Beispielen.

🧠

VerständlichKein Vorwissen nötig

📚

FundiertTechnisch korrekt, nicht oberflächlich

🌍

PraktischBeispiele aus dem echten Leben

Grundlagen

Was ist Künstliche Intelligenz?

✦

Künstliche Intelligenz (KI) ist eines der meistgenutzten Schlagworte unserer Zeit — aber was bedeutet es eigentlich? Eine klare Definition hilft, das Rauschen auszusortieren.

Künstliche Intelligenz bezeichnet Computerprogramme oder Systeme, die Aufgaben ausführen, die normalerweise menschliche Intelligenz erfordern würden: Sprache verstehen, Bilder erkennen, Entscheidungen treffen oder Texte schreiben.

Das klingt abstrakt, ist im Alltag aber längst angekommen:

📱

Gesichtserkennung

Dein Smartphone entsperrt sich, weil es dein Gesicht erkennt — das ist KI, die täglich Millionen Mal abläuft.

📨

Spam-Filter

Dein E-Mail-Postfach sortiert Werbung und Phishing-Versuche automatisch aus — seit Jahren eine der erfolgreichsten KI-Anwendungen.

💬

Chat-Assistenten

ChatGPT, Claude oder Gemini beantworten Fragen, schreiben Texte und helfen beim Programmieren — die bekannteste Form moderner KI.

💡 Wichtig zu verstehenKI denkt nicht wie ein Mensch und hat kein Bewusstsein. Sie erkennt Muster in riesigen Datenmengen und trifft auf Basis dieser Muster Entscheidungen oder generiert Antworten. Das ist extrem nützlich, aber kein menschliches Denken.

Der Begriff KI wird oft als Sammelbegriff verwendet und umfasst mehrere Teilbereiche. Die wichtigsten Unterschiede zeigen wir im nächsten Abschnitt.

Quelle: Russell, S. & Norvig, P. (2021). Artificial Intelligence: A Modern Approach. Pearson. — Das Standardlehrbuch für Künstliche Intelligenz, das diese Definition zugrunde legt.

Begriffe

Machine Learning, Deep Learning & Generative KI

✦

Die Begriffe werden oft durcheinandergeworfen. Dabei lassen sie sich ganz einfach voneinander abgrenzen — wie russische Puppen, die ineinanderstecken.

🧠 Machine Learning (ML)

Der übergeordnete Bereich: Ein Programm lernt aus Daten, statt für jede Aufgabe explizit programmiert zu werden.

Beispiel: Ein ML-Modell lernt aus tausenden E-Mails, welche Spam sind und welche nicht — ohne dass ein Mensch jede Spam-Regel von Hand schreibt.

💡 Deep Learning

Eine spezielle Methode innerhalb von ML — mit künstlichen neuronalen Netzen, die grob am menschlichen Gehirn orientiert sind.

Beispiel: Ein Deep-Learning-Modell erkennt auf Fotos, ob eine Katze oder ein Hund zu sehen ist — auch wenn das Bild unscharf ist oder die Katze nur halb zu sehen ist.

✨ Generative KI

Der aktuell bekannteste Zweig: KI-Systeme, die neue Inhalte erstellen — Texte, Bilder, Musik, Videos oder Code. Sie lernen nicht nur, Muster zu erkennen, sondern selbst ähnliche Inhalte zu produzieren.

Text: ChatGPT, Claude, Gemini — schreiben Aufsätze, E-Mails, Gedichte oder Programmiercode
Bilder: Midjourney, DALL-E, Stable Diffusion — erzeugen Grafiken aus Textbeschreibungen
Musik: Suno, Udio — komponieren Lieder mit Text und Melodie
Video: Runway, Sora — generieren kurze Videoclips aus Text

✅ MerkregelMachine Learning ist der Oberbegriff. Deep Learning ist eine Methode darin. Generative KI ist eine Anwendung von Deep Learning, die Neues erschafft statt nur zu analysieren. Jede generative KI ist Deep Learning, aber nicht jedes Deep Learning ist generativ.

Was ist der Unterschied zwischen KI und einem normalen Computerprogramm? +

Ein normales Programm folgt festen Regeln, die ein Mensch geschrieben hat. Wenn du einem Taschenrechner »5 + 3« eingibst, hat ein Programmierer die Additionslogik von Hand codiert.

Ein KI-System lernt die Regeln selbst aus Beispielen. Wenn du ChatGPT »Schreib mir eine E-Mail an meinen Chef« sagst, hat niemand explizit programmiert, wie eine gute E-Mail aussehen muss. Das Modell hat es aus Millionen Beispiel-E-Mails gelernt.

Deshalb kann KI auch Dinge, die sich nicht einfach in feste Regeln fassen lassen — wie Gesichter erkennen, Sprache verstehen oder kreative Texte schreiben.

Braucht jede KI riesige Datenmengen? +

Nicht zwingend. Es gibt KI-Methoden (wie Few-Shot- oder Transfer-Learning), die mit sehr wenigen Beispielen auskommen, weil sie auf bestehendem Wissen aufbauen. Aber die großen, leistungsfähigen Modelle wie GPT-4 oder Claude wurden tatsächlich mit Milliarden von Textpassagen trainiert — das ist ein zentraler Grund für ihre beeindruckenden Fähigkeiten.

Technik

Wie funktionieren Large Language Models?

✦

Large Language Models (LLMs) wie GPT-4, Claude oder Gemini sind der Motor hinter modernen KI-Assistenten. Aber wie genau arbeiten sie — und was passiert da eigentlich technisch?

💡 Das Grundprinzip: Nächstes Wort vorhersagen

LLMs sind im Kern extrem ausgeklügelte Text-Vervollständigungsmaschinen. Das klingt fast zu einfach, ist aber die zentrale Idee:

Du gibst einen Text ein: »Die Hauptstadt von Österreich ist«
Das Modell berechnet, welches Wort am wahrscheinlichsten als Nächstes kommt: »Wien«
Dann berechnet es das nächste Wort nach »Wien« — und so weiter, Wort für Wort
Aus dieser simplen Mechanik entstehen ganze Aufsätze, Gedichte, E-Mails oder Programmiercode

💡 VeranschaulichungStell dir vor, du tippst auf dem Handy »Ich freue mich auf« und die Autovervollständigung schlägt »morgen« vor. Ein LLM macht exakt das Gleiche — aber mit einem riesigen Kontextverständnis und einem Vokabular von Millionen von Wörtern und Konzepten.

📊 Training auf riesigen Textmengen

Damit ein LLM sinnvolle Vorschläge machen kann, muss es trainiert werden — und zwar mit enormen Mengen an Text:

Bücher (Belletristik, Sachbücher, wissenschaftliche Texte)
Webseiten (Wikipedia, Nachrichtenartikel, Blogs, Foren)
Wissenschaftliche Publikationen und Paper
Programmiercode (GitHub & ähnliche Quellen)
Social Media Beiträge und Diskussionen

Während des Trainings passiert Folgendes: Das Modell bekommt Milliarden von Textausschnitten und muss immer wieder das nächste Wort vorhersagen. Bei jeder falschen Vorhersage passt es seine internen Berechnungen minimal an — so lange, bis die Vorhersagen immer besser werden.

⚠️ Was dabei schieflaufen kannWeil LLMs auf dem gesamten Internet trainieren, lernen sie auch dessen Schattenseiten: Vorurteile, Falschinformationen und problematische Inhalte. Ein Großteil der Arbeit nach dem Training besteht darin, diese unerwünschten Muster zu korrigieren — das nennt sich Alignment oder Fine-Tuning.

⚙️ Was sind Parameter?

Wenn von LLMs die Rede ist, fallen immer wieder Zahlen wie 175 Milliarden Parameter (GPT-3) oder 1,8 Billionen Parameter (GPT-4). Aber was bedeutet das?

Parameter sind die inneren Stellschrauben des Modells — vergleichbar mit den Verbindungen zwischen Neuronen im menschlichen Gehirn. Jeder Parameter speichert eine winzige Gewichtung, die beeinflusst, wie das Modell auf bestimmte Eingaben reagiert.

🔢

7 Mrd. Parameter

Mistral 7B, Llama 2 7B — klein, laufen auf Mittelklasse-Hardware, erstaunlich fähig für die Größe.

📈

70–175 Mrd. Parameter

GPT-3, Claude Sonnet, Llama 2 70B — die aktuelle Oberklasse für anspruchsvolle Aufgaben.

💠

> 1 Billion Parameter

GPT-4, Claude Opus — extrem leistungsfähig, aber nur mit Rechenzentrums-Infrastruktur betreibbar.

Faustregel: Mehr Parameter bedeuten mehr Wissen und bessere Fähigkeiten — aber auch höhere Kosten und längere Antwortzeiten. Die größten Modelle können nicht einmal auf einem einzelnen Computer betrieben werden, sondern laufen verteilt über hunderte Hochleistungsrechner (GPUs).

🧬 Der Kontext: Das Kurzzeitgedächtnis des LLMs

Jedes LLM hat eine Kontextfenster-Grenze — so viele Zeichen (Tokens) kann es auf einmal verarbeiten und merken. Ältere Modelle kamen auf 2.000–8.000 Tokens (ca. 1.500–6.000 Wörter). Aktuelle Modelle wie Claude schaffen bis zu 200.000 Tokens — das entspricht etwa 500 Seiten Text oder einem ganzen dicken Roman.

✅ BeispielDu kannst Claude den gesamten Text eines Buches geben und dann eine Zusammenfassung verlangen. Das Modell kann zurückblättern, Zitate finden und Zusammenhänge über Kapitel hinweg erkennen — so wie ein Mensch, der das Buch gelesen hat.

Daten

Was sind Trainingsdaten und warum sind sie wichtig?

✦

Ein KI-Modell ist nur so gut wie die Daten, mit denen es trainiert wurde. Das klingt banal, ist aber eine der wichtigsten und am häufigsten übersehenen Wahrheiten über KI.

Trainingsdaten sind die Beispiele, anhand derer ein KI-Modell lernt. Stell dir vor, du möchtest jemandem beibringen, Hunde von Katzen zu unterscheiden. Du würdest viele Bilder zeigen und sagen: »Das ist ein Hund« oder »Das ist eine Katze«. Genau so funktioniert KI-Training — nur im gigantischen Maßstab.

⚠️ Garbage In, Garbage OutDer wichtigste Grundsatz im Machine Learning: Wenn die Trainingsdaten fehlerhaft, einseitig oder unvollständig sind, wird das KI-Modell ebenfalls fehlerhaft, einseitig oder unvollständig sein. Keine noch so gute Technik kann schlechte Daten reparieren.

Welche Probleme können durch schlechte Trainingsdaten entstehen?

Verzerrungen (Bias): Wenn ein Bewerbungs-KI hauptsächlich mit Daten von männlichen Führungskräften trainiert wurde, lernt sie fälschlicherweise, dass Frauen weniger für Führungspositionen geeignet sind — so geschehen bei einem bekannten Amazon-Recruiting-Tool (Quelle: Reuters, 2018).
Halluzinationen: Wenn die Trainingsdaten unvollständig sind oder das Modell zu wenig Beispiele für ein Thema hat, erfindet es überzeugend klingende Antworten, die komplett falsch sein können.
Reproduktion von Vorurteilen: Ein KI-Chatbot, der auf Internettexten trainiert wurde, reproduziert automatisch die dort vorhandenen gesellschaftlichen Vorurteile — von rassistischen Überzeugungen bis zu sexistischen Stereotypen.

Wer bestimmt, welche Daten zum Training verwendet werden? +

Das entscheiden die Unternehmen, die die Modelle entwickeln — OpenAI, Google, Anthropic, Meta und andere. Sie kuratieren die Datenquellen, filtern unerwünschte Inhalte und entscheiden, welche Themen überrepräsentiert werden. Transparenz ist hier ein großes Thema: Kein Unternehmen veröffentlicht seinen vollständigen Trainingsdatensatz, weil das oft urheberrechtlich und wettbewerblich heikel ist.

In Österreich und der EU wird aktuell intensiv darüber diskutiert, ob und wie Trainingsdaten urheberrechtlich geschützt sein müssen — der AI Act der EU bringt hier erste Transparenzregeln für KI-Anbieter.

Quelle: Europäische Kommission (2024). Artificial Intelligence Act. — Regelt unter anderem Transparenzpflichten für Trainingsdaten.

Kann man Trainingsdaten nachträglich verbessern? +

Ja, und das ist ein entscheidender Schritt. Nach dem großen Training durchlaufen die meisten Modelle eine Verfeinerungsphase (Fine-Tuning). Dabei wird das Modell mit kuratierten, hochwertigen Daten weitertrainiert — oft von Menschen erstellte Frage-Antwort-Paare oder nach Qualität bewertete Antworten. Dieser Schritt (Reinforcement Learning from Human Feedback, RLHF) ist maßgeblich dafür verantwortlich, dass ChatGPT brauchbare Antworten gibt statt einfach nur wahrscheinliche nächste Wörter zu produzieren.

Geschichte

Geschichte der KI in Kürze

✦

Künstliche Intelligenz ist älter als viele denken. Die ersten Ideen stammen aus den 1950er-Jahren — der Weg bis zu ChatGPT war lang und voller Überraschungen.

1950

Turing-Test

Alan Turing fragt: »Können Maschinen denken?« und schlägt einen Test vor, der diese Frage beantworten soll.

→

1966

ELIZA

Der erste Chatbot der Geschichte. Simuliert eine Psychotherapeutin, die Fragen mit Gegenfragen beantwortet — heutige Standards wirken dagegen wie Science-Fiction.

→

2012

Durchbruch Deep Learning

Ein neuronales Netz (AlexNet) gewinnt den Bilderkennungs-Wettbewerb ImageNet mit überragendem Vorsprung — der Beginn der modernen KI-Ära.

→

2022

ChatGPT

OpenAI veröffentlicht ChatGPT — innerhalb von 2 Monaten 100 Millionen Nutzer. KI wird zum ersten Mal für die breite Bevölkerung erfahrbar.

1950–1980: Die Anfänge und der erste KI-Winter +

Nach Turings grundlegender Arbeit in den 1950ern erlebte die KI-Forschung in den 1960ern und 1970ern erste Erfolge: Schachprogramme, Sprachverarbeitung und Expertensysteme entstanden. Aber die damalige Hardware war viel zu schwach, die Versprechungen zu groß — es folgte der erste KI-Winter (1974–1980), eine Zeit, in der Forschungsgelder massiv gekürzt wurden, weil die Erwartungen nicht erfüllt werden konnten.

1997: Deep Blue schlägt den Schachweltmeister +

Der IBM-Computer Deep Blue besiegte 1997 Garri Kasparow im Schach — damals eine Sensation. Allerdings war Deep Blue keine lernende KI im heutigen Sinn, sondern ein extrem schneller Rechner, der Millionen von Zugmöglichkeiten pro Sekunde durchrechnete. Es war mehr rohe Rechenleistung als echte Intelligenz, aber es zeigte der Welt, was mit Computern möglich ist.

2011–2016: Sprachassistenten, AlphaGo und die Transformer-Revolution +

2011 brachte Apple Siri auf den Markt — der erste Sprachassistent für Millionen von Menschen. 2016 schockierte AlphaGo (DeepMind/Google) die Welt, indem es den Go-Weltmeister Lee Sedol besiegte — eine jahrtausendealte asiatische Strategiespiel, das als zu komplex für KI galt.

Der eigentliche Game-Changer kam 2017: Google-Forscher veröffentlichten das Paper »Attention Is All You Need« und stellten die Transformer-Architektur vor. Diese Erfindung ist die technische Basis für alle heutigen großen Sprachmodelle — von GPT bis Claude. Ohne Transformer gäbe es ChatGPT nicht.

Quelle: Vaswani, A. et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30.

2023–2025: Die KI-Explosion +

Nach dem ChatGPT-Launch im November 2022 überschlugen sich die Ereignisse: Google brachte Gemini (früher Bard), Anthropic veröffentlichte Claude, Meta stellte Llama als Open-Source-Modell zur Verfügung. Die EU beschloss mit dem AI Act das weltweit erste umfassende KI-Gesetz. China entwickelte eigene Modelle (DeepSeek, Qwen). Open-Source-Modelle wie Llama und Mistral wurden so leistungsfähig, dass sie mit kommerziellen Anbietern konkurrieren konnten.

Seit 2024 können auch kleine Unternehmen und Privatpersonen leistungsfähige KI-Modelle auf eigener Hardware betreiben — ein Trend, der sich 2025 weiter verstärkt hat und die Abhängigkeit von den großen US-Anbietern reduziert.

💡 Der wichtigste MeilensteinDie wohl bedeutendste Entwicklung der letzten Jahre ist nicht ein einzelnes Modell, sondern die Demokratisierung der KI: Was früher nur Forscher:innen an Universitäten und Konzernen nutzen konnten, steht heute jedem Menschen mit Internetanschluss kostenlos zur Verfügung.

Fazit

Was du dir merken solltest

✦

KI ist keine Magie, sondern eine Technologie — mit Stärken, Schwächen und einem konkreten Funktionsprinzip, das jeder verstehen kann.

KI erkennt Muster in Daten — sie denkt nicht wie ein Mensch, sondern berechnet Wahrscheinlichkeiten auf Basis von Milliarden von Beispielen.
Machine Learning ist der Überbegriff, Deep Learning eine Methode darin, Generative KI eine spezielle Anwendung davon.
LLMs sind Text-Vervollständigungsmaschinen — sie sagen Wort für Wort das wahrscheinlichste nächste Token vorher.
Trainingsdaten entscheiden über die Qualität — schlechte Daten führen zu schlechten Ergebnissen (Garbage In, Garbage Out).
Die Geschichte der KI reicht bis in die 1950er — ChatGPT ist der vorläufige Höhepunkt einer jahrzehntelangen Entwicklung.
Hinterfrage KI-Antworten — besonders bei Fakten, Daten und aktuellen Ereignissen. KI halluziniert gern und überzeugend.

✅ Weiterlesen auf KIWAGDieses Kapitel ist der Einstieg. Wenn du die Grundlagen verstanden hast, schau dir die vertiefenden Artikel in der Rubrik Web & KI an — dort gehen wir auf konkrete Tools, Anwendungen und Sicherheitsaspekte ein.