KI-Grundlagen — Was ist Künstliche Intelligenz?

Definition

Was ist Künstliche Intelligenz?

Künstliche Intelligenz (KI) ist eines der meistgenutzten Schlagworte unserer Zeit — aber was bedeutet es eigentlich? Eine klare Definition hilft, das Rauschen auszusortieren.

Künstliche Intelligenz bezeichnet Computerprogramme oder Systeme, die Aufgaben ausführen, die normalerweise menschliche Intelligenz erfordern würden: Sprache verstehen, Bilder erkennen, Entscheidungen treffen oder Texte schreiben.

📱

Gesichtserkennung

Dein Smartphone entsperrt sich, weil es dein Gesicht erkennt — das ist KI, die täglich Millionen Mal abläuft.

📨

Spam-Filter

Dein E-Mail-Postfach sortiert Werbung und Phishing-Versuche automatisch aus — seit Jahren eine der erfolgreichsten KI-Anwendungen.

💬

Chat-Assistenten

ChatGPT, Claude oder Gemini beantworten Fragen, schreiben Texte und helfen beim Programmieren — die bekannteste Form moderner KI.

💡 Wichtig zu verstehen: KI denkt nicht wie ein Mensch und hat kein Bewusstsein. Sie erkennt Muster in riesigen Datenmengen und trifft auf Basis dieser Muster Entscheidungen oder generiert Antworten. Das ist extrem nützlich, aber kein menschliches Denken.

Der Begriff KI wird oft als Sammelbegriff verwendet und umfasst mehrere Teilbereiche. Die wichtigsten Unterschiede zeigen wir im nächsten Abschnitt.

Quelle: Russell, S. & Norvig, P. (2021). Artificial Intelligence: A Modern Approach. Pearson.

Begriffe

Machine Learning, Deep Learning & Generative KI

Die Begriffe werden oft durcheinandergeworfen. Dabei lassen sie sich ganz einfach voneinander abgrenzen — wie russische Puppen, die ineinanderstecken.

🧠 Machine Learning (ML)

Der übergeordnete Bereich: Ein Programm lernt aus Daten, statt für jede Aufgabe explizit programmiert zu werden.

Beispiel: Ein ML-Modell lernt aus tausenden E-Mails, welche Spam sind und welche nicht — ohne dass ein Mensch jede Spam-Regel von Hand schreibt.

💡 Deep Learning

Eine spezielle Methode innerhalb von ML — mit künstlichen neuronalen Netzen, die grob am menschlichen Gehirn orientiert sind.

Beispiel: Ein Deep-Learning-Modell erkennt auf Fotos, ob eine Katze oder ein Hund zu sehen ist — auch wenn das Bild unscharf ist oder die Katze nur halb zu sehen ist.

✨ Generative KI

Der aktuell bekannteste Zweig: KI-Systeme, die neue Inhalte erstellen — Texte, Bilder, Musik, Videos oder Code. Sie lernen nicht nur, Muster zu erkennen, sondern selbst ähnliche Inhalte zu produzieren.

Text: ChatGPT, Claude, Gemini — schreiben Aufsätze, E-Mails, Gedichte oder Programmiercode
Bilder: Midjourney, DALL-E, Stable Diffusion — erzeugen Grafiken aus Textbeschreibungen
Musik: Suno, Udio — komponieren Lieder mit Text und Melodie
Video: Runway, Sora — generieren kurze Videoclips aus Text

✅ Merkregel: Machine Learning ist der Oberbegriff. Deep Learning ist eine Methode darin. Generative KI ist eine Anwendung von Deep Learning, die Neues erschafft statt nur zu analysieren. Jede generative KI ist Deep Learning, aber nicht jedes Deep Learning ist generativ.

Ein normales Programm folgt festen Regeln, die ein Mensch geschrieben hat. Wenn du einem Taschenrechner »5 + 3« eingibst, hat ein Programmierer die Additionslogik von Hand codiert.

Ein KI-System lernt die Regeln selbst aus Beispielen. Wenn du ChatGPT »Schreib mir eine E-Mail an meinen Chef« sagst, hat niemand explizit programmiert, wie eine gute E-Mail aussehen muss. Das Modell hat es aus Millionen Beispiel-E-Mails gelernt.

Deshalb kann KI auch Dinge, die sich nicht einfach in feste Regeln fassen lassen — wie Gesichter erkennen, Sprache verstehen oder kreative Texte schreiben.

Nicht zwingend. Es gibt KI-Methoden (wie Few-Shot- oder Transfer-Learning), die mit sehr wenigen Beispielen auskommen, weil sie auf bestehendem Wissen aufbauen. Aber die großen, leistungsfähigen Modelle wie GPT-4 oder Claude wurden tatsächlich mit Milliarden von Textpassagen trainiert — das ist ein zentraler Grund für ihre beeindruckenden Fähigkeiten.

Technik

Wie funktionieren Large Language Models?

Large Language Models (LLMs) wie GPT-4, Claude oder Gemini sind der Motor hinter modernen KI-Assistenten. Aber wie genau arbeiten sie — und was passiert da eigentlich technisch?

💡 Das Grundprinzip: Nächstes Wort vorhersagen

LLMs sind im Kern extrem ausgeklügelte Text-Vervollständigungsmaschinen. Das klingt fast zu einfach, ist aber die zentrale Idee:

Du gibst einen Text ein: »Die Hauptstadt von Österreich ist«
Das Modell berechnet, welches Wort am wahrscheinlichsten als Nächstes kommt: »Wien«
Dann berechnet es das nächste Wort nach »Wien« — und so weiter, Wort für Wort
Aus dieser simplen Mechanik entstehen ganze Aufsätze, Gedichte, E-Mails oder Programmiercode

💡 Veranschaulichung: Stell dir vor, du tippst auf dem Handy »Ich freue mich auf« und die Autovervollständigung schlägt »morgen« vor. Ein LLM macht exakt das Gleiche — aber mit einem riesigen Kontextverständnis und einem Vokabular von Millionen von Wörtern und Konzepten.

📊 Training auf riesigen Textmengen

Damit ein LLM sinnvolle Vorschläge machen kann, muss es trainiert werden — und zwar mit enormen Mengen an Text:

Bücher (Belletristik, Sachbücher, wissenschaftliche Texte)
Webseiten (Wikipedia, Nachrichtenartikel, Blogs, Foren)
Wissenschaftliche Publikationen und Paper
Programmiercode (GitHub & ähnliche Quellen)
Social Media Beiträge und Diskussionen

Während des Trainings passiert Folgendes: Das Modell bekommt Milliarden von Textausschnitten und muss immer wieder das nächste Wort vorhersagen. Bei jeder falschen Vorhersage passt es seine internen Berechnungen minimal an — so lange, bis die Vorhersagen immer besser werden.

⚠️ Was dabei schieflaufen kann: Weil LLMs auf dem gesamten Internet trainieren, lernen sie auch dessen Schattenseiten: Vorurteile, Falschinformationen und problematische Inhalte. Ein Großteil der Arbeit nach dem Training besteht darin, diese unerwünschten Muster zu korrigieren — das nennt sich Alignment oder Fine-Tuning.

⚙️ Was sind Parameter?

Wenn von LLMs die Rede ist, fallen immer wieder Zahlen wie 175 Milliarden Parameter (GPT-3) oder 1,8 Billionen Parameter (GPT-4). Aber was bedeutet das? Parameter sind die inneren Stellschrauben des Modells — vergleichbar mit den Verbindungen zwischen Neuronen im menschlichen Gehirn. Jeder Parameter speichert eine winzige Gewichtung, die beeinflusst, wie das Modell auf bestimmte Eingaben reagiert.

🔢

7 Mrd. Parameter

Mistral 7B, Llama 2 7B — klein, laufen auf Mittelklasse-Hardware, erstaunlich fähig für die Größe.

📈

70–175 Mrd. Parameter

GPT-3, Claude Sonnet, Llama 2 70B — die aktuelle Oberklasse für anspruchsvolle Aufgaben.

💠

> 1 Billion Parameter

GPT-4, Claude Opus — extrem leistungsfähig, aber nur mit Rechenzentrums-Infrastruktur betreibbar.

Faustregel: Mehr Parameter bedeuten mehr Wissen und bessere Fähigkeiten — aber auch höhere Kosten und längere Antwortzeiten.

🧬 Der Kontext: Das Kurzzeitgedächtnis des LLMs

Jedes LLM hat eine Kontextfenster-Grenze — so viele Zeichen (Tokens) kann es auf einmal verarbeiten und merken. Ältere Modelle kamen auf 2.000–8.000 Tokens (ca. 1.500–6.000 Wörter). Aktuelle Modelle wie Claude schaffen bis zu 200.000 Tokens — das entspricht etwa 500 Seiten Text oder einem ganzen dicken Roman.

✅ Beispiel: Du kannst Claude den gesamten Text eines Buches geben und dann eine Zusammenfassung verlangen. Das Modell kann zurückblättern, Zitate finden und Zusammenhänge über Kapitel hinweg erkennen — so wie ein Mensch, der das Buch gelesen hat.

Daten

Was sind Trainingsdaten und warum sind sie wichtig?

Ein KI-Modell ist nur so gut wie die Daten, mit denen es trainiert wurde. Das klingt banal, ist aber eine der wichtigsten und am häufigsten übersehenen Wahrheiten über KI.

Trainingsdaten sind die Beispiele, anhand derer ein KI-Modell lernt. Stell dir vor, du möchtest jemandem beibringen, Hunde von Katzen zu unterscheiden. Du würdest viele Bilder zeigen und sagen: »Das ist ein Hund« oder »Das ist eine Katze«. Genau so funktioniert KI-Training — nur im gigantischen Maßstab.

⚠️ Garbage In, Garbage Out: Der wichtigste Grundsatz im Machine Learning: Wenn die Trainingsdaten fehlerhaft, einseitig oder unvollständig sind, wird das KI-Modell ebenfalls fehlerhaft, einseitig oder unvollständig sein. Keine noch so gute Technik kann schlechte Daten reparieren.

Welche Probleme können durch schlechte Trainingsdaten entstehen?

Verzerrungen (Bias): Wenn eine Bewerbungs-KI hauptsächlich mit Daten von männlichen Führungskräften trainiert wurde, lernt sie fälschlicherweise, dass Frauen weniger für Führungspositionen geeignet sind — so geschehen bei einem bekannten Amazon-Recruiting-Tool (Quelle: Reuters, 2018).
Halluzinationen: Wenn die Trainingsdaten unvollständig sind oder das Modell zu wenig Beispiele für ein Thema hat, erfindet es überzeugend klingende Antworten, die komplett falsch sein können.
Reproduktion von Vorurteilen: Ein KI-Chatbot, der auf Internettexten trainiert wurde, reproduziert automatisch die dort vorhandenen gesellschaftlichen Vorurteile.

Das entscheiden die Unternehmen, die die Modelle entwickeln — OpenAI, Google, Anthropic, Meta und andere. Sie kuratieren die Datenquellen, filtern unerwünschte Inhalte und entscheiden, welche Themen überrepräsentiert werden. Transparenz ist hier ein großes Thema: Kein Unternehmen veröffentlicht seinen vollständigen Trainingsdatensatz.

In Österreich und der EU wird aktuell intensiv darüber diskutiert, ob und wie Trainingsdaten urheberrechtlich geschützt sein müssen — der AI Act der EU bringt hier erste Transparenzregeln für KI-Anbieter.

Quelle: Europäische Kommission (2024). Artificial Intelligence Act.

Ja, und das ist ein entscheidender Schritt. Nach dem großen Training durchlaufen die meisten Modelle eine Verfeinerungsphase (Fine-Tuning). Dabei wird das Modell mit kuratierten, hochwertigen Daten weitertrainiert — oft von Menschen erstellte Frage-Antwort-Paare oder nach Qualität bewertete Antworten. Dieser Schritt (Reinforcement Learning from Human Feedback, RLHF) ist maßgeblich dafür verantwortlich, dass ChatGPT brauchbare Antworten gibt statt einfach nur wahrscheinliche nächste Wörter zu produzieren.

Geschichte

Geschichte der KI in Kürze

Künstliche Intelligenz ist älter als viele denken. Die ersten Ideen stammen aus den 1950er-Jahren — der Weg bis zu ChatGPT war lang und voller Überraschungen.

1950

Turing-Test

Alan Turing fragt: »Können Maschinen denken?« und schlägt einen Test vor, der diese Frage beantworten soll.

1966

ELIZA

Der erste Chatbot der Geschichte. Simuliert eine Psychotherapeutin, die Fragen mit Gegenfragen beantwortet.

2012

Deep Learning-Durchbruch

Ein neuronales Netz (AlexNet) gewinnt den Bilderkennungs-Wettbewerb ImageNet mit überragendem Vorsprung.

2022

ChatGPT

OpenAI veröffentlicht ChatGPT — innerhalb von 2 Monaten 100 Millionen Nutzer. KI wird für die breite Bevölkerung erfahrbar.

Nach Turings grundlegender Arbeit in den 1950ern erlebte die KI-Forschung in den 1960ern und 1970ern erste Erfolge: Schachprogramme, Sprachverarbeitung und Expertensysteme entstanden. Aber die damalige Hardware war viel zu schwach, die Versprechungen zu groß — es folgte der erste KI-Winter (1974–1980), eine Zeit, in der Forschungsgelder massiv gekürzt wurden, weil die Erwartungen nicht erfüllt werden konnten.

Der IBM-Computer Deep Blue besiegte 1997 Garri Kasparow im Schach — damals eine Sensation. Allerdings war Deep Blue keine lernende KI im heutigen Sinn, sondern ein extrem schneller Rechner, der Millionen von Zugmöglichkeiten pro Sekunde durchrechnete. Es war mehr rohe Rechenleistung als echte Intelligenz, aber es zeigte der Welt, was mit Computern möglich ist.

2011 brachte Apple Siri auf den Markt — der erste Sprachassistent für Millionen von Menschen. 2016 schockierte AlphaGo (DeepMind/Google) die Welt, indem es den Go-Weltmeister Lee Sedol besiegte — ein jahrtausendealtes asiatisches Strategiespiel, das als zu komplex für KI galt.

Der eigentliche Game-Changer kam 2017: Google-Forscher veröffentlichten das Paper »Attention Is All You Need« und stellten die Transformer-Architektur vor. Diese Erfindung ist die technische Basis für alle heutigen großen Sprachmodelle — von GPT bis Claude. Ohne Transformer gäbe es ChatGPT nicht.

Quelle: Vaswani, A. et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30.

Nach dem ChatGPT-Launch im November 2022 überschlugen sich die Ereignisse: Google brachte Gemini, Anthropic veröffentlichte Claude, Meta stellte Llama als Open-Source-Modell zur Verfügung. Die EU beschloss mit dem AI Act das weltweit erste umfassende KI-Gesetz. China entwickelte eigene Modelle (DeepSeek, Qwen).

Seit 2024 können auch kleine Unternehmen und Privatpersonen leistungsfähige KI-Modelle auf eigener Hardware betreiben — ein Trend, der die Abhängigkeit von den großen US-Anbietern reduziert.

💡 Der wichtigste Meilenstein: Die wohl bedeutendste Entwicklung der letzten Jahre ist nicht ein einzelnes Modell, sondern die Demokratisierung der KI: Was früher nur Forscher:innen an Universitäten und Konzernen nutzen konnten, steht heute jedem Menschen mit Internetanschluss kostenlos zur Verfügung.

Fazit

Was du dir merken solltest

KI ist keine Magie, sondern eine Technologie — mit Stärken, Schwächen und einem konkreten Funktionsprinzip, das jeder verstehen kann.

🧠 Mustererkennung

KI erkennt Muster in Daten — sie denkt nicht wie ein Mensch, sondern berechnet Wahrscheinlichkeiten auf Basis von Milliarden von Beispielen.

📊 ML vs. DL vs. GenAI

Machine Learning ist der Überbegriff, Deep Learning eine Methode darin, Generative KI eine spezielle Anwendung davon.

🔤 LLMs sind Textmaschinen

LLMs sind Text-Vervollständigungsmaschinen — sie sagen Wort für Wort das wahrscheinlichste nächste Token vorher.

📚 Datenqualität entscheidet

Trainingsdaten entscheiden über die Qualität — schlechte Daten führen zu schlechten Ergebnissen (Garbage In, Garbage Out).

📅 Lange Geschichte

Die Geschichte der KI reicht bis in die 1950er — ChatGPT ist der vorläufige Höhepunkt einer jahrzehntelangen Entwicklung.

🔍 Immer hinterfragen

Hinterfrage KI-Antworten — besonders bei Fakten, Daten und aktuellen Ereignissen. KI halluziniert gern und überzeugend.

✅ Weiterlesen auf KIWAG: Dieses Kapitel ist der Einstieg. Wenn du die Grundlagen verstanden hast, schau dir die vertiefenden Artikel in der Rubrik Web & KI an — dort gehen wir auf konkrete Tools, Anwendungen und Sicherheitsaspekte ein.

Künstliche Intelligenz einfach erklärt.

KIWAG-Prinzip

Was ist Künstliche Intelligenz?

Gesichtserkennung

Spam-Filter

Chat-Assistenten

Machine Learning, Deep Learning & Generative KI

🧠 Machine Learning (ML)

💡 Deep Learning

✨ Generative KI

Wie funktionieren Large Language Models?

💡 Das Grundprinzip: Nächstes Wort vorhersagen

📊 Training auf riesigen Textmengen

⚙️ Was sind Parameter?

7 Mrd. Parameter

70–175 Mrd. Parameter

> 1 Billion Parameter

🧬 Der Kontext: Das Kurzzeitgedächtnis des LLMs

Was sind Trainingsdaten und warum sind sie wichtig?

Welche Probleme können durch schlechte Trainingsdaten entstehen?

Geschichte der KI in Kürze

Turing-Test

ELIZA

Deep Learning-Durchbruch

ChatGPT

Was du dir merken solltest

🧠 Mustererkennung

📊 ML vs. DL vs. GenAI

🔤 LLMs sind Textmaschinen

📚 Datenqualität entscheidet

📅 Lange Geschichte

🔍 Immer hinterfragen