Was steckt wirklich hinter ChatGPT, Machine Learning und Co? Hier erfährst du die Grundlagen — ohne Fachchinesisch, mit echten Beispielen.
Sachlich erklären, Risiken nennen, Quellen prüfen und keine falschen Versprechen machen.
Künstliche Intelligenz (KI) ist eines der meistgenutzten Schlagworte unserer Zeit — aber was bedeutet es eigentlich? Eine klare Definition hilft, das Rauschen auszusortieren.
Künstliche Intelligenz bezeichnet Computerprogramme oder Systeme, die Aufgaben ausführen, die normalerweise menschliche Intelligenz erfordern würden: Sprache verstehen, Bilder erkennen, Entscheidungen treffen oder Texte schreiben.
Dein Smartphone entsperrt sich, weil es dein Gesicht erkennt — das ist KI, die täglich Millionen Mal abläuft.
Dein E-Mail-Postfach sortiert Werbung und Phishing-Versuche automatisch aus — seit Jahren eine der erfolgreichsten KI-Anwendungen.
ChatGPT, Claude oder Gemini beantworten Fragen, schreiben Texte und helfen beim Programmieren — die bekannteste Form moderner KI.
Der Begriff KI wird oft als Sammelbegriff verwendet und umfasst mehrere Teilbereiche. Die wichtigsten Unterschiede zeigen wir im nächsten Abschnitt.
Quelle: Russell, S. & Norvig, P. (2021). Artificial Intelligence: A Modern Approach. Pearson.
Die Begriffe werden oft durcheinandergeworfen. Dabei lassen sie sich ganz einfach voneinander abgrenzen — wie russische Puppen, die ineinanderstecken.
Der übergeordnete Bereich: Ein Programm lernt aus Daten, statt für jede Aufgabe explizit programmiert zu werden.
Beispiel: Ein ML-Modell lernt aus tausenden E-Mails, welche Spam sind und welche nicht — ohne dass ein Mensch jede Spam-Regel von Hand schreibt.
Eine spezielle Methode innerhalb von ML — mit künstlichen neuronalen Netzen, die grob am menschlichen Gehirn orientiert sind.
Beispiel: Ein Deep-Learning-Modell erkennt auf Fotos, ob eine Katze oder ein Hund zu sehen ist — auch wenn das Bild unscharf ist oder die Katze nur halb zu sehen ist.
Der aktuell bekannteste Zweig: KI-Systeme, die neue Inhalte erstellen — Texte, Bilder, Musik, Videos oder Code. Sie lernen nicht nur, Muster zu erkennen, sondern selbst ähnliche Inhalte zu produzieren.
Ein normales Programm folgt festen Regeln, die ein Mensch geschrieben hat. Wenn du einem Taschenrechner »5 + 3« eingibst, hat ein Programmierer die Additionslogik von Hand codiert.
Ein KI-System lernt die Regeln selbst aus Beispielen. Wenn du ChatGPT »Schreib mir eine E-Mail an meinen Chef« sagst, hat niemand explizit programmiert, wie eine gute E-Mail aussehen muss. Das Modell hat es aus Millionen Beispiel-E-Mails gelernt.
Deshalb kann KI auch Dinge, die sich nicht einfach in feste Regeln fassen lassen — wie Gesichter erkennen, Sprache verstehen oder kreative Texte schreiben.
Nicht zwingend. Es gibt KI-Methoden (wie Few-Shot- oder Transfer-Learning), die mit sehr wenigen Beispielen auskommen, weil sie auf bestehendem Wissen aufbauen. Aber die großen, leistungsfähigen Modelle wie GPT-4 oder Claude wurden tatsächlich mit Milliarden von Textpassagen trainiert — das ist ein zentraler Grund für ihre beeindruckenden Fähigkeiten.
Large Language Models (LLMs) wie GPT-4, Claude oder Gemini sind der Motor hinter modernen KI-Assistenten. Aber wie genau arbeiten sie — und was passiert da eigentlich technisch?
LLMs sind im Kern extrem ausgeklügelte Text-Vervollständigungsmaschinen. Das klingt fast zu einfach, ist aber die zentrale Idee:
Damit ein LLM sinnvolle Vorschläge machen kann, muss es trainiert werden — und zwar mit enormen Mengen an Text:
Während des Trainings passiert Folgendes: Das Modell bekommt Milliarden von Textausschnitten und muss immer wieder das nächste Wort vorhersagen. Bei jeder falschen Vorhersage passt es seine internen Berechnungen minimal an — so lange, bis die Vorhersagen immer besser werden.
Wenn von LLMs die Rede ist, fallen immer wieder Zahlen wie 175 Milliarden Parameter (GPT-3) oder 1,8 Billionen Parameter (GPT-4). Aber was bedeutet das? Parameter sind die inneren Stellschrauben des Modells — vergleichbar mit den Verbindungen zwischen Neuronen im menschlichen Gehirn. Jeder Parameter speichert eine winzige Gewichtung, die beeinflusst, wie das Modell auf bestimmte Eingaben reagiert.
Mistral 7B, Llama 2 7B — klein, laufen auf Mittelklasse-Hardware, erstaunlich fähig für die Größe.
GPT-3, Claude Sonnet, Llama 2 70B — die aktuelle Oberklasse für anspruchsvolle Aufgaben.
GPT-4, Claude Opus — extrem leistungsfähig, aber nur mit Rechenzentrums-Infrastruktur betreibbar.
Faustregel: Mehr Parameter bedeuten mehr Wissen und bessere Fähigkeiten — aber auch höhere Kosten und längere Antwortzeiten.
Jedes LLM hat eine Kontextfenster-Grenze — so viele Zeichen (Tokens) kann es auf einmal verarbeiten und merken. Ältere Modelle kamen auf 2.000–8.000 Tokens (ca. 1.500–6.000 Wörter). Aktuelle Modelle wie Claude schaffen bis zu 200.000 Tokens — das entspricht etwa 500 Seiten Text oder einem ganzen dicken Roman.
Ein KI-Modell ist nur so gut wie die Daten, mit denen es trainiert wurde. Das klingt banal, ist aber eine der wichtigsten und am häufigsten übersehenen Wahrheiten über KI.
Trainingsdaten sind die Beispiele, anhand derer ein KI-Modell lernt. Stell dir vor, du möchtest jemandem beibringen, Hunde von Katzen zu unterscheiden. Du würdest viele Bilder zeigen und sagen: »Das ist ein Hund« oder »Das ist eine Katze«. Genau so funktioniert KI-Training — nur im gigantischen Maßstab.
Das entscheiden die Unternehmen, die die Modelle entwickeln — OpenAI, Google, Anthropic, Meta und andere. Sie kuratieren die Datenquellen, filtern unerwünschte Inhalte und entscheiden, welche Themen überrepräsentiert werden. Transparenz ist hier ein großes Thema: Kein Unternehmen veröffentlicht seinen vollständigen Trainingsdatensatz.
In Österreich und der EU wird aktuell intensiv darüber diskutiert, ob und wie Trainingsdaten urheberrechtlich geschützt sein müssen — der AI Act der EU bringt hier erste Transparenzregeln für KI-Anbieter.
Quelle: Europäische Kommission (2024). Artificial Intelligence Act.
Ja, und das ist ein entscheidender Schritt. Nach dem großen Training durchlaufen die meisten Modelle eine Verfeinerungsphase (Fine-Tuning). Dabei wird das Modell mit kuratierten, hochwertigen Daten weitertrainiert — oft von Menschen erstellte Frage-Antwort-Paare oder nach Qualität bewertete Antworten. Dieser Schritt (Reinforcement Learning from Human Feedback, RLHF) ist maßgeblich dafür verantwortlich, dass ChatGPT brauchbare Antworten gibt statt einfach nur wahrscheinliche nächste Wörter zu produzieren.
Künstliche Intelligenz ist älter als viele denken. Die ersten Ideen stammen aus den 1950er-Jahren — der Weg bis zu ChatGPT war lang und voller Überraschungen.
Alan Turing fragt: »Können Maschinen denken?« und schlägt einen Test vor, der diese Frage beantworten soll.
Der erste Chatbot der Geschichte. Simuliert eine Psychotherapeutin, die Fragen mit Gegenfragen beantwortet.
Ein neuronales Netz (AlexNet) gewinnt den Bilderkennungs-Wettbewerb ImageNet mit überragendem Vorsprung.
OpenAI veröffentlicht ChatGPT — innerhalb von 2 Monaten 100 Millionen Nutzer. KI wird für die breite Bevölkerung erfahrbar.
Nach Turings grundlegender Arbeit in den 1950ern erlebte die KI-Forschung in den 1960ern und 1970ern erste Erfolge: Schachprogramme, Sprachverarbeitung und Expertensysteme entstanden. Aber die damalige Hardware war viel zu schwach, die Versprechungen zu groß — es folgte der erste KI-Winter (1974–1980), eine Zeit, in der Forschungsgelder massiv gekürzt wurden, weil die Erwartungen nicht erfüllt werden konnten.
Der IBM-Computer Deep Blue besiegte 1997 Garri Kasparow im Schach — damals eine Sensation. Allerdings war Deep Blue keine lernende KI im heutigen Sinn, sondern ein extrem schneller Rechner, der Millionen von Zugmöglichkeiten pro Sekunde durchrechnete. Es war mehr rohe Rechenleistung als echte Intelligenz, aber es zeigte der Welt, was mit Computern möglich ist.
2011 brachte Apple Siri auf den Markt — der erste Sprachassistent für Millionen von Menschen. 2016 schockierte AlphaGo (DeepMind/Google) die Welt, indem es den Go-Weltmeister Lee Sedol besiegte — ein jahrtausendealtes asiatisches Strategiespiel, das als zu komplex für KI galt.
Der eigentliche Game-Changer kam 2017: Google-Forscher veröffentlichten das Paper »Attention Is All You Need« und stellten die Transformer-Architektur vor. Diese Erfindung ist die technische Basis für alle heutigen großen Sprachmodelle — von GPT bis Claude. Ohne Transformer gäbe es ChatGPT nicht.
Quelle: Vaswani, A. et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30.
Nach dem ChatGPT-Launch im November 2022 überschlugen sich die Ereignisse: Google brachte Gemini, Anthropic veröffentlichte Claude, Meta stellte Llama als Open-Source-Modell zur Verfügung. Die EU beschloss mit dem AI Act das weltweit erste umfassende KI-Gesetz. China entwickelte eigene Modelle (DeepSeek, Qwen).
Seit 2024 können auch kleine Unternehmen und Privatpersonen leistungsfähige KI-Modelle auf eigener Hardware betreiben — ein Trend, der die Abhängigkeit von den großen US-Anbietern reduziert.
KI ist keine Magie, sondern eine Technologie — mit Stärken, Schwächen und einem konkreten Funktionsprinzip, das jeder verstehen kann.
KI erkennt Muster in Daten — sie denkt nicht wie ein Mensch, sondern berechnet Wahrscheinlichkeiten auf Basis von Milliarden von Beispielen.
Machine Learning ist der Überbegriff, Deep Learning eine Methode darin, Generative KI eine spezielle Anwendung davon.
LLMs sind Text-Vervollständigungsmaschinen — sie sagen Wort für Wort das wahrscheinlichste nächste Token vorher.
Trainingsdaten entscheiden über die Qualität — schlechte Daten führen zu schlechten Ergebnissen (Garbage In, Garbage Out).
Die Geschichte der KI reicht bis in die 1950er — ChatGPT ist der vorläufige Höhepunkt einer jahrzehntelangen Entwicklung.
Hinterfrage KI-Antworten — besonders bei Fakten, Daten und aktuellen Ereignissen. KI halluziniert gern und überzeugend.