Der disruptive Schock
Das chinesische KI-Modell R1 der Firma Deepseek rüttelt die US-amerikanische Hightech-Branche durch, was auch seine komische Momente hat. Open AI, der Entwickler von Chat GPT, hinter dem Microsoft steht, beschuldigte das chinesische Start-up des Datendiebstahls und der Spionage. Open AI habe sein Geschäftsmodell auf dem »Datenklau des gesamten Internets« aufgebaut, zitierte das Magazin PC Gamer den KI-Skeptiker Ed Zitron, um nun darüber zu »heulen, dass Deepseek an dem Output von Open AI trainiert« werde. Open AI habe eine »Plagiatsmaschine« entworfen, deren Plagiate zum Generieren neuer Plagiatsmaschinen benutzt würden.
Wissensdestillation nennt die Branche diesen Prozess, bei dem ein Haufen Geld und Ressourcen gespart werden kann, indem der Output eines großen Sprachmodells dazu benutzt wird, ein kleineres, günstigeres Modell zu trainieren. Die chinesische Billigkonkurrenz von Open AI hat ihr Modell angeblich für nur knapp sechs Millionen US-Dollar fertigstellt.
Platzende Monopolträume
Der US-amerikanische Vorreiter in Sachen Künstlicher Intelligenz, der das gesamtwirtschaftliche Rationalisierungspotential seiner Systeme gerne und offensiv propagiert, scheint ironischerweise selbst der Rationalisierung zum Opfer zu fallen. Bislang verschlang der Prozess des maschinellen Lernens Milliarden von Dollar; Investitionen, die in der Hoffnung getätigt wurden, dass die großen US-amerikanischen IT-Konzerne eine Art Monopol an proprietären, geschlossenen KI-Systemen bekommen, die weltweit verkauft werden sollten. Sobald die Innovationen des chinesischen Sprachmodells, das weitgehend quelloffen ist, verallgemeinert werden, werden die Monopolträume geplatzt sein.
Deepseek löste einen disruptiven Schock aus, bei dem proprietäre Software vom Open-Source-Prinzip geschlagen wird, das weitaus schnellere globale Kollaboration und Innovation ermöglicht. Die Profite der KI-Branchengiganten würden somit weitgehend ausbleiben, weil bald jeder Mittelständler seine Kunden mit ähnlich nervigen KI-Tools beglücken kann, wie es Microsoft unter Milliardeneinsatz mit seinem bereits innigst gehassten Kopilot vorexerzierte.
Die »große Innovation« von Deepseek bestehe, so die »Financial Times«, darin, den Einsatz von menschlichen Arbeitskräften bei dem korrekten »Etikettieren« von Daten zu minimieren.
Auch die Produzenten von Hardware, deren Rechenkapazitäten den KI-Boom ermöglicht hatten, mussten nach dem Deepseek-Schock herbe Kursverluste an den Aktienmärkten hinnehmen. Der Graphikkartenhersteller Nvidia hat mit seinen auf KI-Abläufe getrimmten Rechenkarten eine Goldader nicht nur entdeckt, sondern weitgehend alleine ausgebeutet und binnen zwei Jahren seinen Börsenkurs nahezu verzehnfacht – nach Deepseek ist dieser um 20 Prozent eingebrochen. Der gesamten KI-Hausse, die faktisch nur noch den US-Finanzmarkt in einem spekulativen Boom hält – der der EU ist bereits weitgehend entkoppelt –, droht das Ende. Was, wenn die Hoffnungen auf neue Märkte und Wirtschaftszweige ähnlich abrupt platzen wie die Dotcom-Blase zur Jahrtausendwende? Einer der wichtigsten Pfeiler der US-Ökonomie, die eigentlich nur noch dank der Weltwährung US-Dollar ihre Ausnahmestellung halten kann, hat durch den Marktwertverlust der großen Technologiekonzerne von rund einer Billion US-Dollar deutliche Risse erhalten.
Deswegen ist die US-Regierung – ungeachtet von Präsident Donald Trumps Floskeln über die innovationsfördernde Wirkung von Konkurrenz – unverzüglich dazu übergegangen, die Reichweite der App zu minimieren und deren Gebrauch in Behörden schlicht zu verbieten.
Das Timing der Veröffentlichung von Deepseek diente wohl auch zur Demütigung der Regierung Trumps und der großen KI-Unternehmen wie Open AI und Oracle, die wenige Tage zuvor unter dem Namen Stargate ein 500 Milliarden US-Dollar umfassendes KI-Investitionsprogramm angekündigt hatten, das nun schlicht lächerlich wirkt. Das Signal, das der chinesische Staatskapitalismus aussendet, ist eindeutig: Chinesische Effizienz schlägt die Gigantomanie der USA. China hat dabei auch die Wirkungslosigkeit der US-Sanktionen bei Hightech-Produkten demonstriert, die den Aufbau einer konkurrenzfähigen chinesischen KI-Industrie verhindern sollten – dies gerade vor dem Hintergrund des Potentials militärischer Anwendungen von KI-Systemen.
Tatsächlichen Aufwendungen in Höhe von einer Milliarde US-Dollar?
Deepseek behauptet, aus der Not eine Tugend gemacht zu haben, indem etliche Innovationen bei den Trainingsphasen der KI es ermöglichten, die Zahl der Nvidia-Chips auf 2.048 ältere Modelle zu beschränken. Inzwischen werden aber gerade diese Kostenvorteile der chinesischen Konkurrenz von einer Studie der IT-Denkfabrik Semianalysis in Zweifel gezogen. Der chinesische Hedgefonds High-Flyer, der Deepseek finanzierte, verfüge demnach über Rechenfarmen von rund 60.000 Nvidia-Karten, zudem seien auch die Aufwendungen für das hochqualifizierte Personal und die Entwicklung der neuartigen Trainingsmethoden nicht in der Kostenrechnung enthalten, so dass die tatsächlichen Aufwendungen von High-Flyer sich auf eine Milliarde US-Dollar belaufen sollen.
Selbst wenn weite Teile dieser Gegenkostenrechnung der Realität entsprechen sollten, ändert das nichts Grundlegendes. Denn Deepseek ist Open Source, seine Entwicklungskosten spielen bei der weiteren Anwendung keine Rolle. Die Prozessinnovationen, die in die Entwicklung eingeflossen sind, bleiben ja nicht unter Verschluss, sie wandeln sich in Allgemeingut – und senken damit unweigerlich den Preis der KI-basierten Dienstleistungen, die die IT-Industrie der USA monopolisieren wollte.
Die US-Konkurrenz arbeitet nun mit Hochdruck daran, Deepseeks Innovationen zu kopieren, die gerade die US-Sanktionen befördert hatten. Durch neuartige Methoden der Datenkompression konnte der Speicherverbrauch verringert und das Auftreten von Engpässen, die sich etwa aus der unzulänglichen Speicherbandbreite ergeben, minimiert werden.
Weitgehende Automatisierung der mehrstufigen Trainingsphase
Ein weiterer entscheidender Fortschritt besteht in der weitgehenden Automatisierung der mehrstufigen Trainingsphase. Die »große Innovation« von Deepseek bestehe, so die Financial Times, darin, den Einsatz von menschlichen Arbeitskräften bei dem korrekten »Etikettieren« von Daten zu minimieren. Diese in der Trainingsendphase zu Anwendung kommenden Technik, die branchenintern als reinforcement learning from human feedback (RLHF) bezeichnet wird, sei teuer und zeitaufwendig, da sie eine »kleine Armee von Datenetikettierern« benötige.
Die zumeist mit Stundenlöhnen von weniger als zwei US-Dollar abgespeisten, überwiegend in Peripherieregionen wie Lateinamerika oder Afrika rekrutierten Tagelöhner des KI-Zeitalters verbringen ihren Arbeitstag damit, digitale Daten mit Labels für die KI zu versehen. Diese Elendsjobs könnten demnächst obsolet werden, da Deepseek es vermochte, das RLHF durch eine Art digitalen Belohnungsmechanismus zu automatisieren, der bei richtigen Antworten des KI-Systems aktiviert wird.
Sobald dieser Prozess oft genug wiederholt werde, fange das große Sprachmodell an, »spontan Probleme ohne menschliche Aufsicht zu lösen«, erläuterte die Financial Times. Es sei ein »Aha-Moment« eingetreten, ab dem Deepseek anfing, Fragen abermals auszuwerten und seine Rechenzeit den unterschiedlichen Fragestellungen anzupassen, so das Finanzblatt in Anlehnung an Berichte chinesischer KI-Forschender. Es brauche keine KI-Tagelöhner mehr, sondern ein »sehr starkes prätrainiertes Modell« und eine sehr gute Infrastruktur, um »den Prozess des reinforced learning in großem Maßstab« auszuführen.
Die KI frisst auch ihre Elendskinder. Doch den Lohnabhängigen in der Peripherie des spätkapitalistischen Weltsystems dürften bald Millionen Angestellte in den Zentren in die Überflüssigkeit folgen.
Die KI frisst auch ihre Elendskinder. Doch den Lohnabhängigen in der Peripherie des spätkapitalistischen Weltsystems dürften bald Millionen Angestellte in den Zentren in die Überflüssigkeit folgen. Die KI dürfte zwar die Gesellschaften der Zentren ähnlich radikal umwälzen wie das Internet und die erste Phase der Digitalisierung, doch wird sie wohl ebenfalls keinen langfristigen Wirtschaftsboom im Sinne eines neuen Akkumulationsregimes hervorbringen, der massenhaft Arbeitskraft im Produktionsprozess des Kapitals verwerten würde.
Die Entsubstantialisierung des Kapitals, die Verdrängung der Lohnarbeit aus der Warenproduktion und dem Dienstleistungssektor, wird weiter voranschreiten. Deswegen sind die Ängste vor einem Nachfrageeinbruch bei KI-Chips unbegründet, zumindest Nvidia wird sich wohl weiterhin über große Nachfrage freuen können. Überall dort, wo »heute noch routinierte Menschen um die Wette auf die immer selben Knöpfe drücken«, so die FAZ, werde sich der marktvermittelte Rationalisierungsdruck zuerst durchsetzen.