Diese Entdeckung kommt zur richtigen Zeit: KI könnte deutlich weniger Energie verbrauchen

Zwischen Klimazielen und digitalem Ehrgeiz

Ein wachsendes Spannungsfeld tut sich auf: Während Technologiekonzerne massenhaft neue Rechenzentren errichten, arbeiten Forscher im Verborgenen daran, KI gleichzeitig leistungsfähiger und energiesparender zu gestalten. Ein aktueller Durchbruch rund um sogenannte Memristoren und eine neuartige Trainingsmethode könnte den Energieverbrauch tiefer neuronaler Netze drastisch senken.

Warum KI so viel Strom frisst

Moderne KI-Modelle laufen in der Regel auf riesigen GPU-Clustern in energieintensiven Rechenzentren. Jede Verbesserung der Genauigkeit erfordert zusätzliche Schichten, mehr Parameter und damit mehr Rechenarbeit. Besonders das Training großer Modelle verschlingt gewaltige Mengen an Elektrizität.

Bei klassischen Computern wandern Daten ständig zwischen Speicher und Prozessor hin und her. Dieser Datentransport verbraucht viel Energie und erzeugt Wärme. KI verschärft dieses Problem, weil neuronale Netze bei jedem Schritt Millionen bis Milliarden von Gewichten abrufen und anpassen müssen.

Neue KI-Modelle liefern beeindruckende Leistungen, doch ihr Energiehunger droht sowohl Innovation als auch Klimapolitik auszubremsen.

Forscher suchen deshalb nach neuen Hardwarekonzepten, bei denen der Speicher näher am Rechenprozess selbst angesiedelt ist — damit Daten weniger transportiert werden müssen. Genau hier kommen Memristoren ins Spiel.

Was Memristoren anders machen

Memristoren sind elektronische Bauteile, die sich wie Widerstände mit Gedächtnis verhalten. Ihre Leitfähigkeit hängt von der elektrischen Vorgeschichte ab: Was zuvor geschrieben wurde, beeinflusst den aktuellen Zustand. Das macht sie geeignet, die Gewichte eines neuronalen Netzes direkt in der Hardware zu speichern.

In einer Memristoren-Matrix finden Berechnungen lokal statt. Die physikalischen Eigenschaften des Materials führen die mathematischen Operationen aus — anstelle einer Abfolge von Befehlen auf einem herkömmlichen Prozessor. Das spart Datentransport und kann prinzipiell erheblich weniger Energie kosten.

Es gibt jedoch einen entscheidenden Haken: Memristoren sind nicht perfekt. Sie zeigen Rauschen, Schwankungen zwischen einzelnen Bauteilen und ungenaue Schreibvorgänge. Bei klassischen Trainingsalgorithmen führt das zu instabilen Modellen und schlechteren Ergebnissen.

Die Hardware ist energieeffizient, aber ihre Unvollkommenheit zerstört die Genauigkeit — es sei denn, der Trainingsprozess passt sich ihr an.

Ein cleverer Trick: eaPU macht Fehler nutzbar

Was steckt genau hinter eaPU?

Ein Forschungsteam des Zhejiang-Laboratoriums in China stellte in Nature Communications einen neuen Trainingsansatz vor: error-aware probabilistic update, kurz eaPU. Der Kern des Ansatzes: Der Algorithmus akzeptiert kleine Fehler und vermeidet unnötige Anpassungen in den Memristoren.

Anstatt bei jedem Mini-Batch alle Gewichte zu aktualisieren — wie es bei der Standard-Backpropagation üblich ist — aktualisiert das Netzwerk mit eaPU weniger als 0,1 Prozent der Parameter pro Schritt. Nur wenn eine Änderung einen Schwellenwert überschreitet, folgt ein physischer Schreibvorgang im Memristor.

  • Kleine Variationen bleiben ungeschrieben: Das Modell toleriert Mikrofehler.
  • Große Abweichungen erhalten Vorrang: Nur bedeutsame Updates kosten Energie.
  • Die Wahrscheinlichkeit eines Updates hängt von der Fehlergröße und den Eigenschaften des Memristors ab.

Da das Schreiben auf einen Memristor deutlich mehr Energie erfordert als das Lesen, bringt diese Selektion enorme Einsparungen. Weniger Schreibzyklen bedeuten zudem weniger Materialverschleiß.

Zahlen, die aufhorchen lassen

Aspekt Konventionelles Memristoren-Training Mit eaPU
Anteil aktualisierter Gewichte pro Schritt Großer Teil der Parameter < 0,1 % der Parameter
Energieverbrauch beim Training (vs. andere Memristoren-Methoden) Referenzwert Bis zu 50× geringer
Lebensdauer der Bauteile Begrenzt durch Schreibverschleiß Bis zu 1.000× länger
Genauigkeit Deutlich geringer als bei digitalen Supercomputern +60 % gegenüber anderen Memristoren-Ansätzen, vergleichbar mit Supercomputern
Vergleich mit GPU-Systemen Energieintensiv Rund eine Million Mal weniger Energie

Nach Angaben der Forscher sinkt der Energieverbrauch im Vergleich zu GPU-basierten Systemen um etwa sechs Größenordnungen — eine Reduktion um den Faktor eine Million.

Damit rückt ein Szenario in greifbare Nähe, in dem KI-Training nicht mehr ausschließlich von Megadatenzentren mit gewaltigen Kühlsystemen abhängt, sondern auch auf kompakter, spezialisierter Hardware möglich wird.

Von der Bildverarbeitung zu Sprachmodellen?

Das Team testete eaPU auf einer Memristoren-Matrix mit 180 Nanometer Strukturgröße. Dabei trainierten sie neuronale Netze zur Bildrauschunterdrückung und Superauflösung. Die Ergebnisse lagen nahe an konventionellen digitalen Methoden, während der Energieverbrauch deutlich niedriger blieb.

Die verwendete Chipgröße und Architektur sind bescheiden im Vergleich zur Infrastruktur großer Sprachmodelle. Dennoch sehen die Forscher kein grundlegendes Hindernis, den Ansatz auf LLMs auszuweiten.

Interessante Artikel:

Sie gehen davon aus, dass das Prinzip probabilistischer Updates auf Netze mit Milliarden von Parametern übertragbar ist — vorausgesetzt, die Hardware wächst in Skalierbarkeit und Zuverlässigkeit mit. In Folgeprojekten wollen sie direkt testen, wie sich eaPU bei mehrschichtigen Transformer-Architekturen verhält, dem Rückgrat moderner Sprachmodelle.

Nicht nur für Memristoren geeignet

Bemerkenswert ist, dass die Methode nicht streng an Memristoren gebunden ist. Das Konzept des fehlertoleranten probabilistischen Updates lässt sich auch auf andere In-Memory-Computing-Technologien anwenden, darunter:

  • Ferroelektrische Transistoren
  • Magnetoresistiver Arbeitsspeicher (MRAM)
  • Hybridarchitekturen mit analogen und digitalen Blöcken

Das erhöht die Chancen, dass Industriepartner die Methode aufgreifen — denn verschiedene Hersteller setzen bereits auf solche Speichertypen für energieeffiziente KI-Chips.

Was das für Rechenzentren und Klimaziele bedeutet

Das rasante Wachstum des KI-Verbrauchs wirft ernsthafte Fragen zur Nachhaltigkeit der digitalen Landschaft auf. Schätzungen deuten darauf hin, dass groß angelegte Modelle in den kommenden Jahren so viel Strom verbrauchen könnten wie mittelgroße Länder — wenn sich an der zugrunde liegenden Hardware nichts ändert.

Eine Million Mal weniger Energie pro Trainingsschritt verändert die Debatte grundlegend: KI muss kein Synonym für hohe CO₂-Emissionen bleiben.

Sollten Techniken wie eaPU in großem Maßstab einsetzbar werden, könnten Rechenzentren dieselbe Arbeit mit erheblich weniger Strom verrichten. Das verringert den Druck auf Netzbetreiber, begrenzt den Bedarf an neuen Hochspannungsleitungen und macht erneuerbare Energien besser ausreichend.

Für europäische Länder — darunter Deutschland, die Niederlande und Belgien, wo lokaler Widerstand gegen neue Rechenzentren wächst — könnte diese Art von Hardware-Innovation die Debatte entschärfen. Die Diskussion verlagert sich dann von „Rechenzentrum ja oder nein" hin zu „welche Technologie steckt darin?"

Szenarien für künftige Anwendungen

Eine naheliegende Anwendung ist das sogenannte Edge-KI: Modelle, die nah am Nutzer laufen — auf Smartphones, in Fahrzeugen, medizinischen Geräten oder Industriesensoren. Mit extrem energieeffizientem Training und Inferenz könnten solche Geräte lokal lernen, statt alles in die Cloud zu schicken.

Ein Fahrzeug könnte beispielsweise seine Fahrassistenz auf Basis lokaler Bedingungen verfeinern, ohne ständig Daten hochzuladen. Ein tragbares Medizingerät könnte Muster in Herzfrequenz oder Glukosewerten erlernen, während der Akku trotzdem tagelang hält.

Auch für Unternehmen, die mit vertraulichen Daten arbeiten — etwa Krankenhäuser oder Banken — eröffnet diese Entwicklung neue Möglichkeiten. Weniger Abhängigkeit von zentralen GPU-Clustern bedeutet, dass sensible Daten das Gebäude nicht verlassen müssen, während Algorithmen dennoch weiter verbessert werden.

Risiken, Grenzen und nächste Schritte

Die aktuellen Ergebnisse stammen aus Laboraufbauten mit vergleichsweise kleinen Chips. Die Skalierbarkeit bleibt ein großes Fragezeichen: Wie verhalten sich analoge Arrays, wenn Millionen von Memristoren nebeneinander arbeiten, mit Temperaturschwankungen und Fertigungsstreuungen?

Darüber hinaus erfordert eine solche neue Architektur eine angepasste Software-Infrastruktur: Trainingsbibliotheken, Compiler und Frameworks, die probabilistische Updates und Hardware-Rauschen berücksichtigen. Ohne benutzerfreundliche Werkzeuge bleiben diese Lösungen auf Forschungslabore beschränkt.

Dennoch trifft der Kern des Vorschlags einen breiteren Nerv in der KI-Welt: Akzeptiere Unvollkommenheit, wo es möglich ist. Indem Hardware-Fehler nicht um jeden Preis korrigiert, sondern intelligent genutzt werden, entsteht Raum für drastisch geringeren Energieverbrauch. Diese Denkwende könnte auch andere KI-Bereiche inspirieren — von neuromorphen Chips bis hin zu Spiking Neural Networks.

Wer KI in Produkten oder Dienstleistungen einsetzt, sollte diese Entwicklungen aufmerksam verfolgen. Die Wahl von Hardware und Trainingsstrategie bestimmt nicht nur die Leistung, sondern auch den Energiefußabdruck, die Betriebskosten und die langfristige Skalierbarkeit. Neue Generationen von KI-Systemen werden wahrscheinlich nicht nur an ihrer Genauigkeit gemessen werden, sondern auch an der Anzahl der Kilowattstunden pro trainiertem Parameter.

Author

  • Timo Gerber ist ein deutscher Lifestyle-Blogger mit einer Community von rund 15–25 000 Followern. Er teilt Inhalte zu Alltagstipps, Lifestyle, Mode und kreativen Lifehacks und inspiriert seine Follower mit persönlichen Erfahrungen, praktischen Ideen und visuell ansprechenden Posts auf Instagram.

Nach oben scrollen