Eine Million Tokens – und stolz darauf

Hündchen, dass über eine Hürde auf einer Wiese springt
Foto: Pixabay, Pezibear

Was passiert, wenn das Management AI-Nutzung mit AI-Nutzen verwechselt


Es war ein stolzer Moment. Ein Top-Manager stand vor der Belegschaft und verkündete die neueste Erfolgsmeldung: Das Unternehmen habe im vergangenen Quartal eine Million Tokens mit KI-Tools verarbeitet. Applaus. Erleichterung. Das Gefühl, endlich in der digitalen Zukunft angekommen zu sein.

Für alle, die nicht täglich mit Sprachmodellen arbeiten: Ein Token ist die kleinste Einheit, in die ein Sprachmodell Text zerlegt – grob gesagt etwa drei Viertel eines Wortes. Wenn man also fragt, wie das Wetter morgen wird, und die KI antwortet, dann kostet das ein paar Dutzend Token. Eine Million davon klingt nach viel. Und tatsächlich – das ist auch gar nicht wenig. Aber ist es ein Erfolg?


Der Unterschied zwischen Aktivität und Mehrwert

Stellen Sie sich vor, ein Vertriebsleiter meldet stolz: „Unsere Mitarbeiter haben diesen Monat 40.000 E-Mails verschickt." Oder ein Logistikchef freut sich: „Unsere LKW haben 200.000 Liter Diesel verbraucht." Beides klingt nach Arbeit. Ob dabei etwas Sinnvolles herausgekommen ist – das wissen wir immer noch nicht.

Tokenverbrauch ist ein Aktivitätsindikator, kein Qualitätsmerkmal. Er sagt uns, dass jemand eine KI benutzt hat. Er sagt uns nicht, ob das Ergebnis besser war als ohne KI, ob Zeit gespart wurde, ob eine bessere Entscheidung getroffen wurde – oder ob jemand einfach eine halbe Stunde lang mit dem Chatbot Witze ausgetauscht hat.

Viel KI-Nutzung ist nicht dasselbe wie viel KI-Mehrwert. Das ist kein Wortspiel – das ist der Kern des Problems.

Das Dashboard und seine Verführungen

Konsequenterweise folgt auf die Begeisterung über den Tokenverbrauch der nächste logische Schritt: ein Dashboard. Das Management möchte die KI-Nutzung auf Unternehmens-, Bereichs- und Abteilungsebene auswerten. Ohne Personenbezug, versteht sich – das wäre ein Betriebsratsthema. Aber auf Abteilungsebene soll schon klar werden, wer „dabei ist" und wer noch nicht.

Solche Dashboards sind technisch leicht umsetzbar und politisch verlockend. Sie geben dem Management das Gefühl von Steuerbarkeit. Man sieht Zahlen, man kann vergleichen, man kann eingreifen. Das Problem ist nur: Man steuert dabei am Ziel vorbei.

Denn was folgt zwangsläufig auf ein Nutzungs-Dashboard? Richtig: Nutzungsziele. Abteilung C wird aufgefordert, „mehr KI einzusetzen". Führungskräfte müssen in Meetings berichten, wie ihre Teams die KI-Nutzung gesteigert haben. Und plötzlich entsteht ein Anreiz, der nichts mehr mit dem eigentlichen Sinn von KI zu tun hat.


Token Maxxing: Wenn der Weg zum Ziel wird

In der Gamer-Community gibt es den Begriff „Maxxing" – das konsequente Maximieren einer bestimmten Eigenschaft eines Charakters, oft auf Kosten anderer Attribute. In der KI-Welt hat sich analog dazu der Begriff Token Maxxing etabliert: das absichtliche oder unbewusste Aufblähen von Anfragen und Antworten, um möglichst viele Tokens zu generieren – ohne dass das der Qualität dient.

Token Maxxing in der Praxis: Anstatt eine klare, präzise Frage zu stellen, wird der Prompt ausgeschmückt, wiederholt und mit Kontext überfrachtet. Anstatt eine kurze Antwort zu akzeptieren, fordert man Varianten, Zusammenfassungen der Zusammenfassung, fünf alternative Formulierungen. Ergebnis: viele Tokens, wenig Mehrwert – und eine höhere Rechnung.

Token Maxxing hat zwei unangenehme Konsequenzen, die gerne übersehen werden:

Kosten: Tokenverbrauch ist nicht gratis. API-Zugriffe auf Sprachmodelle werden nach genutztem Volumen abgerechnet. Wer Token Maxxing betreibt – ob aus Unwissenheit oder durch falschen Anreiz –, verbrennt schlicht Geld. Bei entsprechender Skalierung können aus einem gut gemeinten KI-Programm erhebliche Kostenblöcke entstehen, die sich in keiner Weise mit dem tatsächlichen Nutzen rechtfertigen lassen.

Umwelt: Jede Anfrage an ein großes Sprachmodell verbraucht Rechenleistung – und damit Energie. Rechenzentren, die die Infrastruktur für KI-Modelle betreiben, gehören zu den energieintensivsten Anlagen der modernen Wirtschaft. Wer ohne Notwendigkeit Millionen von Tokens generiert, leistet damit einen realen – wenn auch kleinen – Beitrag zum Energieverbrauch. Das ist kein Argument gegen KI-Nutzung. Aber es ist ein Argument für sinnvolle KI-Nutzung.


Die LKW-Analogie, die alles erklärt

Stellen Sie sich vor, ein Logistikchef gibt seinen Fahrern folgende Anweisung: „Die Strecke Hamburg–München ist 800 Kilometer lang. Ihr sollt dafür mindestens 300 Liter Diesel verbrauchen." Jeder würde sofort erkennen, dass das absurd ist. Effizienz ist das Ziel, nicht Verbrauch. Ein Fahrer, der mit 80 Litern ans Ziel kommt, hat besser gearbeitet als einer, der 300 verbraucht.

Mehr KI-Nutzung als Ziel ist genauso sinnvoll, wie einem LKW-Fahrer zu sagen: „Verbrauche für die Strecke mindestens 300 Liter Sprit."
Zapfsäule
Foto: Pixabay, planet_fox

Bei KI lachen wir nicht – wir bauen Dashboards. Dabei ist die Logik dieselbe. Der Einsatz von KI-Tools ist kein Selbstzweck. Er ist ein Mittel zu einem Zweck: bessere Ergebnisse, schnellere Prozesse, höhere Qualität. Wer Tokenverbrauch als Erfolgskennzahl definiert, hat das Mittel mit dem Ziel verwechselt.


Wie eine sinnvolle KI-Messung aussieht

Das bedeutet nicht, dass man KI-Einsatz gar nicht messen sollte. Aber die richtigen Fragen sind andere: Welche Prozesse wurden durch KI-Unterstützung tatsächlich schneller? Wo hat die Qualität der Ergebnisse zugenommen? Welche Aufgaben wurden entlastet, sodass Menschen sich auf höherwertige Tätigkeiten konzentrieren konnten? Das sind Wirkungsindikatoren – und die sind schwieriger zu erheben als Tokenvolumen, aber sie sagen etwas Wahres aus.

Ein gutes KI-Dashboard zeigt nicht, wie viel KI genutzt wird. Es zeigt, wo KI einen Unterschied gemacht hat.


Schluss: Hilfsmittel, kein Wundermittel

KI ist ein außerordentlich leistungsfähiges Werkzeug. Es kann Texte verfassen, Daten analysieren, Code schreiben, Zusammenfassungen erstellen – und dabei in vielen Fällen erheblich Zeit sparen. Aber es ist und bleibt ein Werkzeug. Ein Hammer, der 40-mal pro Tag benutzt wird, ist nicht besser als einer, der zehnmal zielgenau eingesetzt wird.

Der Ruf zu mehr KI-Nutzung ohne Kontext, ohne Qualitätskontrolle und ohne Reflexion der Ergebnisse ist nicht Digitalisierung – es ist Aktionismus mit Techniksymbolik. Das Ziel sollte sein: die richtigen Aufgaben mit dem richtigen Werkzeug lösen, und dabei messen, ob es funktioniert.

Eine Million Tokens kann ein Zeichen für exzellente KI-Integration sein. Oder für eine Menge verschwendeter Energie. Ohne Kontext wissen wir es nicht. Und genau das sollten wir anfangen, herauszufinden – bevor wir applaudieren.


Setzen Sie KI dort ein, wo sie echten Mehrwert schafft. Messen Sie den Mehrwert, nicht den Verbrauch. Und wenn jemand im nächsten Meeting stolz auf eine Million Tokens hinweist: Fragen Sie freundlich nach, was dabei herausgekommen ist.

Read more