Das Claude-Limit nach zwei Stunden Arbeit — kein Ausnahmefall, sondern die logische Konsequenz von acht Gewohnheiten, die sich schnell abgewöhnen lassen. Hier sind die konkreten Hebel.
Wer das nicht versteht, wundert sich, warum das Tageslimit schon zur Mittagspause aufgebraucht ist. Das Token-System funktioniert anders als ein Chat-Counter — und dieser Unterschied hat handfeste Konsequenzen für jeden, der Claude täglich produktiv nutzen will.
Ein Token ist keine Nachricht. Es ist ein Textfragment — etwa drei bis vier Zeichen. Bei jedem einzelnen Prompt liest Claude nicht nur deine neue Nachricht, sondern den gesamten bisherigen Gesprächsverlauf neu durch. Ein Thread mit 40 Nachrichten kostet bei jeder neuen Frage 40-mal den kumulierten Kontext.
Das ist kein Bug. Das ist das Funktionsprinzip großer Sprachmodelle. Aber es ist ein Hebel — und wer ihn kennt, nutzt Claude dauerhaft effizienter als alle anderen.
Keine großen Investitionen, kein Toolwechsel. Nur fünf Verhaltensänderungen — die zusammen den Verbrauch um 60 bis 70 Prozent senken können.
Wenn eine Antwort nicht passt: letzte Nachricht editieren, nicht eine neue hinterherschicken. Editieren setzt den Kontext zurück auf den Stand vor der Frage. Stapeln hingegen addiert die schlechte Antwort und die Korrektur — beide werden bei jedem nächsten Zug mitgelesen.
Claude liest bei jedem neuen Zug den kompletten Gesprächsverlauf. Bei 30 Nachrichten bedeutet das: Jede neue Frage trägt die Last aller vorherigen 30 Nachrichten. Ein frischer Chat kostet Sekunden — und zahlt sich sofort aus.
Drei Fragen in drei separaten Nachrichten = dreifache Kontext-Last. Alle drei Fragen in einem einzigen Prompt = einfache Kontext-Last bei gleichem Ergebnis. Dieser Hebel ist so simpel wie wirkungsvoll.
Websuche und Artefakte sind versteckte Token-Fresser. Beide sind standardmäßig aktiv — verbrauchen aber deutlich mehr Token als einfache Textantworten. Wer sie dauerhaft aktiviert lässt, zahlt permanent dafür, ohne es zu merken.
Das Token-Limit läuft in einem rollenden Zeitfenster — nicht von Mitternacht bis Mitternacht. Wer vier Stunden am Stück mit Opus arbeitet, verbrennt das gesamte Tagesbudget in einem Block. Drei kurze, fokussierte Sessions à 90 Minuten leisten mehr als ein unkontrollierter Marathon — weil das Fenster sich zwischendrin teilweise regeneriert.
Der häufigste Fehler: immer Opus wählen, weil es sich „besser anfühlt". Opus kostet 16-mal so viele Tokens wie Haiku — für viele Alltagsaufgaben ein massives Overengineering.
Wer täglich dieselben Kontextinformationen in jeden neuen Chat eintippen muss — Rolle, Tonfall, Regeln, Projektinfos — verbrennt mehr Tokens mit Setup als mit Arbeit. Diese drei Einstellungen lösen das dauerhaft.
Einmalig Rolle, Tonalität, Sprache und Arbeitsregeln hinterlegen. Claude lädt diese Informationen automatisch in jeden neuen Chat — keine wiederholten Erklärungs-Prompts mehr.
Dateien einmalig hochladen — Claude zwischenspeichert sie. Neue Chats innerhalb desselben Projekts verweisen automatisch auf den gemeinsamen Wissensstand, ohne dass Dateien neu übertragen werden müssen.
Pflicht für Claude Code-Nutzer: Eine Markdown-Datei im Projekt-Wurzelverzeichnis. Stack, Regeln, Tonfall — Claude liest sie automatisch in jeder Session. Einmal schreiben, dauerhaft profitieren.
Wer diese vier Muster kennt, hört auf, sie unbewusst zu wiederholen. Jedes davon kostet täglich tausende Tokens — ohne erkennbaren Mehrwert.
„Danke!", „Verstanden!", „Super, das war hilfreich!" — jeder dieser Bestätigungs-Prompts kostet bei Opus echtes Geld. Claude braucht kein Lob und keine Bestätigung. Das sind Token ohne jede Gegenleistung.
Ein 80-Nachrichten-Thread zwingt Claude, bei jeder neuen Frage 80 Nachrichten neu zu lesen. Das ist mit Abstand der größte einzelne Token-Killer — und der, der am einfachsten zu vermeiden ist.
Prototyping, erste Entwürfe, Struktur-Brainstorming — das alles passiert in Haiku oder Sonnet. Opus kommt erst, wenn die Logik steht und es um Feinschliff, tiefe Analyse oder komplexe Orchestrierung geht.
„Bau mir eine vollständige Marketing-Strategie mit Inhalten, Zeitplan und Budgetrechner" — solche Mega-Prompts führen zu Re-Generierung, Korrekturrunden und exponentiell steigendem Kontext. Iterativ arbeiten ist effizienter.
5 Minuten Sonntagabend — Memory aktualisieren, Projekt-Dateien prüfen, CLAUDE.md anpassen. Wer diese Routine einmal etabliert hat, arbeitet die gesamte Woche rund doppelt so effizient mit Claude.
In einem 30-minütigen Gespräch zeige ich dir, welche KI-Tools und Workflows konkret zu deinem Unternehmen passen — und was du sofort umsetzen kannst.