KI-Effizienz · Claude Guide · 2026

Nie wieder
Tokens
verbrennen.

Das Claude-Limit nach zwei Stunden Arbeit — kein Ausnahmefall, sondern die logische Konsequenz von acht Gewohnheiten, die sich schnell abgewöhnen lassen. Hier sind die konkreten Hebel.

Lesedauer 6 Minuten
Kategorie KI-Tools
Zielgruppe Claude-Nutzer
Stand Mai 2026
Editieren statt Stapeln Haiku für 80% der Arbeit Neuer Chat alle 15 Nachrichten Memory einmal einrichten Opus nur für das Schwere Editieren statt Stapeln Haiku für 80% der Arbeit Neuer Chat alle 15 Nachrichten Memory einmal einrichten Opus nur für das Schwere

Claude zählt Tokens,
nicht Nachrichten.

Wer das nicht versteht, wundert sich, warum das Tageslimit schon zur Mittagspause aufgebraucht ist. Das Token-System funktioniert anders als ein Chat-Counter — und dieser Unterschied hat handfeste Konsequenzen für jeden, der Claude täglich produktiv nutzen will.

Ein Token ist keine Nachricht. Es ist ein Textfragment — etwa drei bis vier Zeichen. Bei jedem einzelnen Prompt liest Claude nicht nur deine neue Nachricht, sondern den gesamten bisherigen Gesprächsverlauf neu durch. Ein Thread mit 40 Nachrichten kostet bei jeder neuen Frage 40-mal den kumulierten Kontext.

Das ist kein Bug. Das ist das Funktionsprinzip großer Sprachmodelle. Aber es ist ein Hebel — und wer ihn kennt, nutzt Claude dauerhaft effizienter als alle anderen.

Token-Kosten pro Nachricht

Haiku Schnelle Aufgaben ~500
Sonnet Echtes Arbeiten ~2.000
Opus Komplexe Aufgaben ~8.000
Ein 40-Nachrichten-Thread mit Opus = jede neue Frage kostet das Vierfache einer frischen Session mit Sonnet. Kumuliert über den Tag ein massiver Unterschied.

So hört das
Limit-Sprengen
auf.

Keine großen Investitionen, kein Toolwechsel. Nur fünf Verhaltensänderungen — die zusammen den Verbrauch um 60 bis 70 Prozent senken können.

01

Editieren,
nicht stapeln

Wenn eine Antwort nicht passt: letzte Nachricht editieren, nicht eine neue hinterherschicken. Editieren setzt den Kontext zurück auf den Stand vor der Frage. Stapeln hingegen addiert die schlechte Antwort und die Korrektur — beide werden bei jedem nächsten Zug mitgelesen.

→ Bearbeiten, nicht antworten. Der Unterschied kostet drei Mal so viele Tokens.
02

Neuer Chat
alle 15 Nachrichten

Claude liest bei jedem neuen Zug den kompletten Gesprächsverlauf. Bei 30 Nachrichten bedeutet das: Jede neue Frage trägt die Last aller vorherigen 30 Nachrichten. Ein frischer Chat kostet Sekunden — und zahlt sich sofort aus.

→ Faustregel: Nach 15 Nachrichten neuen Chat starten, Kontext bei Bedarf kurz zusammenfassen.
03

Alles in
einen Prompt

Drei Fragen in drei separaten Nachrichten = dreifache Kontext-Last. Alle drei Fragen in einem einzigen Prompt = einfache Kontext-Last bei gleichem Ergebnis. Dieser Hebel ist so simpel wie wirkungsvoll.

→ Alles bundeln. Eine Nachricht. Immer.
04

Suche & Artefakte
nur bei Bedarf

Websuche und Artefakte sind versteckte Token-Fresser. Beide sind standardmäßig aktiv — verbrauchen aber deutlich mehr Token als einfache Textantworten. Wer sie dauerhaft aktiviert lässt, zahlt permanent dafür, ohne es zu merken.

→ Standardmäßig aus. Nur gezielt einschalten, wenn wirklich gebraucht.
05

Tagesablauf planen statt sprinten

Das Token-Limit läuft in einem rollenden Zeitfenster — nicht von Mitternacht bis Mitternacht. Wer vier Stunden am Stück mit Opus arbeitet, verbrennt das gesamte Tagesbudget in einem Block. Drei kurze, fokussierte Sessions à 90 Minuten leisten mehr als ein unkontrollierter Marathon — weil das Fenster sich zwischendrin teilweise regeneriert.

→ Morgens, Mittags, Abends: drei Sessions mit klaren Zielen. Nicht sprinten, planen.

Das richtige
Modell für
jede Aufgabe.

Der häufigste Fehler: immer Opus wählen, weil es sich „besser anfühlt". Opus kostet 16-mal so viele Tokens wie Haiku — für viele Alltagsaufgaben ein massives Overengineering.

Sehr niedrige Kosten

Haiku

~500 Tokens/Nachricht
  • Schnelle Antworten & Recherche
  • Grammatik & Formatierung
  • Brainstorming & Ideation
  • Einfache Zusammenfassungen
  • Umformulierungen & Übersetzungen
Mittlere Kosten

Sonnet

~2.000 Tokens/Nachricht
  • Inhalte schreiben & redigieren
  • Programmierung & Code-Reviews
  • Analyse & Dokumentenprüfung
  • Mehrstufige Aufgaben
  • Strukturiertes Denken
Hohe Kosten

Opus

~8.000 Tokens/Nachricht
  • Tiefe Recherche & Synthese
  • Harte Logik & Mathematik
  • Multidokumenten-Analyse
  • Komplexe Strategie
  • Orchestrierung von Agenten
Haiku für Entwürfe  ·  Sonnet für echtes Arbeiten  ·  Opus nur für das Schwere

Der größte
Token-Hebel
überhaupt.

Wer täglich dieselben Kontextinformationen in jeden neuen Chat eintippen muss — Rolle, Tonfall, Regeln, Projektinfos — verbrennt mehr Tokens mit Setup als mit Arbeit. Diese drei Einstellungen lösen das dauerhaft.

06 · Memory

Memory
einrichten

Einmalig Rolle, Tonalität, Sprache und Arbeitsregeln hinterlegen. Claude lädt diese Informationen automatisch in jeden neuen Chat — keine wiederholten Erklärungs-Prompts mehr.

Rolle: Content Stratege
Tonfall: Direkt, präzise
Sprache: Deutsch, Du-Form
Regeln: Keine Füllwörter
07 · Projekte

Projekte
nutzen

Dateien einmalig hochladen — Claude zwischenspeichert sie. Neue Chats innerhalb desselben Projekts verweisen automatisch auf den gemeinsamen Wissensstand, ohne dass Dateien neu übertragen werden müssen.

Speicher: Nur für dich
Anweisungen: Schreibstil-Guide
Dateien: Brand-Docs, Briefings
Zugriff: Alle Chats im Projekt
08 · CLAUDE.md

CLAUDE.md
schreiben

Pflicht für Claude Code-Nutzer: Eine Markdown-Datei im Projekt-Wurzelverzeichnis. Stack, Regeln, Tonfall — Claude liest sie automatisch in jeder Session. Einmal schreiben, dauerhaft profitieren.

Stack: Next.js, Tailwind
Tonfall: Präzise, kein Smalltalk
Regeln: Tests erforderlich
Vermeiden: Überentwicklung

Was fast
jeder
falsch macht.

Wer diese vier Muster kennt, hört auf, sie unbewusst zu wiederholen. Jedes davon kostet täglich tausende Tokens — ohne erkennbaren Mehrwert.

Mistake #1

Smalltalk mit der KI

„Danke!", „Verstanden!", „Super, das war hilfreich!" — jeder dieser Bestätigungs-Prompts kostet bei Opus echtes Geld. Claude braucht kein Lob und keine Bestätigung. Das sind Token ohne jede Gegenleistung.

✓ Fix: Direkt zur nächsten Aufgabe. Kein Kommentar zur Antwort, wenn keine nötig ist.
Mistake #2

Riesige Chat-Verläufe

Ein 80-Nachrichten-Thread zwingt Claude, bei jeder neuen Frage 80 Nachrichten neu zu lesen. Das ist mit Abstand der größte einzelne Token-Killer — und der, der am einfachsten zu vermeiden ist.

✓ Fix: Neuer Chat nach spätestens 15–20 Nachrichten. Kontext bei Bedarf kurz einfügen.
Mistake #3

Direkt mit Opus starten

Prototyping, erste Entwürfe, Struktur-Brainstorming — das alles passiert in Haiku oder Sonnet. Opus kommt erst, wenn die Logik steht und es um Feinschliff, tiefe Analyse oder komplexe Orchestrierung geht.

✓ Fix: Haiku für die Grundlage. Opus nur für den letzten Schritt.
Mistake #4

Alles auf einmal bauen lassen

„Bau mir eine vollständige Marketing-Strategie mit Inhalten, Zeitplan und Budgetrechner" — solche Mega-Prompts führen zu Re-Generierung, Korrekturrunden und exponentiell steigendem Kontext. Iterativ arbeiten ist effizienter.

✓ Fix: Erst planen lassen, absegnen, dann abschnittsweise umsetzen.

Der Pro-Move: Sonntagabend-Routine

5 Minuten Sonntagabend — Memory aktualisieren, Projekt-Dateien prüfen, CLAUDE.md anpassen. Wer diese Routine einmal etabliert hat, arbeitet die gesamte Woche rund doppelt so effizient mit Claude.

Du willst Claude strategisch
in dein Marketing einbauen?

In einem 30-minütigen Gespräch zeige ich dir, welche KI-Tools und Workflows konkret zu deinem Unternehmen passen — und was du sofort umsetzen kannst.

Kennenlernen →