Zum Inhalt springen
KI & Technologie

Eine Woche mit meinem eigenen KI-Bot: Was mich Luna über Kosten und Caching gelehrt hat

Ein eigener KI-Assistent für unter 4 € im Monat? Meine ehrlichen Learnings aus einer Woche mit einem selbst betriebenen OpenClaw-Bot – Kosten, Caching, Modellwahl.

Philipp Unterholzer15. Juni 2026
Das OpenClaw-Maskottchen neben einer Espressotasse – der Bot kostet weniger als ein Kaffee im Monat

Seit ein paar Wochen läuft auf einem kleinen Server ein Bot, den ich „Luna" getauft habe. Sie hängt an Telegram, hat Zugriff auf meine Mails und meinen Kalender und kann im Netz suchen – gebaut mit OpenClaw. Statt das Ding einfach laufen zu lassen, habe ich mir nach der ersten richtigen Arbeitswoche die nackten Nutzungsdaten angeschaut. Ein paar dieser Erkenntnisse haben mein Bild davon, was so ein Assistent eigentlich kostet und braucht, ziemlich verändert.

Vorweg, weil ich an anderer Stelle deutlich vor OpenClaw für Laien gewarnt habe: An dieser Einschätzung ändert sich nichts. Was ich hier beschreibe, ist ein bewusst abgesichertes Setup eines Menschen, der weiß, was er tut. Für den 0815-Nutzer bleibt so ein autonomer Agent mit Vollzugriff auf den Rechner weiterhin nichts. Genau deshalb finde ich es aber spannend, einmal offen zu zeigen, was technisch dahintersteckt.

1. Es ist absurd günstig

Mein erster Reflex war Respekt vor der Rechnung. Ein Bot, der quasi rund um die Uhr bereitsteht, Tools bedient, Mails liest, Termine sortiert – das klingt nach Geld.

Die Realität: 455 Anfragen über eine Arbeitswoche haben 0,76 US-Dollar gekostet. Hochgerechnet sind das rund 3,60 € im Monat. Selbst wenn Luna dreimal so viel zu tun bekäme, bliebe ich unter zwölf Euro.

Die Lektion: Die Hürde bei einem persönlichen KI-Assistenten sind nicht die laufenden Kosten. Es ist das Setup, die Integration und das Vertrauen. Der Betrieb selbst ist Kaffeekassen-Niveau – im Wortsinn, daher das Bild oben.

2. Caching ist der heimliche Held

Das war die Zahl, die mich am meisten überrascht hat. Von 11,4 Millionen Eingabe-Tokens kamen 63 % aus dem Cache. Konkret hat mir das Caching in dieser Woche 0,89 Dollar erspart – also mehr, als ich am Ende überhaupt bezahlt habe.

Ohne Caching wäre die Rechnung glatt doppelt so hoch gewesen.

Warum das so stark wirkt: Ein „agentischer" Bot schickt bei jedem einzelnen Arbeitsschritt seinen kompletten Kontext erneut mit – Grundanweisungen, Werkzeug-Beschreibungen, bisherige Schritte. Das ist viel wiederkehrender Text, und genau den fängt der Cache ab. Wer so einen Assistenten baut, sollte Prompt-Caching nicht als nettes Extra behandeln, sondern als zentrale Entscheidung.

3. Ein „kleines" Modell reicht erstaunlich weit

Ich hätte aus Gewohnheit zum dicksten verfügbaren Modell gegriffen. Stattdessen läuft praktisch alles über ein schnelles, günstiges Modell – und das Ergebnis ist gut genug, dass ich es im Alltag schlicht nicht merke.

Nur für echte Websuchen klinkt sich ein spezialisiertes Such-Modell ein, und das auch nur zwei Mal in der ganzen Woche. Diese zwei Anfragen waren pro Stück das Teuerste im ganzen Datensatz – fielen aber in der Gesamtsumme nicht ins Gewicht.

Die Lektion: Nicht „das beste Modell für alles", sondern das passende Modell pro Aufgabe. Die teure Kanone holst du nur raus, wenn du sie wirklich brauchst.

4. Agenten sind input-lastig – nicht output-lastig

Eine Intuition, die ich revidieren musste: Ich dachte, die Kosten entstehen beim Schreiben langer Antworten. Falsch. 99 % der Tokens waren Eingabe, nur ein Prozent Ausgabe. 11,4 Millionen rein, rund 150.000 raus.

Und 91 % aller Anfragen endeten gar nicht mit einer Textantwort, sondern mit einer Aktion – einem Werkzeug-Aufruf. Luna „redet" fast nie einfach nur, sie arbeitet: ruft Mail ab, prüft den Kalender, sucht. Wer die Kosten so eines Systems verstehen will, muss den Kontext optimieren, den man hineinschickt – nicht die Länge der Antworten.

5. Nicht alles muss rund um die Uhr laufen

Beim Durchsehen fiel mir auf, dass ein ganzer Tag komplett leer war. Kurzer Schreck – hängt der Server? Dann der Groschen: Es war ein Samstag. Meine geplanten Läufe sind bewusst auf Montag bis Freitag gelegt, plus eine Zusammenfassung am Sonntag. Genau das zeigten die Daten: volle Werktage, leerer Samstag, ein einziger kleiner Lauf am Sonntag.

Das klingt banal, ist aber eine Haltung: Ein Assistent muss nicht ununterbrochen feuern, um nützlich zu sein. Ein durchdachter Zeitplan spart Geld, Rauschen und Nerven – und macht das Verhalten erst nachvollziehbar.

Fazit

Was als „mal schauen, was so ein Bot kostet" begann, wurde zu einer kleinen Lektion in Pragmatismus. Die Technik ist günstiger, robuster und genügsamer, als ich erwartet hatte. Die eigentliche Arbeit liegt woanders: im sauberen, sicheren Setup, in den richtigen Integrationen und darin, dem System einen sinnvollen Rhythmus zu geben.

Luna kostet mich weniger als ein Kaffee im Monat. Und sie ist mir nützlicher als die meisten Apps, für die ich mehr zahle. Für mich als Techniker ein faszinierendes Werkzeug – mit dem klaren Hinweis, dass solche Agenten Hände am eigenen Rechner haben und entsprechend Respekt verdienen.

OpenClawKIAutomatisierungSelfhosting

Fragen zum Thema?

Ich helfe dir gerne weiter — persönlich und verständlich.

WhatsApp schreiben