OpenClaw 6.1 Önbellek İsabet Oranı Gerilemesi, LLM Token Maliyetlerini Artırıyor

Özet

OpenClaw 6.1 / 2026.6.1 sürümünün yayınlanmasıyla birlikte, istem önbelleğe alma (prompt caching) sisteminde ciddi bir gerileme (regression) ortaya çıktı. Geliştiriciler, önbellek isabet oranlarının güncelleme sonrası yaklaşık %80’den %20’nin altına düştüğünü bildiriyor. Bu gerileme, birbirinin aynısı olan sistem komutlarının ve araç tanımlarının sürekli olarak yeniden hesaplanmasına neden oluyor. Sonuç olarak, özellikle Anthropic Vertex AI sağlayıcısını kullananlar için token tüketimi ve API maliyetleri 4-5 kat arttı.

Neler Oldu?

OpenClaw 6.1 sürümüne geçiş yaptıktan sonra geliştiriciler, LLM API faturalarında beklenmedik artışlar gözlemledi. cache-trace aracı ve /status komutu kullanılarak yapılan teşhisler, önbellek verimliliğinde muazzam bir düşüş olduğunu ortaya koydu. Sorunun temel nedeni, bir önbelleğe alma protokolü uyumsuzluğu: Anthropic Vertex sağlayıcısı, cache_control: ephemeral parametresini dinamik son eklere ve aktif bellek bloklarına yanlış bir şekilde ekliyor; bu da ön ek tabanlı (prefix-based) önbellek eşleşmesini geçersiz kılıyor ve model sağlayıcısını her adımda tüm bağlamı yeniden hesaplamaya zorluyor.

Neden Önemli?

İstem önbelleğe alma, ajan tabanlı iş akışlarının finansal olarak sürdürülebilir kalması için hayati önem taşır. Yapay zeka ajanları; sistem talimatlarını, yürütme geçmişini ve araç tanımlarını birden fazla adımda tekrar tekrar iletir. İşleyen bir önbellek mekanizması olmadan işletim maliyetleri hızla katlanır. İsabet oranının %20’nin altına düşmesi, karmaşık ajan döngülerini birçok işletme için ekonomik olarak sürdürülemez hale getirir ve önemli bir gecikmeye (TTFT - İlk Token Süresi) neden olur.

Kanıtlar

Geliştirici kanallarında hata raporları hızla arttı. GitHub issue #90583, önbellek isabet oranının %80’den %20’nin altına düşüşünü ayrıntılı olarak belgelemektedir. Ayrıca, GitHub issue #91982, @openclaw/anthropic-vertex-providerın StreamRawPredict uç noktasına yanlış cache_control başlıkları gönderdiğini ve API’nin 4 önbelleğe alma bloğu sınırı aşıldığında (“En fazla 4 cache_control bloğu sağlanabilir. 5 bulundu.”) 400 Hatalı İstek hatasını tetiklediğini detaylandırmaktadır.

Analiz

Hata, src/agents/anthropic-payload-policy.ts dosyasındaki applyAnthropicCacheControlToSystem işlevinden kaynaklanıyor. Bu işlev, cache_control: ephemeral parametresini sistem komutunun dinamik son ekine yanlış bir şekilde uyguluyor. active-memory özelliği etkinleştirildiğinde ve geri çağrılan bellekler prependContext aracılığıyla kullanıcı mesajının başına eklendiğinde, önbellek kontrollü blokların toplam sayısı Anthropic’in 4 olan katı sınırını aşıyor. Ek olarak, önbelleğe alma işaretçilerinin dinamik bağlam bölümlerinin içine yerleştirilmesi, küçük varyasyonlarda önbellek anahtarını geçersiz kılarak ön ek önbelleğe almayı tamamen etkisiz hale getiriyor.

Pratik Çıkarımlar

Aktif Belleği Devre Dışı Bırakın: Geçici bir çözüm olarak, openclaw.json dosyasındaki active-memory özelliğini kapatın. Bu, 400 Hatalı İstek hatasını önler ve statik bileşenler için ön ek önbelleğe almayı geri yükler.
Sürüm Düşürün (Rollback): Maliyet etkin önbelleğe almaya büyük ölçüde bağımlı olan geliştiriciler, bir veri yükü politikası (payload-policy) ara düzeltmesi yayınlanana kadar geçici olarak 2026.4.20 sürümüne dönmelidir.
Önbellek Sağlığını İzleyin: /status komutunu kullanarak önbellek performansını aktif olarak izleyin ve cache-trace ile önbellek uyumsuzluklarını inceleyin.

Açık Sorular

OpenAI veya yerel Anthropic API sarmalayıcısı gibi diğer sağlayıcıların da 6.1 sürümünde benzer veri yükü biçimlendirme hataları yaşayıp yaşamadığı veya gerilemenin yalnızca Anthropic Vertex sağlayıcısı ve Aktif Bellek hattıyla sınırlı olup olmadığı henüz belirsizliğini koruyor. OpenClaw bakımcılarından resmi bir yama henüz bekleniyor.