Neden? Çünkü geleneksel RAG, hafıza değil, sadece gelişmiş bir “dijital dosya dolabı”. Dosyayı buluyor ama içindeki hikayeyi anlamıyor. İşte Hindsight (vectorize-io), bu noktada “Hafıza dediğin böyle olmaz, durun size insan beynini kopyalayayım” diyerek masaya yumruğunu vuruyor.
🔍 Geleneksel RAG vs. Hindsight: Neden Patlıyoruz?
Klasik sistemlerde veriyi parçalara (chunk) ayırır, vektör veri tabanına fırlatırız. Sorgu geldiğinde “en yakın komşuyu” buluruz. Ama ajan (agent) dediğimiz nane, sadece “kelime benzerliği” istemez.
Hindsight’ın teknik farkı şurada: İnsan beynindeki biomimetic (biyomimetik) yapıyı taklit ederek hafızayı katmanlara ayırıyor. Biz buna teknik dilde “Hierarchical Memory Management” diyoruz ama gelin biz “Anılar ve Bilgiler” diyelim.
1. Hafıza Mimarisi: Üç Silahşörler
Hindsight, veriyi sadece bir float[] dizisi olarak görmüyor. Üç ayrı katmanda işliyor:
- Dünya Gerçekleri (World Facts): Statik, değişmeyen genel kültür bilgileri.
- Deneyimler (Episodic Memory): “Geçen gün kullanıcı bana şunu sordu, ben de şöyle patladım” dediği anlık olaylar.
- Zihinsel Modeller (Mental Models): Zamanla bu deneyimlerden süzülen “Eğer kullanıcı X diyorsa aslında Y’yi kastediyordur” çıkarımları.
🛠 Teknik Mutfak: 4 Kanallı Geri Çağırma (Hybrid Retrieval on Steroids)
Hindsight’ı asıl canavar yapan şey, sorgu anında tek bir algoritmayla yetinmemesi. Çoğu sistem sadece Cosine Similarity (Açısal Benzerlik) bakarken, Hindsight dört koldan saldırıyor:
- Semantic (Semantik): Bildiğimiz vektör araması. Anlam bazlı yaklaşım.
- Keyword (BM25/TF-IDF): “Abi tam olarak şu kelime geçiyordu” dediğimiz anlar için tam eşleşme.
- Graph (Çizgesel): Bilgiler arasındaki “A kişisi B şirketinde çalışıyor” gibi ilişkisel bağları takip eder.
- Temporal (Zamansal): İşte zurnanın zırt dediği yer. “En son ne oldu?” sorusunun cevabı burada.
Bu dört koldan gelen sonuçlar bir Reranker (Yeniden Sıralayıcı) süzgecinden geçiyor. Böylece ajanın önüne sadece “benzer” olan değil, “en alakalı ve taze” olan bilgi düşüyor.
📈 Veriler Ne Diyor? (LongMemEval Benchmark)
Hasan Toor’un (@hasantoxr) dikkat çektiği gibi, Hindsight öyle “ben iyiyim” diyip geçmiyor. LongMemEval benchmark’larında (ajanların uzun vadeli hafıza performansını ölçen testler) mevcut tüm sistemleri (MemGPT vb.) geride bırakarak SOTA (State of the Art) seviyesine oturdu.
Özellikle “Long-term context retention” (Uzun süreli bağlam koruma) testlerinde, 100+ adımlı diyaloglarda bile ajanın ilk adımdaki bir detayı unutmadığı kanıtlandı.