Yapay Zekanın Balık Hafızası Problemi ve CogMem AI: LLM'leri "Dory" Olmaktan Kurtarmak

İşte tam bu noktada, Veriteknik ekibinin blogunda kaleme aldığı “AI Agent Memory Problem: CogMem AI” konulu o nefis yazısına ve vizyonuna denk geldim. Gelin bugün sizinle, yapay zekanın bu sinir bozucu amnezi krizini ve CogMem (Cognitive Memory) mimarisinin bu işi nasıl kökten çözdüğünü, kahvelerimizi yudumlayarak ve biraz da işin mutfağına inerek konuşalım.

RAG Neden Yetersiz Kaldı? (Kütüphaneci vs. İş Arkadaşı)

Sektörde uzun süredir “Modelin hafızası yetmiyorsa RAG (Retrieval-Augmented Generation) kullan geç abi” gibi bir algı var. Vector database’leri ayağa kaldırıp dokümanları içine fırlatıyoruz ve sorunun çözüldüğünü sanıyoruz. Oysa RAG, sadece çok hızlı koşan panik bir kütüphanecidir. Siz bir şey sorduğunuzda arşive koşar, ilgili sayfayı bulur ve önünüze atar. Ancak o sayfayı sizinle birlikte okuyup, dünkü tartışmanızla bağdaştırıp, “Ha, sen aslında şu dünkü veritabanı göçüyle ilgili soruyorsun” demez.

Statik bir önbellek (cache) mantığıyla çalışan eski sistemlerin aksine, bizim oturumlar arası (cross-session) tutarlı bir mantık yürütebilen, olayları “hatırlayan” ve gereksizleri “unutan” organik bir yapıya ihtiyacımız var.

Sahneye CogMem Giriyor: İnsan Zihninin Dijital Kopyası

Aralık 2025’te araştırmacıların yayınladığı ve Veriteknik’in de kendi ajan sistemlerinde (özellikle Morpheus DevOps ajanı gibi projelerde) feyz aldığı CogMem mimarisi, olaya tam bir bilgisayar bilimcisi gibi değil, bir bilişsel bilimci gibi yaklaşıyor.

CogMem, yapay zekanın hafızasını üç ana katmana bölüyor. Bunu bizim anladığımız dilden, bilgisayar donanımıyla eşleştirerek anlatalım:

Focus of Attention (FoA) / Odak Noktası (CPU Register): O anki turn (sıra) için gereken en minimal ve rafine context. Modelin “Şu an tam olarak ne yapıyorum?” sorusunun cevabı. Token israfını ve modelin halüsinasyon görmesini engelleyen en dar ve en hızlı katman.
Direct Access (DA) / Doğrudan Erişim (RAM): O anki oturumun (session) kısa notları. Görüşme boyunca modelin arkada kendi kendine tuttuğu “geliştirici Python 3.12 kullanıyor, type hint seviyor” gibi kısa vadeli durum özetleri. Kullanıcıya cevap verilirken asenkron olarak güncelleniyor, yani bizi bekletmiyor.
Long-Term Memory (LTM) / Uzun Vadeli Bellek (SSD/Arşiv): Günler veya aylar önceki oturumlardan çıkarılan dersler, stratejiler ve konsolide edilmiş gerçekler. Bu katman devasa bir metin çöplüğü değildir; sadece pekiştirilen ve değerli olan “bilgeliği” tutar. Tıpkı insan beyninin gece uyurken gereksiz anıları silip önemli tecrübeleri kalıcı hafızaya yazması gibi.

Veriteknik Bize Ne Anlatmaya Çalışıyor?

Veriteknik’in araştırmalarında ve ajan mimarilerinde beni en çok etkileyen kısım, yapay zeka ajanlarını “başıboş mermiler” olmaktan çıkarıp, güvenilir birer altyapı yöneticisine dönüştürme çabası. Sadece CogMem’in akademik sınırlarında kalmayıp, işin içine “Prosedürel Bellek” ve “Panik Belleği” gibi kendi zvec mimarisi konseptlerini de katarak, ajanları adeta birer Starfleet subayına dönüştürüyorlar.

Düşünün; sunucunuzda bir kernel panic yaşandığında, ajanın aylar önceden kalan “Bu adamın sunucusunda şu spesifik port konfigürasyonu var” bilgisini uzun vadeli bellekten (LTM) saniyesinde Doğrudan Erişim’e (DA) çekmesi ve hatayı sizin yerinize çözmesi. Üstelik bunu yaparken token limitlerine takılıp saçmalamaması. İşte otonom devrim tam olarak budur.

Geliştirici Gözüyle: Artık Goldfish Eğitmiyoruz

Hepimiz biliyoruz ki, bir LLM’e context window sınırlarını zorlayacak kadar prompt yığdığınızda model “Lost in the Middle” (ortadakini unutma) sendromuna girer. CogMem mimarisinde ise kompleks çıkarım (inference) işlemleri ile hafıza yönetimi birbirinden ayrılır. Hafıza ajanı arka planda hafif (lightweight) bir model olarak çalışıp sürekli not tutar, özet çıkarır ve arşivi düzenler.

Bu da biz geliştiriciler için şu anlama geliyor:

Daha Az Maliyet: Her API çağrısında 128K token gönderip cüzdanı deldirmeyeceğiz.
Daha Az Spagetti Kod: Ajan, projenizin mimari kararlarını uzun vadeli belleğinde tutacağı için her seferinde tekerleği yeniden icat etmeyecek veya mimariyi bozacak önerilerle gelmeyecek.
Gerçekçi Öğrenme Eğrisi: AI bir hata yaptığında, bu hatayı kalıcı hafızaya yazıp bir sonraki projede aynı tuzağa düşmeyecek.

“Hafıza, hepimizin yanında taşıdığı bir günlüktür.”
Oscar Wilde

Yapay zekanın günlüğü bugüne kadar her gün sıfırlanıyordu. Her sabah uyanıp “Ben kimim, bu legacy kod neyin nesi?” diyen bir stajyerle çalışıyorduk. CogMem ve Veriteknik’in üzerinde durduğu hafıza mimarileri sayesinde, o günlüğe nihayet kalıcı mürekkeple yazmaya başlıyoruz. Artık stajyerimiz büyüyor ve masanın karşısında gerçekten bizimle birlikte yaşlanan, kod tabanını bizim kadar iyi tanıyan otonom bir meslektaşa dönüşüyor.

CogMem-AI Morpheus Ajanı hakkında daha fazla bilgi için Veriteknik blog sayfasını ziyaret etmeyi unutmayın: https://veriteknik.com/blog/ai-agent-memory-problem-cogmem-ai

Teknolojiyle kalın, hafızanızı taze tutun.

RAG Neden Yetersiz Kaldı? (Kütüphaneci vs. İş Arkadaşı)

Sahneye CogMem Giriyor: İnsan Zihninin Dijital Kopyası

Veriteknik Bize Ne Anlatmaya Çalışıyor?

Geliştirici Gözüyle: Artık Goldfish Eğitmiyoruz

Bir yanıt yazın Yanıtı iptal et