Kurumsal LLM Chatbot — RAG Tabanlı Yapay Zeka Asistanları
Şirketinizin dokümanlarını, ürün katalogunu ve SSS havuzunu cevaplayabilecek, müşteri hizmetlerini 7/24 destekleyecek kurumsal LLM asistanlarını sizin için tasarlıyoruz.
Kurumsal LLM chatbot artık "AI'ya soru sor, cevap al" senaryosu değil. Doğru kurulan bir asistan şirketinizin canlı doküman havuzunu — sözleşmeleri, ürün kataloğunu, SSS'leri, dahili wiki'yi, CRM kayıtlarını — gerçek zamanlı kaynak olarak kullanır, citation üretir, hangi soruda hangi operatöre devredeceğini bilir ve maliyeti, latency'si, doğruluğu ölçülebilir bir altyapı üzerinde çalışır. ChatGPT ya da Claude'u açıp prompt yazmak ile production seviyesi bir kurumsal chatbot kurmak arasındaki uçurum tam burada başlıyor. Biz bu altyapıyı RAG (Retrieval-Augmented Generation) disipliniyle kurgulamayı öneriyoruz; vector arama, re-ranking, prompt versiyonlama, eval harness ve gözlemlenebilirlik bizim için opsiyonel değil — bunlar olmadan bir chatbot demo olarak çalışıyor, üretimde sessizce bozuluyor.
Kurumsal LLM Chatbot ile Çözdüğümüz İş Problemleri
Müşteri hizmetleri ekipleri tekrar eden 100 farklı soruya günde yüzlerce kez aynı cevabı yazıyor; ticket kuyruğu birikiyor, gece/hafta sonu kapatılan tüm taleplere geri dönüş yapılamıyor.
Çalışanlar prosedür, sözleşme veya ürün dokümanı aramakta günde 30-60 dakika kaybediyor; Confluence, SharePoint, Notion gibi sistemler arama deneyimi açısından LLM çağına uyum sağlayamadı.
Web sitesi ziyaretçileri ürün kataloğunda istedikleri özelliği bulamadan ayrılıyor; canlı destek yokken oluşan terk oranı doğrudan satış kaybı.
Çok-dil müşteri desteği bir ekibe lokal personel demek; bir Türk SaaS şirketi 5 dilde gerçek 7/24 destek vermek için 25-40 kişilik global ekip kurmak zorunda — büyük maliyet.
SSS dokümanları her ürün güncellemesinde bayatlıyor; bilgi tabanındaki yanlış cevap kullanıcıya gidiyor ve geri dönüş döngüsü insanı yoruyor.
Yaklaşımımız
Bir kurumsal chatbot projesi bizde her zaman aynı soruyla başlıyor: chatbot'un cevabı nereden gelecek? Model kendi parametrelerinden tahmin yürütürse hallüsinasyon kaçınılmaz; doğru cevap için modeli sizin doküman havuzunuza bağlamak gerekiyor. Bu yüzden RAG mimarisini standart yaklaşımımız olarak öneriyoruz: dokümanlarınızı chunklara bölüp embedding üretmek, vector veritabanına yüklemek, kullanıcı sorgusunda en alakalı 5-10 chunk'ı çekip Cohere veya BAAI gibi re-ranker'larla sıralamak, sonra LLM'e bu bağlamla birlikte soruyu vermek. Cevap her zaman kaynak gösterimiyle dönmeli; kullanıcı hangi dokümanın hangi paragrafına bakarak cevap aldığını görebilmeli.
Bu yaklaşımı tasarım açısından nasıl uygulayabileceğimize dair bir referans: bir satış organizasyonu için kurguladığımız agentic sistem, ICP araştırması, prospect skorlaması, e-posta taslağı ve regülasyon notu üreten dahili bir asistana dönüştürülebilir bir mimariye sahipti. RAG + tool use altyapısı doğru kurulduğunda aynı temel hem müşteri-yüzü hem dahili kullanım hem de aktif satış için ölçeklenebiliyor. Bizim için "chatbot kurmak" değil, şirketinizin bilgi katmanını model-erişebilir hale getirmek asıl iş.
Süreç
Doküman İndeksleme
PDF, Word, Confluence, Notion, SharePoint, CRM kayıtları — kaynak envanterini çıkarıyoruz, chunking stratejisini (token bazlı, semantik bölme, hibrit) belgenin yapısına göre seçiyoruz. Yanlış chunking her şeyin tavanını düşürür.
Vector DB Setup
Embedding modelini (OpenAI ada-3, Cohere embed-v4 veya open-source BGE) seçip Pinecone, Weaviate veya self-host pgvector üzerine indeksi kuruyoruz. Metadata filtreleme (kullanıcı rolü, tarih, dil) ilk günden tasarımın parçası.
Retrieval + Re-ranking
İlk retrieval geniş tutuluyor (top-20), sonra Cohere Rerank 3 veya BAAI bge-reranker ile en alakalı 3-5 chunk'a iniyoruz. Re-ranking olmadan RAG doğruluğu yüzde 15-25 aşağıda kalır — bunu defalarca ölçtük.
Prompt Engineering + Eval
System prompt, citation format, low-confidence davranış kuralları yazılıyor; gold dataset üzerinde Ragas veya LangSmith eval harness'i kuruyoruz, her değişiklik regresyon testine giriyor. Prompt versiyonlama Git altında.
Üretim + Citation UI
Streaming response, citation göstergesi, kaynağa tıklanabilir link, low-confidence durumunda human handoff. LangSmith'te step-level tracing, Grafana'da latency ve maliyet/sorgu paneli — gözlem olmadan üretime almıyoruz.
Tercih Ettiğimiz Teknolojiler
Tipik tercihlerimiz aşağıdaki gibi; gizlilik gereksinimi ve kullanım senaryonuza göre adapte ediyoruz.
Sıkça Sorulan Sorular
Kurumsal Chatbot Projeniz İçin Görüşelim
15-30 dakikalık ücretsiz keşif görüşmesi. Kullanım senaryonuzu anlıyoruz, RAG'in işe yarayıp yaramayacağını dürüst söylüyoruz.
