1. Anasayfa
  2. Yapay Zeka

Kumru Aı, Türkiye’nin İlk Büyük Dil Modelini İnceledik

Kumru Aı, Türkiye’nin İlk Büyük Dil Modelini İnceledik
0

Türkiye’de yapay zekâ çözümleri genellikle yabancı şirketlerin modelleri üzerinden yürütülüyor, bu da hem veri gizliliği hem de mevzuat açısından kurumlar için ciddi sorunlar doğuruyor. İşte tam bu noktada, VNGRS tarafından geliştirilen Kumru yapay zekâ modeli, tamamen Türkçe verilerle eğitilmiş ilk büyük dil modeli olarak ortaya çıkıyor. Kumru’nun hedefi, Türk kurumlarının yapay zekâya güvenli şekilde erişmesini sağlamak ve yabancı servislerin eksik kaldığı noktalarda yerli bir alternatif sunmak.

Model, 7,4 milyar parametreye sahip ve yalnızca 16 GB VRAM’e sahip ekran kartlarında bile çalışabiliyor. Bu özelliğiyle, yüksek donanım yatırımı olmadan kurum içi bilgisayarlarda kullanılabiliyor ve maliyet avantajı sağlıyor. Ayrıca Kumru’nun 8192 token bağlam penceresi sayesinde uzun metinleri, yani yaklaşık yirmi sayfayı tek seferde işleyebilmesi kurumsal doküman analizi için önemli bir avantaj oluşturuyor.

Kumru’nun Kurumsal Önemi

Kumru 2

Türkiye’de birçok kurum, KVKK ve diğer yerel regülasyonlar nedeniyle bulut tabanlı yabancı yapay zekâ servislerini doğrudan kullanamıyor. Kumru, on-premise kurulabilmesi sayesinde verinin kurum içinde kalmasını garanti ediyor ve dışa bağımlılığı azaltıyor. Özellikle kamu kurumları, bankalar, sağlık sektörü ve savunma sanayii gibi kritik alanlarda bu yapı büyük değer sağlıyor.

Çağrı merkezlerinde müşteri sorularını anlama, uzun belgeleri özetleyerek çalışanların iş yükünü azaltma ve bilgi yönetim sistemlerinde akıllı arama gibi senaryolarda Kumru verimli şekilde kullanılabiliyor. Ayrıca RAG mimarileriyle entegre edilerek kurumların kendi arşivlerindeki dokümanlara dayalı doğru yanıtlar üretebiliyor. Kısacası Kumru, sadece bir yapay zekâ denemesi değil, kurumsal dönüşümün stratejik bir parçası olabilecek bir platform.

Teknik Yapı ve Eğitim Süreci

Kumru, modern transformer mimarisiyle yalnızca çözücü (decoder-only) katmanlarını kullanarak tasarlanmış bir modeldir. En dikkat çekici tarafı ise Türkçe için özel olarak geliştirilmiş tokenizer’dır. Türkçe kelimeler çoğunlukla eklerle uzadığı için mevcut yabancı tokenizer’lar bu kelimeleri parçalayarak çok sayıda token üretir. Kumru’nun tokenizer’ı ise bu sorunu ortadan kaldırarak Türkçe metinleri verimli şekilde işler, böylece hem eğitim hem de kullanım sırasında büyük bir hız ve maliyet avantajı sağlar.

Modelin eğitimi yaklaşık 500 GB’lık bir veri seti üzerinde yapılmıştır. Bu verilerin büyük kısmı Türkçe web siteleri, haber arşivleri ve Vikipedi içeriklerinden oluşur. Veri setinin yalnızca küçük bir bölümü İngilizce metinler ve kodlardan oluşmuştur. Bu sayede Kumru, Türkçe anlama ve üretme konusunda güçlü bir kapasite kazanırken, temel seviyede İngilizce ve teknik içerikleri de işleyebilme becerisine sahip olmuştur. Eğitim sürecinde toplamda yüz milyarlarca token işlenmiş ve model sıfırdan öğrenme yaklaşımıyla geliştirilmiştir.

Sosyal Medya ve Resmi Açıklamalar

Kumru, tanıtıldığı günlerden itibaren X platformunda yoğun şekilde tartışıldı. Kullanıcıların bir kısmı modelin Türkçe’deki başarısını övdü, ancak en çok gündeme gelen nokta matematik hataları oldu. Örneğin “2 kere 5 kaç eder?” sorusuna “100” yanıtı vermesi veya işlem önceliğinde yanlış sonuç üretmesi sosyal medyada büyük yankı uyandırdı. Bu hatalar hızla ekran görüntüleriyle paylaşıldı ve Kumru kısa sürede viral hale geldi.

Geliştirici ekip VNGRS, bu durum karşısında şeffaf bir şekilde açıklama yaptı. Kumru’nun ChatGPT’ye rakip bir son kullanıcı ürünü olmadığını, asıl amacının kurumsal ihtiyaçlara hizmet etmek olduğunu vurguladı. Ayrıca modelin henüz RLHF (pekiştirmeli öğrenme) aşamasından geçmediğini, bu nedenle matematik ve mantık zinciri görevlerinde hata yapmasının normal olduğunu belirtti. Yol haritasında Kumru’ya bu eğitim aşamasının uygulanacağı ve hataların büyük ölçüde azaltılacağı ifade edildi. Aynı zamanda multimodal yeteneklerin ekleneceği, yani görsel içeriklerin de işlenebileceği yeni sürümlerin geliştirileceği paylaşıldı.

ChatGPT ve Gemini ile Karşılaştırma

Kumru, ChatGPT ve Google Gemini ile kıyaslandığında bazı yönlerden geride kalsa da, belirli alanlarda stratejik avantajlara sahip. ChatGPT, yüz milyarlarca parametreli güçlü mimarisiyle mantık yürütme, dünya bilgisi ve kod üretiminde oldukça başarılıdır. Gemini ise multimodal yapısıyla metin, görüntü, ses ve kodu birlikte işleyebilir, bu da onu güncel olarak en gelişmiş modellerden biri yapar. Buna karşın Kumru’nun asıl gücü Türkçe’deki üstünlüğü ve kurum içi kurulum imkânıdır.

ÖzellikKumruChatGPT (GPT-4)Gemini (Ultra/Pro)
OdakTürkçe, kurumsal kullanımGenel amaç, çok dilliMultimodal, geniş görevler
Parametre7,4B>175B (kesin açıklanmadı)Açıklanmadı (çok büyük)
ModaliteMetinMetin + GörüntüMetin + Görüntü + Ses + Kod
Güçlü YönTürkçe NLP verimliliğiMantık, bilgi ve kodlamaMultimodal üstünlük
Eksik YönMatematik ve mantık zinciri

Kumru, Türkiye’de yapay zekâ ekosistemine önemli bir katkı sağlıyor. Henüz başlangıç aşamasında olmasına rağmen Türkçe’yi merkeze alarak eğitilmiş olması, onu küresel modellere kıyasla yerel ihtiyaçlarda avantajlı kılıyor. Veri gizliliği, kurum içi kurulum imkânı ve Türkçe’ye özgü yüksek doğruluk oranı sayesinde özellikle bankalar, kamu kurumları ve sağlık sektörü gibi alanlarda tercih edilebilir.

ChatGPT ve Gemini gibi küresel modeller halen performans açısından çok daha güçlü olsa da, Kumru Türkçe odaklı iş yüklerinde stratejik bir boşluğu dolduruyor. Yol haritasındaki geliştirmeler tamamlandığında, yalnızca yerli bir alternatif değil, aynı zamanda rekabetçi bir seçenek olma potansiyeline sahip görünüyor.

Bu yazı sende ne reaksiyon verdi ?
  • 0
    _tt_
    Üşüttü
  • 0
    sabr_m_zorlad_
    Sabrımı Zorladı
  • 0
    ayd_nlatt_
    Aydınlattı
  • 0
    rahatlatt_
    Rahatlattı
  • 0
    mutlu_etti
    Mutlu Etti

Sağlam oku, " Mühendis ol "

Yazarın Profili

Bültenimize Katılın

Hemen ücretsiz üye olun ve yeni yayınlardan anında haberdar olan ilk kişi olun.

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir