Fransız yapay zeka girişimi Mistral, dizüstü bilgisayarlar ve telefonlar gibi kenar cihazlarda çalışmak üzere tasarlanmış ilk üretken yapay zeka modellerini piyasaya sürdü. “Les Ministraux” olarak adlandırılan bu yeni model ailesi, temel metin üretiminden daha karmaşık görevleri tamamlamak için daha yetenekli modellerle birlikte çalışmaya kadar çeşitli uygulamalar için kullanılabilir veya uyarlanabilir.
Les Ministraux Modelleri: Ministral 3B ve Ministral 8B
Şu anda iki Les Ministraux modeli mevcut:
- Ministral 3B
- Ministral 8B
Her iki model de 128.000 token’lık bir bağlam penceresine sahip, bu da yaklaşık 50 sayfalık bir kitabın uzunluğunu işleyebilecekleri anlamına geliyor.
Mistral, blog gönderisinde şunları belirtti: “En yenilikçi müşterilerimiz ve ortaklarımız, cihaz üzerinde çeviri, internetsiz akıllı asistanlar, yerel analitik ve otonom robotik gibi kritik uygulamalar için giderek daha fazla yerel, gizlilik odaklı çıkarım talep ediyorlar. Les Ministraux, bu senaryolar için hesaplama açısından verimli ve düşük gecikmeli bir çözüm sunmak için geliştirildi.”
Kullanılabilirlik ve Fiyatlandırma
- Ministral 8B, bugün itibariyle indirilebilir durumda, ancak yalnızca araştırma amaçlı olarak.
- Mistral, Ministral 8B veya Ministral 3B’nin kendi kendine dağıtım kurulumlarıyla ilgilenen geliştiricilerin ve şirketlerin ticari lisans için kendileriyle iletişime geçmesini istiyor.
- Geliştiriciler, Ministral 3B ve Ministral 8B’yi Mistral’in bulut platformu Le Platforme ve önümüzdeki haftalarda girişimin ortaklık kurduğu diğer bulutlar aracılığıyla kullanabilecek.
- Ministral 8B, milyon çıktı/giriş token’ı başına 10 cent (~750.000 kelime), Ministral 3B ise milyon çıktı/giriş token’ı başına 4 cent’e mal oluyor.
Küçük Modeller Trendi
Son zamanlarda, daha büyük muadillerine göre eğitilmesi, ince ayar yapılması ve çalıştırılması daha ucuz ve hızlı olan küçük modellere doğru bir eğilim var. Google, Gemma küçük model ailesine modeller eklemeye devam ederken, Microsoft Phi model koleksiyonunu sunuyor. Meta, Llama paketinin en son yenilemesinde, kenar donanımı için optimize edilmiş birkaç küçük model tanıttı.
Mistral, Ministral 3B ve Ministral 8B’nin, talimat takibi ve problem çözme yeteneklerini değerlendirmek için tasarlanmış çeşitli yapay zeka kıyaslamalarında karşılaştırılabilir Llama ve Gemma modellerinin yanı sıra kendi Mistral 7B modelinin de performansını aştığını iddia ediyor.
Mistral’in Büyüme Stratejisi
Paris merkezli Mistral, yakın zamanda 640 milyon dolar risk sermayesi topladı ve yapay zeka ürün portföyünü kademeli olarak genişletmeye devam ediyor. Son birkaç ay içinde şirket:
- Geliştiricilerin modellerini test etmesi için ücretsiz bir hizmet başlattı
- Müşterilerin bu modelleri ince ayar yapmasına olanak tanıyan bir SDK yayınladı
- Codestral adında kod için üretken bir model de dahil olmak üzere yeni modeller tanıttı
Meta ve Google’ın DeepMind’inden mezunlar tarafından kurulan Mistral’in belirtilen misyonu, OpenAI’nin GPT-4 ve Anthropic’in Claude gibi bugünün en iyi performans gösteren modelleriyle rekabet eden amiral gemisi modeller oluşturmak ve idealde bu süreçte para kazanmak. “Para kazanma” kısmı zorlu olmaya devam etse de (çoğu üretken yapay zeka girişimi için olduğu gibi), Mistral’in bu yaz gelir elde etmeye başladığı bildirildi.
Bu gelişmeler, yapay zeka alanında kenar cihazlara yönelik modellerin önemini ve küçük, verimli modellere olan ilginin artışını gösteriyor. Linux ve açık kaynak topluluğu için bu tür modeller, gizlilik odaklı ve yerel çalışan uygulamalar geliştirmek açısından büyük potansiyel taşıyor.