Microsoft konuşma transkripsiyonu ses oluşturma ve görüntü üretimi alanlarında üç yeni temel yapay zeka modelini tanıttı. Bu modeller Microsoft Foundry ve MAI Playground üzerinden erişime açıldı. Şirket bu hamleyle OpenAI Google ve diğer yapay zeka liderleriyle sadece dağıtım değil model geliştirme alanında da doğrudan rekabet etmeyi hedefliyor.
MAI-Transcribe-1: 25 dilde sektör lideri doğruluk ve hız
MAI-Transcribe-1, 25 dilde %3,8 Kelime Hata Oranı (WER) ile OpenAI’nin Whisper-large-v3, Google’ın Gemini 3.1 Flash ve diğer rakiplerini geride bırakıyor. Model, çift yönlü ses kodlayıcı ve transformatör tabanlı metin kod çözücü kullanıyor. 200 MB’a kadar MP3, WAV ve FLAC dosyalarını destekliyor ve Azure Fast teklifinden 2,5 kat daha hızlı toplu transkripsiyon sağlıyor. Microsoft, modeli Copilot ve Teams’de test ediyor.
MAI-Voice-1 ve MAI-Image-2: Hızlı ve gerçekçi ses ile görüntü üretimi
MAI-Voice-1 saniyede 60 saniyelik doğal ses üretebiliyor ve konuşmacı kimliğini uzun metinlerde koruyor. Özel ses oluşturma da destekleniyor. Fiyatlandırması 1 milyon karakter için 22 dolar. MAI-Image-2, Arena.ai liderlik tablosunda ilk üçte yer alıyor, Bing ve PowerPoint’te kullanılıyor ve metin girişi için 1 milyon token başına 5 dolar, görüntü çıktısı için 33 dolar fiyatlandırılıyor.
Sözleşme değişikliğiyle Microsoft’un bağımsız yapay zeka geliştirme yeteneği arttı
2019’da OpenAI ile yapılan anlaşma, Microsoft’un bağımsız yapay genel zeka geliştirmesini kısıtlıyordu. Ancak 2025’te yapılan yeniden müzakereyle Microsoft, kendi süper zeka modellerini geliştirme hakkı kazandı. OpenAI ile ortaklık ise 2032’ye kadar devam edecek.
Küçük ama yetkin ekiplerle büyük başarı
Microsoft’un yapay zeka modellerini geliştiren ekipler 10’dan az mühendis içeriyor. Bu ekipler, model mimarisi ve veri inovasyonuyla yüksek performans sağlıyor. Bu yaklaşım, yapay zeka geliştirme maliyetlerini düşürürken rekabet gücünü artırıyor.
Agresif fiyatlandırma ve rekabet stratejisi
Microsoft modellerini Amazon, Google ve diğer rakiplere kıyasla daha uygun fiyatlarla sunuyor. Bu strateji, kurumsal müşterilere maliyet avantajı sağlarken, yatırımcıların yapay zeka harcamalarının geri dönüşünü görme beklentisine yanıt veriyor.
“İnsancıl yapay zeka” vizyonu ve kurumsal odak
Microsoft, yapay zekada “insancıl yapay zeka” felsefesini benimseyerek, güvenlik, uyumluluk ve insan kontrolüne vurgu yapıyor. CEO Satya Nadella ve Süleyman, yapay zekanın insan çıkarlarıyla uyumlu ve kontrollü olması gerektiğini savunuyor.