xAI'dan Grok Voice Agent Builder: Kod Yazmadan İnsan Benzeri Sesli Yapay Zekâ Asistanları Geliştirilebilecek
xAI, geliştiricilerin ve işletmelerin kod yazmadan insan benzeri sesli yapay zekâ asistanları oluşturmasını sağlayan Voice Agent Builder platformunu duyurdu. Yeni platform, Grok Voice altyapısını kullanarak doğal konuşmalar gerçekleştirebilen sesli ajanların dakikalar içinde hazırlanmasına olanak tanıyor.
Şirket, yeni platformun özellikle yüksek hacimli müşteri görüşmeleri gerçekleştiren ekipleri hedeflediğini belirtiyor. Kullanıcılar, sıfırdan bir ses altyapısı kurmak yerine hazır bileşenlerle kısa sürede üretim seviyesinde sesli ajanlar geliştirebiliyor.
https://twitter.com/xai/status/2072342803787702422
Tek platformda tüm sesli yapay zekâ altyapısı
Voice Agent Builder; telefon entegrasyonu (telephony), bilgi erişimi (knowledge retrieval), harici araç entegrasyonları, güvenlik önlemleri (guardrails), Model Context Protocol (MCP) desteği ve gözlemlenebilirlik (observability) gibi bileşenleri tek bir platformda sunuyor.
Mevcut sistemlerini korumak isteyen şirketler için de esnek entegrasyon seçenekleri bulunuyor. Kullanıcılar mevcut telefon numaralarını SIP üzerinden taşıyabiliyor, kendi API'lerini ve MCP sunucularını bağlayabiliyor veya WebSocket aracılığıyla mevcut istemcilerini sisteme entegre edebiliyor.
Üç ayrı API yerine tek ses modeli
xAI'ye göre geleneksel sesli yapay zekâ sistemleri genellikle üç farklı hizmeti bir araya getiriyor:
- Konuşmayı metne dönüştürme (Speech-to-Text) - Büyük dil modeli (LLM) - Metni sese dönüştürme (Text-to-Speech)
Bu yapı her aşamada ek gecikme, maliyet ve hata riski oluşturuyor.
Voice Agent Builder ise Grok Voice'un uçtan uca konuşmadan konuşmaya (speech-to-speech) mimarisi üzerinde çalışıyor. Böylece ses işleme süreci tek model etrafında gerçekleşirken hem gecikmenin azaltılması hem de daha doğal konuşmaların sağlanması hedefleniyor.
Zorlu gerçek dünya çağrılarıyla eğitildi
xAI, Grok Voice'un eğitiminde gerçek hayattaki en karmaşık çağrı senaryolarını kullandığını açıkladı. Model;
- Düşük kaliteli telefon sesleri, - Arka plan gürültüsü, - Güçlü bölgesel aksanlar, - Kullanıcının sözünü kesmesi, - Cümle ortasında fikrini değiştirmesi, - Çok adımlı ve belirsiz iş akışları
gibi gerçek çağrı merkezi koşullarına göre optimize edildi.
Şirket ayrıca sistemin 25'ten fazla dili desteklediğini ve performansın bu tür zorlu senaryoları temel alan τ-voice Bench adlı değerlendirme sistemiyle ölçüldüğünü belirtti.
Beta sürümünde kullanıma açıldı
Voice Agent Builder bugün beta olarak erişime açıldı. Platform, dakikası 0,05 dolar kullanım ücretiyle sunuluyor. Kullanım bazlı fiyatlandırma modeli sayesinde işletmeler yalnızca gerçekleştirdikleri sesli görüşmeler kadar ödeme yapıyor.
xAI'nin yeni platformu, özellikle müşteri hizmetleri, satış, teknik destek ve çağrı merkezi otomasyonu gibi alanlarda sesli yapay zekâ kullanımını hızlandırmayı hedefliyor.















