Ses temelli yapay zeka teknolojileri işletmeler için büyük bir hızla gelişmeye devam ederken, bu alandaki dikkat çekici adımlardan biri ElevenLabs'ten geldi. Eski Palantir mühendisleri tarafından kurulan ve ses teknolojileri üzerine yoğunlaşan şirket, ne zaman susacağını ve konuşacağını anlayan Conversational AI 2.0 adlı yeni nesil sesli asistan platformunu resmi olarak duyurdu.
Sadece dört ay önce ilk versiyonunu piyasaya süren ElevenLabs, bu hızlı güncellemeyle sektördeki iddiasını bir kez daha ortaya koyuyor. Yeni sürüm; müşteri hizmetleri, çağrı merkezleri, satış ve pazarlama gibi kurumsal uygulamalara yönelik çok sayıda gelişmiş özellik sunuyor.
Gerçek zamanlı ve doğal diyaloglar
Conversational AI 2.0’ın en dikkat çeken yeniliklerinden biri, gelişmiş “dönüş alma” (turn-taking) modeli. Bu teknoloji, insanlar arasındaki konuşmaların doğallığını taklit ederek, sistemin ne zaman konuşacağını ve ne zaman dinleyeceğini anlamasını sağlıyor. Tereddütler, dolgu kelimeleri gibi nüansları analiz edebilen bu model, özellikle müşteri hizmetleri gibi hızlı ve akıcı yanıtların önemli olduğu alanlar için ideal.
Yeni platform aynı zamanda otomatik dil algılama yeteneğine de sahip. Kullanıcının konuştuğu dili gerçek zamanlı olarak tanıyıp, aynı etkileşim içerisinde bu dile uygun şekilde yanıt verebilen sistem, çok uluslu şirketler için büyük kolaylık sağlıyor. Bu özellik, dil bariyerlerini ortadan kaldırarak daha kapsayıcı bir deneyim sunmayı hedefliyor.
Conversational AI 2.0, aynı zamanda Retrieval-Augmented Generation (RAG) entegrasyonuyla dikkat çekiyor. Bu sistem sayesinde sesli asistanlar, harici bilgi kaynaklarına erişerek anlık ve doğru bilgiler sunabiliyor. Örneğin bir sağlık kurumunda, yapay zeka destekli asistan tedavi protokollerini doğrudan kurumun veri tabanından çekebiliyor. Müşteri hizmetlerinde ise ürün bilgileri gibi içeriklere erişim kolaylaşıyor.
Çoklu karakter özelliği de var
ElevenLabs’in yeni platformu çok modlu iletişim desteğiyle hem sesli hem yazılı yanıt verebiliyor. Bu sayede geliştiricilerin her kanal için ayrı tanımlar yapmasına gerek kalmıyor. Ayrıca sistem, çoklu karakter moduyla tek bir asistanın farklı “kişiliklere” bürünmesini sağlıyor. Eğitim simülasyonlarından yaratıcı içerik üretimine kadar pek çok alanda bu özellikten yararlanmak mümkün.
Kurumsal ölçekte toplu dış aramalar da artık mümkün. Şirketler aynı anda çok sayıda müşteriye ulaşarak anket, bilgilendirme veya kişisel mesaj gönderimi gerçekleştirebiliyor. Bu sayede operasyonel verimlilik artarken manuel iş yükü azalıyor.
Güvenlik, uyumluluk ve fiyatlandırma
Conversational AI 2.0, HIPAA uyumluluğu sayesinde sağlık gibi yüksek güvenlik gerektiren alanlarda rahatlıkla kullanılabiliyor. Avrupa’daki veri egemenliği kurallarına uyum için ise AB veri barındırma seçeneği sunuluyor. Platform ayrıca yüksek erişilebilirlik ve üçüncü parti sistemlerle entegrasyon gibi kurumsal düzeyde güvenlik standartlarına da sahip.
ElevenLabs’in platform için sunduğu güncel abonelik planları şu şekilde:
Free – $0/ay: 15 dakika, 4 eşzamanlı kullanım, ticari lisans yok
Starter – $5/ay: 50 dakika, 6 eşzamanlı kullanım
Creator – $11/ay (indirimli): 250 dakika, 6 eşzamanlı kullanım
Pro – $99/ay: 1.100 dakika, 10 eşzamanlı kullanım
Scale – $330/ay: 3.600 dakika, 20 eşzamanlı kullanım
Business – $1.320/ay: 13.750 dakika, 30 eşzamanlı kullanım