OpenAI, API platformuna yeni sesli AI modelleri ekledi

OpenAI, geliştiricilere yönelik API platformunda üç yeni ses modelini duyurdu. Şirket, yeni modellerle birlikte gerçek zamanlı çalışan daha doğal, daha akıllı ve çok dilli ses deneyimlerinin geliştirilebileceğini açıkladı.

Duyuruda öne çıkan GPT-Realtime-2, GPT-5 seviyesinde muhakeme yeteneklerine sahip ilk gerçek zamanlı ses modeli olarak tanıtıldı. Model konuşma sırasında bağlamı koruyabiliyor, kullanıcı taleplerini daha iyi anlayabiliyor ve gerektiğinde araç kullanımıyla görev akışını sürdürebiliyor.

OpenAI’nin tanıttığı GPT-Realtime-Translate ise 70’ten fazla giriş dilini destekleyerek konuşmaları gerçek zamanlı şekilde çevirebiliyor. Şirket, modelin müşteri hizmetleri, eğitim, etkinlikler ve küresel iletişim gerektiren platformlarda kullanılabileceğini belirtiyor.

Bir diğer yeni model olan GPT-Realtime-Whisper ise konuşma sırasında canlı transkripsiyon sağlayabiliyor. Böylece geliştiriciler, anlık konuşma-metin dönüşümü sunan uygulamalar geliştirebiliyor.

OpenAI, yeni modellerle birlikte sesli AI sistemlerinin yalnızca konuşmaya yanıt veren yapılardan çıkarak, dinleyebilen, muhakeme yürütebilen, çeviri yapabilen ve konuşma akışı devam ederken işlem gerçekleştirebilen yapılara dönüştüğünü vurguluyor.