Google DeepMind, diğer konuşma teknolojilerinden yüzde 50 daha iyi performans sağladığını iddia eden firmanın yapay zeka ünitesinde nasıl konuşulacağını öğrendi.
Google bir blog yazısında WaveNet teknolojisinin insan dinleyicilerden gelen geri bildirimlere dayanarak, İngilizce ve Kuzey Çin lehçesi imitasyonlarının çok daha iyi üretebileceğini söyledi.
Firmanın açıklamasına göre, hem Çince hem İngilizce, Googleın mevcut TTS(text-to-speech) sistemleri dünya çapında en iyileri arasında kabul edildi, böylece tek bir model ile iyileştirilmesi büyük bir başarı sağladı.
Google blog yazısında ses dosyalarının ne kadar etkileyici olduğundan bahsetti ve gelecekte hayata geçirilecek insan ve bilgisayar sohbetinin çok uzakta olmadığını açıkladı. Ancak insan-bilgisayar etkileşiminin etkileri sıradan hale gelmeden önce biraz zaman alacak, Google bu çıktıyı üretmek için gerekli bilgisayar gücünün çok yüksek olduğunu kabul etti.
Google, WaveNetin müzik oluşturabileceğini ve piyano müziğinin bazı ilginç örneklerini gönderdiğini söyledi.
Son düzenleme:


