Yeni Siri’nin daha iyi konuşabilmesinin sırrı

Yeni Siri, artık kelimeleri daha muntazam söyleniş edecek.

6 senedir hayatımızda olan Siri, iOS 11 ile beraber artık fazlaca daha organik ve akıcı şekilde konuşacak. Hatta o denli organik olacak ki, kimse bir farklılık bulunduğunu bile fark etmeyecek. Hani o asla duymadığı bir adı ya da bir yerin adını anlatmaya çalmış olduğu zamanki çekmiş olduğu, ve açıkçası bizlere çektirmiş olduğu, acı artık olmayacak.

Bu yanlış telaffuzların sebebi aslen Siri’nin ilk yapım aşamasındaki kullanılan tekniklerden kaynaklanıyor. Siri’nin ses idrak etme ve yanıt verme sistemini yazan Nuance, Susan Bennett’e (Siri’nin ilk sesi) tüm ses kombinasyonlarını alabilmek için yüzlerce değişik cümle okuttu ve bu tarz şeyleri kaydetti.

Kaydedilen cümleler anlamlı cümleler değildi elbet. Daha ziyade İngilizce için “Say the shrading again, say the shraeding again.” ya da “Fasa, ask fasa ask sati” benzer biçimde cümleler kaydedildi.

Bu değişik kayıtların arasından Siri, gelen milyonlarca soruya yanıt verebilmek için, gereksinim duyan ses kalıplarını kullandı. Elbet bunun sonucunda bazı kelimeleri “gerçek bir insan benzer biçimde” söyleniş etmekte zorlandı.

Değişiklik vakti geldi

Geçtiğimiz yıl Siri, sessiz sedasız bir yenilenmeye gitti. Apple, Siri’nin konuşma tanıma ve suali idrak etme özelliklerinde makine öğrenmesi kullanmaya karar verdi. Meydana getirilen geliştirmelerin sonucunda da başarı elde edildi.

Buradan gelen başarı ile makine öğrenmesi bu sefer Siri’nin hitabı için kullanılacak. iOS 11 ile gelecek olan Siri, yepyeni bir Siri olacak.

Apple, tam olarak detay vermese de Siri’nin herhangi bir şeyi söyleyebileceğini aktarıyor. Zira Siri’nin başarı göstermiş cümleler kurabilmesini sağlayacak teknoloji ile bizi anlaması için kullanılan teknoloji aynı.

Apple makine öğrenmesini, ya da daha derine inersek deep learning (derin öğrenme) ve neural networks (nöral ağlar) denen makine öğrenmesinin alt kırılımını kullanıyor. Bu teknolojiler beynin emek verme prensiplerini yansılamak ediyorlar.

Cevapların daha organik duyulması adına Apple, Siri’ye birçok insan hitabı dinletti. Makine öğrenmesi sistemi bu konuşmalardan insanların konuşurken iyi mi ve nerelerde nefes aldığını, tonlamalarını, vurgularını ve cümle içindeki seslerinin iyi mi değiştiğini inceledi.

Bununla birlikte bu algoritma, suni zeka ve makine öğrenmesinin enerjisini arkasına alarak anlamsal incelemeler de yapıyor. Aynı cümlede, aynı kelimeleri, cümlenin değişik yerlerinde söylerken niçin değişik söyleniş ettiğimizi de öğreniyor.

Apple Siri’nin konuşmasını daha akıcı daha insansı halletmeye niyetli. Bu sayede Siri’nin iyi mi konuştuğuna değil, bizlere ne söylediğine daha çok odaklanabileceğiz. Hele ki yeni gelecek olan Siri’nin konuşmanın gidişatını takip edebileceğini ve mevzuyu takip eden soruları anlayacağını göz önünde bulundurursak Siri’nin şimdiye kadar olduğundan daha akıcı olması gerekiyor.

Elbet bu bahsi geçenler İngilizce konuşan Siri adına gelen bilgiler. Siri dünyada 21 dil konuştuğunu ve yeni 5 dil daha eklenecek. Bakalım bu teknoloji tüm dilleri mi kapsayacak yoksa yalnız İngilizce özelinde mi olacak hep beraber ilerleyen aylarda göreceğiz.

Leave a Reply

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir