IBM Watson’ın yapay zekâ algoritma geliştirme süreci

IBM Watson’ın yapay zekâ algoritma geliştirme süreci


Yapay zekânın bugüne kadar kendini en etkin şekilde gösterebildiği ve insanı alt ettiği iki önemli başarısı var. Birincisi, 1997’de IBM Deep Blue’nun satranç şampiyonu Garry Kasparov’u yenmesi, ikincisi ve daha önemli olanıysa 2011’de IBM Watson’ın, Amerikan bilgi yarışması Riziko’da iki en başarılı insan yarışmacıyı yenmesiydi. Peki IBM Watson bunu nasıl başardı?

Riziko’da yarışma fikri nasıl ortaya çıktı?

IBM içerisinde dolaştığı iddia edilien söylentiye göre, araştırma projelerinden sorumlu müdür Charles Lickel, yapay zekâ konusunda sınırları zorlamakta oldukça istekliymiş. 2004 yılının sonbaharında bir grup arkadaşı ile akşam yemeği yerken saat 19.00’da arkadaşlarının birden masaya terkederek yan taraftaki TV bulunan bara geçtiklerini görmüş. Neler olduğunu anlamak için peşlerinden geldiğinde Riziko’nun efsanevi yarışmacısı Jenning’in arka arkaya 50. kez kazanıp kazanamayacağını izlemek için toplantıklarını görmüş.

Lickel’ın aklına o an, Riziko’da yarışabilecek bir süper bilgisayar tasarlama fikri gelmiş ve böyle bir mücaelenin hem büyük ses getireceğini hem de bir süper bilgisayarın örüntü eşleştirme ve karmaşık iletişim becerilerinin test etme anlamında gerçekten ciddi bir şans olduğunu anlamış.

Riziko’nun zorluğu

Riziko gerçekten de zorlu bir sınav olacaktı. Satranç gibi kuralları belirli olan bir mücadelede sonuç almak daha kolaydı. Çünkü bilgisayarlar, kurallara uymakya iyidirler. Ancak Riziko gibi bir yarışmada böyle net ve belirli kurallar yoktur ve sınırları daha geniştir. Eğitimli bir insanın birçok farklı kategorideki genel kültürünün sınırlarını zorlaması gerekir. Ancak bir süper bilgisayarın bunları anlaması kolay değildir. Çünkü sorular ansiklopedik formatta olacak şekilde net değildir. Farklı yollardan bağlantılar kurulması gerekir. Format gereği seyircilerin ilgisini de canlı tutabilmek adına ince espriler, ironiler ve kelime oyunları da yapılır. Bunlar da iletişimi ve anlamayı biraz daha zorlaştırır.

Ancak zorluklar bununla bitmez. Riziko’da yarışmaların hem cesur hem hızlı hem de doğru cevap veriyor olması gerekir. Hızlı olmak gerekir çünkü düğmeye ilk basan cevap hakkını elde eder. Doğru cevaplamak gerekir çünkü her yanlış cevap, yarışmayı kazandıracak olan para ödülünün azalmasına neden olur. Cesur olmak gerekir çünkü yarışmanın adının gereği olarak risk almak esastır. Süper bilgisayar için soruları anlamak ve iletişim dışında bu sorunların da üstesinden gelinmesi gerekmektedir.

En iyi rakipler seçildi

Watson’ın tüm bu teknik zorlukları aşsa bile kolay bir galibiyet alması istenmiyordu. Bu yüzden sıradan yarışmacılar yerine en iyileri seçilmişti. Üç yarışmacı ile oynanan Riziko’nun diğer iki yarışmacısı için Ken Jennings ve Brad Rutter seçilmişti. Jennings, 2004’te bu yarışmayı arka arkaya 74 kere kazanmıştı. Rutter, 2005’teki büyük şampiyonlar turnuvasında Jennings’i yenmişti. Bu iki yarışmacı da hem Riziko’da gerekli olan genel kültür açısından donanmış durumdaydı hem de yarışmanın formatına ve kurallarına son derece hakimdiler. Normal bir insan için bile son derece zor olan bu rakip, Watson için gerçek bir meydan okuma olacaktı.

IBM Watson’ın donanım gücü

Bu proje için Watson adında bir süper bilgisayar geliştirildi. Adını, IBM’in efsanevi CEO’su Thomas Watson’dan alan bu süper bilgisayarın donanımı 1997’deki Deep Blue’dan 100 kat daha güçlüydü. 1997’nin olanaklarıyla böyle bir bilgisayar yapmak mümkün olmayacaktı ama Moore Yasası’nın gereği olarak bilgisayar işlemcilerindeki üstel gelişme sayesinde x yıl sonra böyle bir proje için yeterli olacak işlem gücüne kavuşmak mümkün oldu.

Watson, 8 çekirdekli POWER7 işlemcilerle donatılmış 90 adet IBM Power 750 sunucusundan oluşuyordu. Toplamda 2.880 POWER7 işlemcisi ve 16 terabyte belleği vardı. 3 milyon dolara mal olan Watson, 80 TeraFLOP’luk işlem kapasitesine sahipti ve saniye 500GB veriyi işleyebiliyordu.

IBM Watson’ın yazılım altyapısı

IBM Watson, DeepQA adlı soru cevaplama yazılımı kullanıyordu. Watson için oluşturulan sistem Java, C++ ve Prolog gibi farklı dillerde yazılmıştı ve SUSE Linux Enterprise Server 11 işletim sistemi ile çalıştırılıyordu.

IBM Watson’ın DeepQA algoritması

Algoritma geliştirme süreci

Projenin başındaki David Ferrucci, daha en başında sıfırdan başlanması gerektiğini ve bunun 5 yıl sürecek bir uğraş olacağı anlamıştı. Ferrucci, IBM yönetimini ikna ederek dünyanın en gelişmiş yapay zekâ mimarisini oluşturmak üzere işe koyuldu. Kurduğu ekibe IBM’in yapay zekâ uzmanlarının yanı sıra MIT ve Carnegie Mellon’ın araştırmacılarını da dahil etti.

Watson’ın veritabanı

20 kişiden oluşan ekip, Watson’ın cevaplarına temel oluşturacak başvuru kaynağını hazırlamak için veri bankasına ansiklopediler, sözlükler, gazete arşivleri, referans kitapları, edebi eserler, internet siteleri ve hatta Wikipedia’yı içeren 15 terabyte büyüklüğünde 200 milyon sayfadan bir veri yığını yüklediler. Daha sonra yarışmanın daha önce yayınlanmış bölümlerinde kullanılan 180 binin üzerindeki soruyu da veritabanına dahil ettiler.

Algoritmalar

Ekip, Watson’ın bahis stratejisini geliştirmek için en iyi insan yarışmacıların performans ölçülerini kullandılar. Watson’ın geliştirilmesi için, metin içinde arama yapan, tarihleri, zamanları ve yerleri karşılaştıran, soruların gramerini analiz eden ve ham bilgiyi istenen formata dönüştüren türden, her biri farklı bir amaca yönelik binlerce algoritma yazıldı.

Watson ilk olarak soruları parçalara ayırıyor, sözcükleri inceliyor ve tam olarak ne araması gerektiğini anlamaya çalışıyordu. Soruyu anladıktan sonra Watson, yüzlerce algoritmayı paralel olarak çalıştırıyor ve her algoritma, Watson’ın belleğindeki başvuru kaynağından doğru cevabı bulacak bir yöntemi deniyordu. Birbirine paralel çalışan bu yüzlerce algoritma birer cevap oluşturacak döndükten sonra Watson bu alternatif cevapları karşılaştırıp bir uygunluk sıralaması oluşturuyordu. Bunu sağlamak için Watson’ın kullandığı teknik, potansiyel cevabı orijinal soru cümlesine yazıp arama yapılan başvuru metinlerinde ilgili ifadenin geçip geçmediğini kontrol etmekti.

Watson, alternatif cevaplar için uygunluk sıralaması oluştururken kendi geçmişini de dikkate alıyordu. Geçmişte hangi algoritmaların hangi soru tiplerinde daha başarılı olduğunu biliyor ve o algoritmanın getirdiği cevapları önceliklendiriyordu.

Hız ve doğru cevap dengesi

Watson’ın doğru cevabı bulması yetmiyordu. Cevapların doğruluğundan emin olarak hızlı bir şekilde karar vermesi de gerekiyordu. Projenin başlamasından kısa bir süre sonra nispeten agresif bir yaklaşımla programlanıp, soruların %70’ine cevap verecek duruma getirildi ancak doğru cevap oranı %15’ti. Watson’ın yarışmada karşılaşacağı en güçlü rakibi Jennings %70 oranında butona ilk basan kişi olurken %90 oranında doğru cevap veriyordu. Watson, 2010’a gelindiğinde hızlı hareket etme ve doğru cevap verme arasındaki dengeyi daha iyi kurabilir hale gelmişti. %70 oranında butona ilk basarken doğru cevap oranı %85’e yükselmişti. Bu, son derece çarpıcı bir gelimeydi ancak insan rakipleri yenmek için hâlâ yetersizdi. Ekip, yarışmanın yayınlanacağı 2011 yılı Ocak ayı ortalarına kadar bunun üzerinde çalışmaya devam etti. Watson’ın nihai performansı bu gerçek karşılaşmada belli olacaktı.

Riziko: IBM Watson, en iyi insan yarışmacılara karşı

Büyük an gelmişti. Watson, iki kez karşılaştığı rakiplerini rahatça yendi. Mükemmel değildi ama gayet başarılıydı. Aynı zamanda her iki rakibinden daha hızlıydı. İki yarışmada Watson, butona 43 kez basarken 38 doğru yanıt verdi. Jennings ve Rutter ise toplamda 33 kez butona basabildi. İki günlük turnuvanın sonunda Watson 77.147 dolarlık para ödülü kazandı. Bu miktar, diğer iki insan rakibinin üç katıydı.

IBM Watson’ın Ken Jennings ve Brad Rutter’la mücadelesi.

Yarışmanın ikincisi Jennings olmuştu. Turnuvanın son sorunu cevaplarken Jenning şu notu düşmüştü:

“Her şeyden önce bilgisayarların yeni efendisini tebrik ederim. Yirminci yüzyılda robotlar, birçok fabrika işçisini işinden etti. Brad ve ben ise yeni ‘düşünen’ makineler tarafından oyun dışı bırakılan ilk bilgi sektörü işçileriyiz. Yarışmacılık, Watson’ın ipini çektiği ilk iş olabilir ama son olmayacağına eminim.”

IBM Watson’a kaybeden Ken Jennings’sin Ted konuşması: “Watson, Riziko ve ben. Modası geçmiş ‘her şeyi bilen adam'”.

Turnavanın iki yarışması 14 ve 15 Şubat 2011 tarihlerinde yayınlandı. Bu, yapay zekânın ve bilgisayarların bugüne kadarki en büyük zaferiydi.

IBM Watson’ın tıpta kullanımı

Watson’ın odağa yönelik çalışması başarıyı getirmişti. Geliştirilen bu süper bilgisayarın daha sonra tıpta teşhis koymak amacıyla da kullanılması fikri ortaya çıktı. Watson; tıp kitapları, bilimsel dergiler, klinik çalışmalar ve hatta doktor ve hemşirelerin hastalarla ilgili notlarından oluşan ve bir doktorun başa çıkamayacağı miktardaki devasa bir tıbbi bilgi verisini tarayarak, o ana kadar farkedilmemiş ilişkileri ortaya çıkarabilirdi.

2013 yılına gelindiğinde Watson, tanı koyma ve taedavi planlama konusunda doktorlara yardımcı olmaya başladı. İnsana verilen bir mücadele için oluşturulan bu bilgisayar, insanlığa faydalı bir araca dönüşmüştü.

Referanslar

+ Yorum bulunmuyor

Yorum Yaz