Aldığı sonuçlarla dünyayı şaşırtan AlphaGeometry, Google DeepMind tarafından geliştirilen bir yapay zeka (YZ) problem çözme sistemi. Bir yıl önce, YZ, Uluslararası Matematik Olimpiyatı (IMO) gibi prestijli bir yarışmada gümüş madalya seviyesinde performans sergiledi.
DeepMind ekibi, güncellenmiş AlphaGeometry2’nin, ortalama altın madalya kazananının seviyesini aştığını açıkladı.
İngiltere Imperial College’dan matematikçi Kevin Buzzard, “Bilgisayarların IMO’da tam puan alması uzun sürmeyecek,” dedi.
IMO sorunlarının dört ana konusundan biri olan Öklidyen geometrisi, YZ’den belirli beceriler talep ediyor. Geometri problemlerinde, katılımcıların geometrik nesnelerle ilgili ifadeler için titiz bir kanıt sunması gerekiyor. Temmuz ayında, AlphaGeometry2, IMO soru setindeki geometrik olmayan soruları çözmek için geliştirilen AlphaProof ile birlikte duyuruldu.
AlphaGeometry, özel bir dil modelinin ve insan tarafından kodlanmış soyut akıl yürütme yeteneğine sahip bir ‘nöro-sembolik’ sistemin birleşimi. Ekip, dil modelini resmi matematiksel bir dilde konuşacak şekilde eğitti, bu da çıktılarının mantıksal geçerliliğini otomatik olarak kontrol etmeyi sağladı.
AlphaGeometry2 için yapılan geliştirmeler arasında, Google’ın en son büyük dil modeli Gemini’nin entegrasyonu bulunuyor. Ekip, geometrik nesneleri hareket ettirerek akıl yürütme yapabilme yeteneği ekledi ve doğrusal denklemleri çözme yeteneği kazandırdı.
Sistem, son 25 yılda Matematik Olimpiyatında sorulan tüm geometri problemlerinin %84’ünü çözerken, ilk AlphaGeometry için bu oran %54’tü. Hindistan ve Çin ekipleri, geçen yıl daha küçük bir IMO geometri problemi kümesi üzerinde altın madalya seviyesinde performans gösterdi.
DeepMind makalesinin yazarları, AlphaGeometry’nin gelecekteki iyileştirmelerinin eşitsizlikler ve doğrusal olmayan denklemleri içereceğini, böylece “geometrinin tam olarak çözümlenmesini” sağlayacağını belirtti.
Genel testte altın madalya puanı alacak ilk YZ sistemi, AI Matematik Olimpiyatı Ödülü olarak bilinen 5 milyon dolarlık ödülün sahibi olabilir. Ancak bu yarışma, sistemlerin açık kaynak olmasını gerektiriyor. DeepMind açık kaynak yazılımı kullanmıyor.
Buzzard, DeepMind ve diğer ekiplerin hızlı ilerlemesinden şaşırmadığını ifade etti. Ancak, bu problemlerin zorluğunu kabul ederken, konunun hala kavramsal olarak basit olduğunu ve YZ’nin araştırma matematiği seviyesindeki sorunları çözmesi için daha pek çok zorluğun aşılması gerektiğini ekledi.
YZ araştırmacıları, Temmuz ayında Avustralya’nın Sunshine Coast kentinde yapılacak IMO’nun bir sonraki versiyonunu dört gözle bekliyor.
İnsan katılımcılar için sorunlar kamuya açıklandığında, YZ tabanlı sistemler de bu sorunları çözebilecek. Ancak, YZ ajanları yarışmalara katılamayacak ve madalya kazanma hakkına sahip olmayacaklar.
Yeni sorunlar, makine öğrenimi tabanlı sistemler için en güvenilir testler olarak görülüyor, çünkü bu sorunların veya çözümlerinin çevrimiçi olarak mevcut olma riski yok.