Bir Bilgisayar Kendi Sağduyusunu Öğretebilir mi?

Çok uzak olmayan bir geçmişte, bir bilgisayarın "sağduyu" gösterebileceğini öne sürmek, bir oksimoron olarak kabul edilirdi. Ancak IBM’in Watson gibi süper bilgisayarlar, bilgisayarlar için yeni roller üstlenebilir.

Şu anda, Carnegie Mellon Üniversitesi'ndeki araştırmacılar, verileri yakalamak ve kendilerine büyük ölçekte sağduyulu davranmak için 7 gün 24 saat bir bilgisayar programı yürütüyorlar.

Yazılım, Web'de görüntüleri aradığından, bunları kendi başına anlamak için elinden gelenin en iyisini yaptığından ve büyüyen bir görsel veritabanı oluşturarak büyük ölçekte sağduyu topladığından, programa Never Ending Image Learner (NEIL) adı verilir.

NEIL, bilgisayar programlarının görüntülerdeki nesneleri tanımlamasına ve etiketlemesine, sahneleri karakterize etmesine ve renkler, ışıklandırma ve malzemeler gibi nitelikleri tanımasına ve tümü minimum insan gözetiminde bulunmasına olanak tanıyan bilgisayar görüşündeki son gelişmelerden yararlanır.

Buna karşılık, ürettiği veriler, bilgisayarların görsel dünyayı anlama yeteneğini daha da artıracaktır.

NEIL, sağduyulu bilgi elde etmek için nesneler arasında ilişki kurabildiğinden, önceki robotik cihazlara göre önemli ilerlemelere sahiptir. İnsanların neredeyse sezgisel olarak bildiği bilgiler - arabaların genellikle yollarda bulunduğunu, binaların dikey olma eğiliminde olduğunu ve ördeklerin kazlara benzediğini.

Metin referanslarına bakıldığında, koyunla ilişkilendirilen renk siyah gibi görünebilir, ancak insanlar - ve şimdi NEIL - yine de koyunların tipik olarak beyaz olduğunu biliyorlar.

Carnegie Mellon Robotik Enstitüsü'nde araştırma profesörü yardımcısı olan Abhinav Gupta, "Görsel özellikleri öğrenmenin en iyi yolu görüntüler," dedi.

“Görüntüler aynı zamanda dünya hakkında pek çok sağduyu bilgisi de içeriyor. İnsanlar bunu kendi kendilerine öğreniyor ve NEIL ile bilgisayarların da bunu yapacağını umuyoruz. "

Bir bilgisayar kümesi Temmuz sonundan bu yana NEIL programını çalıştırıyor ve halihazırda üç milyon görüntüyü analiz ederek yarım milyon görüntüde 1.500 nesne türünü ve yüz binlerce görüntüde 1.200 tür sahneyi tanımladı.

Binlerce örnekten 2.500 dernek öğrenmek için noktaları birleştirdi.

NEIL projesi için bir motivasyon, nesnelerin, sahnelerin, eylemlerin, niteliklerin ve bağlamsal ilişkilerin etiketlendiği ve kataloglandığı dünyanın en büyük görsel yapılı bilgi tabanını oluşturmaktır.

Gupta, "Bilgisayarla görü araştırmalarının son 5-10 yılında öğrendiğimiz şey, ne kadar çok veriye sahip olursanız, bilgisayar görmesinin o kadar iyi olacağıdır" dedi.

ImageNet ve Visipedia gibi bazı projeler, bu yapılandırılmış verileri insan desteğiyle derlemeye çalıştı.

Ancak İnternetin ölçeği o kadar büyük ki - Facebook tek başına 200 milyardan fazla görüntü barındırıyor - hepsini analiz etmenin tek umudu, bilgisayarlara bunu büyük ölçüde kendi başlarına yapmayı öğretmektir.

İnsanlar NEIL'e hangi kategorilerde nesnelerin, sahnelerin vb. Araştırıp analiz etmeleri gerektiğini de söyler. Ancak bazen NEIL'in buldukları araştırmacıları bile şaşırtabilir.

Örneğin, "elma" araması, dizüstü bilgisayarların yanı sıra meyve resimlerini de döndürebilir. Ancak Gupta ve ekibi, hepsi de kara severler, F-18 aramanın yalnızca bir savaş uçağının görüntülerini değil aynı zamanda F18 sınıfı katamaranları da tanımlayacağına dair hiçbir fikre sahip değildi.

NEIL, araştırması ilerledikçe nesnelerin alt kategorilerini geliştirir - üç tekerlekli bisikletler çocuklar için, yetişkinler için olabilir ve motorlu olabilir veya arabalar çeşitli marka ve modellerde olabilir.

Ve dernekleri fark etmeye başlar - örneğin zebralar savanalarda bulunma eğilimindedir ve hisse senedi ticareti tabanları genellikle kalabalıktır.

NEIL bir ev adı haline gelmeden önce, NEIL hesaplama açısından yoğun olduğundan ölçeğin küçültülmesi gerekecek ve program 200 işlem çekirdeği içeren iki bilgisayar kümesi üzerinde çalışıyor.

Kaynak: Carnegie Mellon Üniversitesi

!-- GDPR -->