Büyük Veri Bilgisayarların Görüntülere Bağlı Kimlik Duygularına Yardımcı Olabilir
Twitter ve Facebook gibi popüler siteler ve diğer kanallar artık bir kişinin düşüncelerini ve duygularını daha iyi ifade etmesine yardımcı olan resimlerle dolu. Yeni araştırma, "büyük verinin" (geleneksel veri işleme uygulamalarını kullanarak işlenmesi zor olan çok büyük veya karmaşık veri kümelerinden oluşan herhangi bir koleksiyon), bilgisayarlara görüntülerle ilişkili içeriği ve duyguları yorumlamayı öğretmek için kullanılabilir.
Rochester Üniversitesi'nde bilgisayar bilimi profesörü olan Dr. Jiebo Luo, Adobe Research'teki araştırmacılarla işbirliği içinde geçtiğimiz günlerde bir Amerikan Yapay Zeka Derneği (AAAI) konferansında aşamalı bir eğitim derin evrişimli sinir ağını (CNN) anlatan bir makale sundu. .
Eğitimli bilgisayar daha sonra bu görüntülerin hangi duyguları ortaya çıkaracağını belirlemek için kullanılabilir. Luo, bu bilginin ekonomik göstergeleri ölçmek veya seçimleri tahmin etmek kadar çeşitli şeyler için faydalı olabileceğini söylüyor.
Ancak görev karmaşıktır. Bilgisayarlar tarafından metnin duygu analizi başlı başına zorlu bir görevdir. Ve sosyal medyada, duygu analizi daha karmaşıktır çünkü birçok insan, bir bilgisayarın anlaması daha zor olan görüntüler ve videolar kullanarak kendilerini ifade eder.
Örneğin, siyasi bir kampanya sırasında seçmenler görüşlerini genellikle resimlerle paylaşırlar.
İki farklı resim aynı adayı gösterebilir, ancak çok farklı siyasi açıklamalar yapıyor olabilirler. Bir insan, birini adayın olumlu bir portresi (örneğin, gülümseyen ve kollarını kaldıran), diğeri olumsuz (örneğin, adayın mağlup görünen bir resmi) olarak tanıyabilir.
Ancak sosyal medyada paylaşılan her resme hiçbir insan bakamaz - bu gerçekten "büyük veri" dir. Bir adayın popülaritesi hakkında bilgiye dayalı tahminler yapabilmek için, bilgisayarların bu verileri sindirecek şekilde eğitilmesi gerekir; bu, Luo ve işbirlikçilerinin yaklaşımı şimdiye kadar mümkün olandan daha doğru bir şekilde yapabilir.
Araştırmacılar, görüntülerden duyguları çıkarma görevini bir görüntü sınıflandırma problemi olarak ele alıyor. Bu, her nasılsa her resmin analiz edilmesi ve ona etiket uygulanması gerektiği anlamına gelir.
Eğitim sürecini başlatmak için Luo ve çalışma arkadaşları, SentiBank (Columbia'daki Dr. Shih-Fu Chang'ın grubu tarafından geliştirilen) olarak bilinen mevcut bir veritabanında, belirli duygulara sahip bir makine algoritması tarafından gevşek bir şekilde etiketlenmiş çok sayıda Flickr görüntüsü kullandı. Üniversite).
Bu, bilgisayara bazı görüntülerin neler iletebileceğini anlamaya başlamak için bir başlangıç noktası sağlar.
Ancak makine tarafından üretilen etiketler aynı zamanda bu etiketin doğru olma olasılığını da içerir, yani etiketin doğru olduğundan bilgisayar ne kadar emin?
Eğitim sürecinin kilit adımı, etiketlendikleri duygu veya duyguların doğru olmayabileceği herhangi bir görüntüyü attıklarında daha sonra gelir. Bu nedenle, güçlü evrişimli sinir ağı çerçevesinde giderek gelişen bir tarzda ileri eğitim için yalnızca "daha iyi" etiketli görüntüleri kullanırlar.
Resaercher, bu ekstra adımın, her bir resmin etiketlendiği duyguların doğruluğunu önemli ölçüde iyileştirdiğini buldu.
Ayrıca bu duyarlılık analizi motorunu Twitter'dan çıkarılan bazı görüntülerle uyarladılar. Bu durumda, görüntüleri Amazon Mechanical Turk platformu aracılığıyla sınıflandırmaya yardımcı olan birden fazla kişi ile "kitle istihbaratı" kullandılar.
Bilgisayarda ince ayar yapmak için yalnızca az sayıda görüntü kullandılar ve yine de bu etki alanı uyarlama sürecini uygulayarak Twitter görüntülerinin duyarlılık analizi için mevcut son teknoloji yöntemlerini geliştirebileceklerini gösterdiler.
Şaşırtıcı bir bulgu, görüntü duyarlılığı sınıflandırmasının doğruluğunun, aynı Twitter mesajlarındaki metin duyarlılığı sınıflandırmasının doğruluğunu aşmasıdır.
Kaynak: Rochester Üniversitesi