Sosyal Medya Araştırmalarında Kusurları Bulmak

Montreal'deki McGill Üniversitesi ve Pittsburgh'daki Carnegie Mellon Üniversitesi'ndeki bilgisayar bilimcilerine göre, araştırmacıların büyük sosyal medya veri setleriyle çalışmanın ciddi tehlikelerine karşı dikkatli olmaları gerekiyor.

Kusurlu sonuçların çok büyük sonuçları olabilir: Her yıl binlerce araştırma makalesi artık sosyal medyadan toplanan verilere dayanıyor.

McGill Bilgisayar Bilimleri Okulu'nda yardımcı doçent olan Dr. Derek Ruths, "Bu belgelerin çoğu, halk arasında, endüstri ve hükümette kararları ve yatırımları bilgilendirmek ve gerekçelendirmek için kullanılıyor" dedi.

Davranış bilimciler için, sosyal medyanın büyümesi, insan davranışı hakkında bol miktarda bilgiyi yakalamak ve ardından analiz etmek için eşi görülmemiş bir fırsat olarak görüldü.

Pek çok bilim adamı, bu tür olgun veri kümelerinin insan davranışını daha önce hiç hayal edilmemiş bir düzeyde tahmin etmeye yardımcı olabileceğine inanıyor. Son yıllarda, araştırmalar yaz gişe rekorları kıranlardan borsadaki dalgalanmalara kadar her şeyi tahmin etme yeteneğini iddia etti.

Ancak dergide yayınlanan bir makalede BilimCarnegie Mellon Yazılım Araştırma Enstitüsü'nden Ruths ve Dr. Jürgen Pfeffer, sosyal medya veri setlerinin kullanımıyla ilgili çeşitli konuların yanı sıra bunlara yönelik stratejilerin altını çiziyor. Zorluklar arasında:

  • Farklı sosyal medya platformları farklı kullanıcıları cezbeder - örneğin Pinterest, 25-34 yaş arası kadınların hakimiyetindedir - ancak araştırmacılar, bu popülasyonların oluşturabileceği çarpık resmi nadiren düzeltir;
  • Sosyal medya araştırmalarında kullanılan herkese açık veri akışları, her zaman platformun genel verilerinin doğru bir temsilini sağlamaz ve araştırmacılar genellikle sosyal medya sağlayıcılarının veri akışlarını ne zaman ve nasıl filtrelediği konusunda karanlıkta kalırlar;
  • Sosyal medya platformlarının tasarımı, kullanıcıların nasıl davrandığını ve dolayısıyla hangi davranışların ölçülebileceğini belirleyebilir. Örneğin, Facebook'ta "beğenmeme" düğmesinin olmaması, içeriğe verilen olumsuz yanıtların algılanmasını olumlu "beğenilere" göre daha zor hale getirir;
  • Sosyal medyada normal kullanıcılar gibi görünen çok sayıda spam gönderen ve bot, yanlışlıkla insan davranışının birçok ölçümüne ve tahminine dahil edilir;
  • Araştırmacılar genellikle sınıflandırması kolay kullanıcılar, konular ve olaylardan oluşan grupların sonuçlarını rapor ederek yeni yöntemlerin gerçekte olduğundan daha doğru görünmesini sağlar. Örneğin, Twitter kullanıcılarının siyasi yönelimlerini anlama çabaları, tipik kullanıcılar için ancak yüzde 65 doğruluk elde ediyor - çalışmalar (politik olarak aktif kullanıcılara odaklanan) yüzde 90 doğruluk iddia etse de. Twitter kullanıcıları, tipik kullanıcılar için ancak yüzde 65 doğruluk elde ediyor - çalışmalar (politik olarak aktif kullanıcılara odaklanan) yüzde 90 doğruluk iddia etse de.

Araştırmacılar, sorunların çoğunun epidemiyoloji, istatistik ve makine öğrenimi gibi diğer alanlarda da ortak olduğunu söylüyor.

Ruths, "Tüm bu konulardaki ortak nokta, araştırmacıların sosyal medya verileriyle çalışırken gerçekte neyi analiz ettiklerinin daha keskin bir şekilde farkına varma ihtiyacıdır" diyor.

Sosyal bilimciler, daha önce bu tür zorluklarla başa çıkmak için tekniklerini ve standartlarını geliştirdiler.

Ruths, "1948'deki kötü şöhretli" Dewey Defeats Truman "manşeti, genel nüfustaki Truman destekçilerinin yetersiz örneklendiği telefon anketlerinden kaynaklandı" diyor.

"Oylama uygulamasının kalıcı olarak itibarını sarsmak yerine, bu göze batan hata, günümüzün daha sofistike tekniklerine, daha yüksek standartlara ve daha doğru anketlere yol açtı. Şimdi, benzer bir teknolojik dönüm noktasındayız. Karşılaştığımız sorunları ele alarak, sosyal medya tabanlı araştırmanın vaat ettiği müthiş iyilik potansiyelini gerçekleştirebileceğiz. "

Kaynak: McGill Üniversitesi

!-- GDPR -->