Büyük Veri: Sağlık Uygulamaları aracılığıyla Nüfus Trendlerini (Mutluluk Gibi) Tahmin Edebilir miyiz?
Beş yıldan fazla bir süre önce, Web 2.0 Dünyasında Güvenilirlik ve Geçerlilik başlıklı bir yazı kaleme aldım. Önyargılı örneklerden veri toplamanın endişelerinden söz etti - ilk önce bu örneklerin tam olarak hangi yollarla önyargılı olabileceğini anlamadan.Şimdi, uygulamaların her yerde bulunmasıyla - insanların akıllı telefonları için indirilebilir programlar - aynı sorunun ortaya çıktığını görüyorum. Geliştiriciler ve girişimciler, iyi, güvenilir, bilimsel veri toplamanın temellerini anlamadan bu uygulamalardan gelen verileri takip ediyor. Ve neden önemlidir - özellikle de tüm bu “büyük veriyi” analiz etmeye başladığınızda (epidemiyolojide biraz saçma bir terim, örneğin bilim adamları buna sadece “veri” diyorlar).
Kişisel sağlık verileri bu uygulamalar tarafından önyargısız bir şekilde toplanabilir ve bir şekilde daha büyük bir şeyi ölçmeye dönüştürülebilir mi?
Kısa cevap: hayır, kolay değil.
Elbette, “ölçülü benlik” hareketinin parçası olan - kişisel sağlıklarının (ve varsayımsal olarak akıl sağlığının) her yönünü izlemek ve ölçmek isteyen insanlar var. Ancak bu insanlar şu anda 1 aykırı ve genel olarak nüfusu hiçbir şekilde temsil etmiyor.
Bu tür azınlıklar, sağlık veya esenlik eğilimlerini analiz etmek için daha büyük veri kümelerini toplama çabalarının çoğunu hızla oluşturabilir. Ortaya çıkan analizler size bu insan grubu hakkında bir şeyler söylese de, bunun nüfusun geri kalanına (demografik ve davranışsal olarak çok farklı görünüp davranabilen) genelleştirilmesini önermek uygunsuz olacaktır.
Bu yakın zamanda değişmeyecek çünkü çoğu sağlık uygulaması insanlar tarafından indiriliyor, bir veya iki kez kullanılıyor ve sonra terk ediliyor. Çoğu insanın sağlık uygulamalarını kullanmayı bırakmasının bir nedeni var - özellikle de veri günlüğü işlevi görmesi gerekenleri. Sıkıcılar! Kendinizle ilgili veri toplamak, çoğumuz için her gün (hatta her hafta) aktif olarak yapmaya kararlı olduğumuz için çok sıkıcı bir görevdir.
Karmaşık Cevap: Uygulamaların Daha Akıllı ve Bağlantılı Olması Gerekiyor
Veri toplamayı amaçlayan sağlık uygulamaları, kullanıcı tarafından aktif giriş gerektirdiğinden sonuçta başarısız olur. Bu nedenle kişisel sağlık kayıtları hiçbir zaman anlamlı bir şekilde silinmemiştir.2 İnsanlar hayatlarını yaşamakla çok meşguller, bir uygulamaya3 günlük ölçümlerinin ne olduğunu söylemekle uğraşmak zorunda değiller.
Sağlık uygulamalarının, kişisel sağlık izleme yazılımına yönelik diğer çoğu girişimin başarısız olduğu durumlarda nihayetinde başarılı olması, verilerini pasif olarak toplamalarıdır. Bu, kullanıcıdan herhangi bir girdi gerekmediği anlamına gelir.
Elbette, anlamlı veriler sağlayan bu tür metriklerden çok uzaktayız.Elbette, ne kadar koştuğunuzu izleyen koşu cihazları var (elbette Nike'tan). Ancak çalışan bir uygulama, diyet uygulamamla veya beslenme uygulamamla veya egzersiz uygulamamla konuşmuyorsa işe yaramaz. Veya farkındalık uygulamam. Bu karmaşık varlıktaki tek bir metriği ölçen tek bir uygulama olan benim. Devam edecek pek bir şey yok.
Güven Temel Bir Temel Taştır
Tüm sağlık verilerinizi paylaşan bu tür ağ bağlantılı uygulamaların benimsenmesinin başka, daha az teknik bir engeli daha vardır - güven. Facebook ve Nike gibi şirketler sonuçta yalnızca bir grup insana, yani hissedarlarına cevap veriyor. Bu, verilerinizi para kazanabilecekleri şeyler için analiz etmek onların çıkarlarına en uygunsa, yapacakları anlamına gelir.
Girişimler daha iyi değildir, çünkü hissedarlar yerine sadece risk sermayedarlarına - yatırımlarından en iyi ve en hızlı geri dönüşü arayan borç verenlere - cevap verirler.
Neden sağlık bilgilerime - gelecekte sigorta reddi veya sigorta oranlarımın belirlenmesi için aleyhime kullanılabilecek veriler - gizliliğimi korumakla çok az ilgisi olan şirketlere güvenmek isteyeyim?
Bu da bizi tekrar ilk noktaya getiriyor - önyargılı bir örnek. Tüm sağlık bilgilerini, analiz etmek, harmanlamak ve sonunda sizinle ilişkilendirmek için kar amaçlı şirketlere memnuniyetle veren kişiler (bu tür veriler başlangıçta anonimleştirilmiş olsa bile) çoğu insan gibi değildir. Çoğumuz hala finansal bilgilerimizi kendimize saklamak istediğimiz gibi, çoğumuz sağlık bilgilerimizi kendimize saklamayı önemsiyoruz.
Buradan Nereye Gidiyoruz
Sağlık uygulamalarından nüfusa dayalı verileri toplamaya çalışmak (ör. Epidemiyolojik araştırma yapmak), belirlediğim bazı sorunlar ve fırsatlara sahip:
- Sağlık uygulamalarını aktif ve sürekli olarak kullanan küçük azınlıktan dolayı önyargılı örnekleme
- Örnekleme ve sürekli kullanım şu şekilde geliştirilebilir: pasif karşı aktif Veri toplama
- Veri toplamak ve depolamak için güvenilir bir otorite kullanılarak örnekleme ve kullanım daha da iyileştirilebilir (kâr amacı gütmeyen bir şirket veya başlangıç değil)
- Birbirinden haberdar olan ve benimle ilgili sağlık verilerini paylaşan uygulamalar, mevcut silolardan habersiz (aptal?) Uygulamalar yerine gelecek nesildir.
Bence geliştiricilerin bir sağlık sorununa bakması, bunun için bir uygulama geliştirmesi ve bunu tüm dünyaya yayması harika. Ancak çoğu zaman bu uygulamalar hiçbir yere gitmez, izleyici olmadan. Veya orijinal geliştiriciler tarafından ilgi eksikliğinden öksüz kalıyorlar. Güçlü bir izleyici kitlesi kazanan birkaç popüler sağlık uygulaması, kural değil istisnadır. Ve tıpkı ülkemizin elektronik tıbbi kayıt sistemleri gibi yaygın kabul görseler bile, birbirleriyle konuşmuyorlar.
Bir uygulamadan toplanan veriler hakkında yetkili veya anlamlı bir şey söyleyebilmek istiyorsanız, verilerin popülasyonun temsili bir örnekleminden geldiğini göstermelisiniz. Bundan yoksun, verileriniz bize popülasyondaki sadece küçük bir grup hakkında bilgi veriyor - çoğumuza benzemeyen bir grup.
Dipnotlar:
- Ve öngörülebilir gelecek için de olacak [↩]
- Ve Google neden nihayet yarın kendi kişisel sağlık kaydını kapatacak? [↩]
- Veya daha kötüsü - ve daha yaygın olarak - tüm uygulamalar başka birinin farkında olmayan ve birbirleriyle veri alışverişi yapamayanlar [↩]