Yeni Ses Uygulaması Kilo Kontrolüne Yardımcı Olabilir
Kilo vermenin en önemli kiracı, tüketilen her kaloriyi saymaktır. Görev kolay görünse de, bir restoranda yemek yerken, hareket halindeyken atıştırırken ve hatta evde yemek yerken bile tüm kalorileri belgelemek zor bir görev haline gelir.
Teknik tutarlılık ve doğruluk gerektirir ve başarısız olduğunda, bunun nedeni genellikle insanların ihtiyaç duydukları tüm bilgileri bulup kaydetmek için zamana veya araçlara sahip olmamasıdır.
Şimdi, Massachusetts Teknoloji Enstitüsü'nden (MIT) araştırmacılar, insanların tükettikleri yiyecek ve içeceklere konuşma kontrollü bir sistem kullanarak giriş yapmasına izin veren bir uygulama geliştirdi.
Konsept birkaç yıl önce, Tufts Üniversitesi'nden bir beslenme uzmanları ekibinin, yemek günlüğünü daha kolay hale getirecek bir konuşma dili uygulaması fikriyle MIT araştırmacılarına yaklaşmasıyla ortaya çıktı.
Bu hafta, Şangay'daki Uluslararası Akustik, Konuşma ve Sinyal İşleme Konferansı'nda MIT araştırmacıları, konuşma kontrollü beslenme kayıt sisteminin Web tabanlı prototipini sunuyorlar.
Bununla birlikte, kullanıcı bir yemeğin içeriğini sözlü olarak açıklar ve sistem, açıklamayı ayrıştırır ve ilgili beslenme verilerini ABD Tarım Bakanlığı (USDA) tarafından sağlanan çevrimiçi bir veritabanından otomatik olarak alır.
Veriler, karşılık gelen yiyeceklerin görüntüleri ve kullanıcının açıklamalarını düzeltmesine olanak tanıyan açılır menülerle birlikte görüntülenir - örneğin, kesin miktarlarda yiyecek seçme. Ancak bu düzeltmeler sözlü olarak da yapılabilir.
"Kahvaltı için bir kase yulaf ezmesi, muz ve bir bardak portakal suyu içtim" diyerek başlayan bir kullanıcı, "Yarım muzum vardı" şeklindeki değişikliği yapabilir ve sistem görüntülediği verileri günceller geri kalanı değişmeden bırakırken muz hakkında.
Kıdemli bir araştırmacı olan James Glass, "[Tufts beslenme uzmanlarının] deneyimlediği şey, insanların yemeklerini kaydetmeye çalışmasına yardımcı olan uygulamaların biraz sıkıcı olma eğiliminde olması ve bu nedenle insanların bunlara ayak uydurmaması," diyor. .
"Bu yüzden, doğru ve bilgi girmesi kolay yollar arıyorlardı."
Yeni makalenin ilk yazarı, elektrik mühendisliği ve bilgisayar bilimleri alanında MIT lisansüstü öğrencisi olan Mandy Korpusik. Kendisine tez danışmanı olan Glass da katıldı; onun yüksek lisans öğrencisi Michael Price; ve Glass’ın grubunda bir lisans araştırmacısı olan Calvin Huang tarafından.
Makalede, araştırmacılar özellikle gıda ile ilgili terminolojiyi işlemek için geliştirdikleri konuşma tanıma sistemi ile deneylerin sonuçlarını bildiriyorlar.
Ancak, yemek kaydetme sistemlerinin çevrimiçi demosu Google'ın ücretsiz konuşma tanıma uygulamasını kullandığından, çalışmalarının ana odağı bu değildi.
Araştırmaları diğer iki soruna odaklandı. Birincisi, kelimelerin işlevsel rolünü tanımlamaktır: Sistemin, kullanıcı "bir kase yulaf ezmesi" ifadesini kaydederse, yulaf ezmesi ile ilgili beslenme bilgilerinin uygun olduğunu, ancak ifade "yulaf ezmeli kurabiye" ise bunun geçerli olmadığını anlamalıdır.
Diğer sorun, kullanıcının ifadesini USDA veritabanındaki girişlerle uzlaştırmaktır. Örneğin, yulaf ezmesine ilişkin USDA verileri “yulaf” başlığı altında kaydedilmiştir; "yulaf ezmesi" kelimesi girişin hiçbir yerinde görünmüyor.
İlk sorunu çözmek için araştırmacılar makine öğrenimini kullandılar.
Amazon Mechanical Turk kitle kaynak platformu aracılığıyla, son yemeklerde ne yediklerini basitçe anlatan işçileri işe aldılar. Daha sonra açıklamadaki ilgili kelimeleri yiyeceklerin adları, miktarları, marka adları veya yiyecek adlarının değiştiricileri olarak etiketlediler.
“Yulaf ezmesi kasesi” nde “kase” bir miktar ve “yulaf ezmesi” bir besindir, ancak “yulaf ezmeli kurabiye” de yulaf ezmesi bir değiştiricidir.
Yaklaşık 10.000 etiketli yemek tanımına sahip olduklarında, araştırmacılar, işlevsel rollerini tanımlayacak kelimeler arasındaki sözdizimsel ilişkilerde kalıplar bulmak için makine öğrenimi algoritmalarını kullandılar.
Araştırmacılar daha sonra kullanıcıların açıklamaları ve USDA veritabanındaki etiketler arasında çeviri yapmak için Freebase adlı açık kaynaklı bir veritabanı kullandılar. Veritabanının kendisi, birçoğu eşanlamlılar içeren 8.000'den fazla yaygın gıda maddesine ilişkin girdilere sahiptir.
Eşanlamlıların eksik olduğu yerlerde, onları tedarik etmeleri için tekrar Mechanical Turk işçilerini işe aldılar.
Konferansta sunulan sistemin versiyonu, esas olarak doğal dil işleme yaklaşımının uygulanabilirliğini göstermeyi amaçlamaktadır. Sistem kalori sayımlarını bildirir ancak bunları henüz otomatik olarak toplamaz.
Bununla birlikte, işe yarayan bir sürüm var ve tamamlandığında, Tufts araştırmacıları, beslenmeyi günlüğe kaydetmeyi gerçekten kolaylaştırıp kolaylaştırmadığını belirlemek için bir kullanıcı çalışması yapmayı planlıyor.
Kaynak: MIT