Aplikacja Zensors umożliwia monitorowanie kamery na żywo przez crowdsource

Jeśli czujesz, że potrzebujesz oczu z tyłu głowy, jest na to aplikacja crowdsourcingowa.

Zensors to aplikacja na smartfony, która może monitorować obszar zainteresowania za pomocą kamery, pracowników z crowdsourcingu i sztucznej inteligencji.

Opracowany przez naukowców z Carnegie Mellon University i University of Rochester, pomysł za Zensors polega na użyciu dowolnej kamery w ustalonym miejscu w celu wykrycia zmian w monitorowanym obiekcie - na przykład, czy miska karmy dla zwierzaka jest pusta - i automatycznie powiadamia użytkowników.

Deweloperzy twierdzą, że jest to tani, przystępny sposób dodawania czujników do środowiska, stanowiący część kroku w kierunku budowy inteligentnych domów i inteligentnych miast.

Projekt zaprezentowany w tym tygodniu na konferencji interakcji człowiek-komputer 2015 (CHI) w Seulu opiera się na prostych pytaniach użytkowników napisanych w codziennym języku na temat monitorowanego obszaru.

Na przykład pytanie może brzmieć: czy na parkingu jest samochód? Obecność samochodu wywołałaby pozytywną reakcję w ostrzeżeniu dla użytkownika, który można wysłać pocztą elektroniczną lub SMS-em.

Kamera może być czujnikiem obrazu w dowolnym urządzeniu mobilnym, pod warunkiem, że została skonfigurowana do monitorowania czegoś, kamery internetowej, kamery bezpieczeństwa lub innej podłączonej kamery. Będzie przechwytywać obrazy w odstępach czasu określonych przez użytkownika.

Użytkownicy najpierw wybierają region zainteresowania w widoku kamery, zakreślając go palcem na ekranie dotykowym - co ma na celu ograniczenie nadzoru i ochronę prywatności osób, które mogą wejść do części kadru.

Następnie w aplikacji Zensors wprowadzane jest pytanie, a zadanie monitorowania obrazów trafia do Internetu. Nadmiarowe obrazy, w których nic się nie zmieniło, są automatycznie ignorowane.

Osoby, które wykonują wstępne monitorowanie, mogą być pracownikami call center lub usługami outsourcingowymi, takimi jak Amazon Turk Turk, który został wykorzystany w badaniu CMU. Gdy monitory stwierdzą, że pytanie ma twierdzącą odpowiedź, wykres w aplikacji wkrótce się zmienia; może również wydawać powiadomienia użytkownikom.

Zensors staje się jednak interesujący, gdy proces staje się automatyczny. Po pewnym okresie monitorowania ludzi algorytmy uczenia maszynowego w oprogramowaniu mogą się nauczyć, gdy spełniony zostanie określony warunek. Na przykład mogą nauczyć się rozpoznawać, że miska karmy dla zwierzaka jest pusta.

Aby zapewnić dokładność algorytmów, system byłby okresowo sprawdzany przez pracowników, co mogłoby przyjąć bardziej praktyczną rolę, gdyby monitorowany obszar miał nieoczekiwaną zmianę.

Do przetwarzania danych można również dodać komputerowe narzędzia wizyjne, dzięki czemu system może wykonywać zadania, takie jak zliczanie samochodów lub osób w określonym obszarze.

Podczas demonstracji smartfon z systemem Zensors został umieszczony twarzą do góry na stole. Zadano pytanie: „Czy jest ręka?” Po przytrzymaniu ręki nad aparatem telefonu wykres aplikacji zmienił się, pokazując, że pracownicy Mechanical Turk odpowiedzieli z daleka. Naukowcy obwinili opóźnienie sieci za fakt, że odpowiedź zajęła około 30 sekund.

Dzięki lepszej reakcji, Zensors może być wykorzystywany w różnych aplikacjach biznesowych i domowych. Kierownik restauracji może go użyć, aby dowiedzieć się, kiedy szklanki klientów muszą zostać ponownie napełnione, a firmy ochroniarskie mogą użyć go do automatycznego monitorowania.

„O ile wiem, jesteśmy pierwszymi, którzy połączyli tłum ze szkoleniem w zakresie uczenia maszynowego i faktycznie to robią” - powiedział Gierad Laput, doktorant w Carnegie Mellon w Human-Computer Interaction Institute, który popisał się także nowymi interfejsami smartfonów w CHI.

Zdaniem naukowców koszt monitorowania człowieka wynosi 2 centy za obraz. Szkolenie algorytmów, aby mogły je przejąć, kosztuje około 15 USD zweryfikowanych przez ludzi danych.

Z drugiej strony, posiadanie przez programistę oprogramowania do zapisu obrazu dla czujnika, który odpowiada na podstawowe pytanie tak lub nie, może zająć miesiąc i kosztować tysiące dolarów.

„Przetwarzanie języka naturalnego, uczenie maszynowe i widzenie komputerowe są trzema najtrudniejszymi problemami w informatyce” - powiedział Chris Harrison, adiunkt ds. Interakcji człowiek-komputer w CMU. „Tłum pozwala nam w zasadzie ominąć wiele z tego. Ale po prostu pozwalamy tłumowi wykonywać ładowanie i nadal czerpiemy korzyści z uczenia maszynowego. ”

Naukowcy planują ulepszać aplikację Zensors, obecnie w wersji beta, a następnie udostępnić ją publicznie.

Dołącz do społeczności Network World na Facebooku i LinkedIn, aby komentować najważniejsze tematy.