Gazeta IT

Screen

Profile

Layout

Direction

Menu Style

Cpanel

Technologia rozpoznawania zdjęć – nowa nisza na rynku?

Wszystkie firmy prowadzące swoją działalność w Internecie kładą ogromny nacisk na ciągłe poszerzanie funkcjonalności  ich produktów. Jednocześnie mamy do czynienia z ciągłym rozwojem  zaawansowanych algorytmów. Pomimo to wciąż nie pojawił się na rynku produkt, który pozwoliłby na pełne rozpoznawanie obiektów na zdjęciach.
 
Nikogo już nie dziwią aplikacje takie jak Shazam czy SoundHound, które potrafią rozpoznać dowolny utwór muzyczny. Wystarczy im do tego kilkusekundowy fragment dźwięku nagranego przez  mikrofon dowolnego smartfona.  Silniki wspomnianych programów potrafią na jego podstawie wyselekcjonować akustyczne „odciski palców” – elementy unikalne dla każdej piosenki. Te z kolei są przesyłane do baz danych, gdzie następuje przypasowanie ich do odpowiednich autorów i tytułów.
 
O ile jednak można postrzegać dźwięk jako coś liniowego, to sytuacja komplikuje się, gdy trzeba rozpoznać przestrzeń dwuwymiarową, a z taką właśnie mamy do czynienia w wypadku zdjęć. Jeżeli wziąć pod uwagę fakt, że fotografowany obiekt może zostać ujęty na wiele sposobów i pod dowolnym kątem, to można postrzegać zadanie nawet jako badanie przestrzeni trójwymiarowej. Dodatkowo całość komplikowana jest przez barwy i odcienie, które zależą od pory dnia, oświetlenia itd. Być może dlatego właśnie tak długo trzeba było czekać zanim pojawiły się pierwsze programy skanujące zdjęcia.
Interesującą nowością w temacie była prezentacja ekspertów z Mountain View, która miała miejsce w połowie 2009. Przedstawili oni wtedy schemat wyszukiwania oparty na klastrach segregowanych według skomplikowanej typologii.  W czasie prezentacji silnik stworzony przez programistów Google’a  bezproblemowo rozpoznał ateński Akropol. Natychmiastowo zaznaczono jednak, że rozwiązanie to nie może zostać zastosowane na skalę masową i do dziś przełom nie nastąpił. 
 
Analizy na tym polu wydaje się prowadzić również Microsoft w ramach projektu Photosynth (w pierwszej wersji wydanego w marcu 2010). W tym wypadku jednak największy nacisk położono na tworzenie trójwymiarowych modeli, w które są zamieniane grafiki użytkowników.
Z kolei w grudniu 2010 roku Facebook zaskoczył wprowadzając w Stanach Zjednoczonych usługę opartą o system rozpoznawania twarzy. W jej ramach portal automatycznie dodawał znaczniki do wrzucanych przez jego użytkowników zdjęć. Nowatorski charakter usługi (po raz pierwszy wprowadzonej na taką skalę) przyćmiły jednak dyskusje nad polityką prywatności. Specjaliści skupiali się raczej na krytykowaniu podejścia developerów do kluczowych elementów ochrony prywatnych informacji w sieci. 
 
Podobne badania nad technologiami rozpoznawania zdjęć są również prowadzone w Polsce. Szczególnie widoczne są na arenie wyszukiwarek produktów. Na uwagę zasługują w tym wypadku dedykowane dla smart fonów aplikacje Allegro i SaveUp. Pierwsza potrafi rozpoznawać szeroką gamę produktów, ale operacja skanowania trwa około trzech minut. Druga rozpoznaje tylko książki, ale wyniki są dostarczane użytkownikom w zadawalającym czasie (rozpoznanie jest kwestią kilkunastu sekund).  Obydwie aplikacje mają służyć wyszukiwaniu tańszych produktów w sieci.
Na tych przykładach widać więc, że funkcjonalność rozpoznawania zdjęć może mieć charakter rewolucyjny. Już sam fakt, że pracują nad nią najwięksi giganci rynku daje do zrozumienia jak wysoka jest stawka. Wydaje się, że firma, która pierwsza wejdzie z nią na rynek światowy, uzupełni wielką niszę. Należy jednak pamiętać o zagrożeniach, jakie ona niesie: pozwoli nie tylko wyszukać w Internecie produkt, któremu zrobimy zdjęcie, w promocyjnej cenie, ale także pozyskać nasze dane osobowe każdemu, kto dotrze do naszego zdjęcia. Bilans korzyści i strat będzie można pewnie przeprowadzić już niedługo – technologia ta wydaje się być w zasięgu ręki, zależna jedynie od opracowania szybkiego algorytmu wyszukiwania i porównywania.



Zmieniony: czwartek, 23 czerwca 2011 08:00