Компьютер научили описывать фото человеческим языком
Специалисты из Стенфордского университета и корпорации Google научили компьютер описывать фото – речь идет о кратких описаниях к увиденным фотографиям. Это стало важным шагом в области развития искусственного интеллекта.
В Google создали специальные алгоритмы, которые используют нейронные сети. Важно отметить, что компьютер получил возможность не только описывать предметы на фотографии, но также научился выстраивать простейшие связи между ними.
Фотографию, на которой были изображены лежащие на плите пиццы, система определила как «две пиццы, лежащие на поверхности плиты». Еще пример: когда компьютеру показали фото совершающих покупки людей, он охарактеризовал его как «группа людей, совершающих покупки на уличном рынке».
И хотя такого рода эксперимент не кажется чем-то невероятным, эксперты уже успели назвать его важнейшим шагом в области машинного обучения и компьютерного зрения. Чтобы добиться таких результатов, лучшие специалисты использовали самые передовые технологии и выполнили огромный объем работ.
Новость уже успели связать с покупкой Google в 2013 году компании Boston Dynamics, которая разрабатывает роботов. Ею, в частности, был создан робот BigDog, напоминающий огромную собаку. Возможно, новая технология в будущем позволит роботам лучше ориентироваться в пространстве.
И хотя сейчас технологию не планируют использовать для решения насущных проблем, ее потенциал огромен. На первом этапе она может помочь людям с плохим зрением (например, если речь идет об изображениях в интернете). Возможно, Google захочет интегрировать свое изобретение в поисковую систему. К примеру, с его помощью можно будет найти картинки, не имеющие подписей.