https://frosthead.com

Теперь тест Тьюринга становится визуальным

Алгоритмы Facebook могут выделить ваше лицо из толпы (или хотя бы попытаться), но он по-прежнему не может определить, фотографируете ли вы в семейном портрете или пьете с друзьями, - он не может сказать вам, как вы взаимодействуете с другими, В будущем, однако, компьютеры могут быть в состоянии сделать это. Теперь исследователи предложили способ выяснить, насколько умны компьютеры при визуальной идентификации. Они называют свой тест визуальным тестом Тьюринга после теста компьютерного ученого Алана Тьюринга о том, может ли компьютер отображать человеческий интеллект.

Популярное восприятие теста состоит в том, что он используется для того, чтобы отличать людей от компьютеров, и одна версия используется для этого, когда вы делаете CAPTCHA, чтобы подписаться на новое письмо. Но исследователи искусственного интеллекта действительно думают о тесте как о способе измерения того, насколько развит компьютерный интеллект.

«В последние годы достигнуты впечатляющие успехи в области компьютерного зрения», - говорится в заявлении для прессы Стюарт Геман, профессор математики в Университете Брауна и один из исследователей, предлагающих новую оценку. «Мы чувствовали, что, возможно, пришло время поднять планку с точки зрения того, как эти системы оцениваются и сравниваются».

Вместо того, чтобы просто признать, что изображение показывает двух человек, тест проверяет, могут ли компьютеры выяснить, что эти два человека ведут разговор или даже спорят. В настоящее время исследователи используют общедоступные наборы данных для тестирования своих программ. Например, в MIT есть LableMe, который использует краудсорсинг для определения, например, «автомобиля», «дерева» и «здания» на изображениях. Чтобы улучшить это и предложить более сложную задачу, исследователи из Брауна придумали основу для стандартизированного визуального теста Тьюринга.

Ли Гомес для отчетов IEEE Spectrum :

Предложенный ими метод требует, чтобы разработчики тестов-людей разработали список определенных атрибутов, которыми может обладать изображение, например, есть ли на улице люди, или они несут что-либо или разговаривают друг с другом. Фотографии сначала будут оцениваться людьми по этим критериям; Затем система компьютерного зрения будет показана на том же рисунке без «ответов», чтобы определить, сможет ли она определить, что люди заметили.

Первоначально вопросы были бы зачаточными, например, спрашивать, есть ли человек в обозначенной области изображения. Но вопросы будут усложняться по мере усложнения программ; более сложный вопрос может включать характер взаимодействия между разными людьми на картинке.

Команда описала тест в трудах Национальной академии наук . На сегодняшний день, по словам Германа, ни одна компьютерная система не может пройти даже простые версии нового теста. Но они будут в будущем. Поскольку у любой фотографии имеется множество возможных атрибутов, исследователи должны были бы придумать инновационные способы для своих компьютеров научиться оценивать фотографии.

«Как исследователи, мы склонны« учить на экзамене », - говорится в заявлении Гемана. «Если есть определенные конкурсы, в которых участвуют все, и это показатели успеха, то на этом мы концентрируемся. Поэтому было бы разумно изменить тест, чтобы он был вне досягаемости существующих систем зрения ».

Теперь тест Тьюринга становится визуальным