КОГДА МАШИНЫ ВИДЯТ

Распознавание образов крыла бабочки. Изображение предоставлено Ли Ли

Здесь, в Вашингтоне, мы слышали об этой вещи, которую вы называете «заблаговременное планирование», но мы еще не готовы принять ее. Слишком футуристично.

Тем не менее, мы не можем не восхищаться издалека теми, кто пытается предсказать, что может произойти больше, чем через месяц. Поэтому несколько недель назад я был впечатлен, когда крупные мыслители IBM представили мир пять лет спустя и определили, как они считают, пять областей инноваций, которые окажут наибольшее влияние на нашу повседневную жизнь.

Они занимаются этим уже несколько лет, но на этот раз странные гудки следовали за темой - пятью человеческими чувствами. Не то, чтобы они говорили, что к 2018 году мы все сможем лучше видеть, слышать и пахнуть, но скорее машины будут - что с помощью быстро развивающихся сенсорных и когнитивных технологий компьютеры ускорят свое преобразование из поиска данных и обработка двигателей для инструментов мышления.

Видите образец?

Сегодня давайте разберемся со зрением. Логично предположить, что IBM может иметь в виду Google Glass Project. Нет сомнений в том, что он переопределил роль очков от аксессуара для гиков, который помогает нам лучше видеть комбинированное устройство для смартфона / устройства для передачи данных, которое мы когда-нибудь наденем на наши лица.

Но это не то, о чем говорят IBMers. Они сфокусированы на машинном зрении, в частности на распознавании образов, благодаря чему, благодаря многократному экспонированию изображений, компьютеры могут идентифицировать вещи.

Как выяснилось, Google оказался вовлеченным в один из наиболее заметных экспериментов по распознаванию образов в прошлом году - проект, в котором сеть из 1000 компьютеров, использующих 16 000 процессоров, после изучения 10 миллионов изображений из видео на YouTube смогла понять, что кот выглядел как.

Что особенно впечатляло, так это то, что компьютеры могли делать это без какого-либо человеческого руководства о том, что искать. Все обучение было проведено с помощью машин, работающих вместе, чтобы решить, какие особенности кошек заслуживают их внимания и какие модели имеют значение.

И это модель того, как машины будут учиться зрению. Вот как объясняет Джон Смит, старший менеджер IBM Intelligent Information Management:

«Допустим, мы хотели научить компьютер, как выглядит пляж. Начнем с того, что покажем компьютеру множество примеров пляжных сцен. Компьютер превратит эти изображения в отличительные особенности, такие как распределение цветов, рисунки текстуры, информация о краях или информация о движении в случае видео. Затем компьютер начнет учиться отличать сцены пляжа от других сцен на основе этих различных функций. Например, он узнает, что для пляжной сцены, как правило, обнаруживаются определенные цветовые распределения по сравнению с городским пейзажем в центре города ».

Насколько умный умный?

Хорошо для них. Но, честно говоря, для большинства из нас, людей, определение пляжа является довольно простой вещью. Можем ли мы увлекаться тем, сколько мыслящих машин смогут сделать для нас?

Гэри Маркус, профессор психологии в Нью-Йоркском университете, так считает. Написав недавно на веб-сайте The New Yorker, он приходит к выводу, что, несмотря на значительный прогресс в том, что стало известно как «глубокое обучение», машинам еще предстоит пройти долгий путь, прежде чем их следует считать действительно интеллектуальными.

«Реально, глубокое обучение - это только часть более сложной задачи создания интеллектуальных машин. В таких методах отсутствуют способы представления причинно-следственных связей (например, между болезнями и их симптомами), и они могут столкнуться с проблемами при получении абстрактных идей, таких как «родной брат» или «идентичный». У них нет очевидных способов выполнения логических выводов, и они также еще далеко до интеграции абстрактных знаний, таких как информация о том, что это за объекты, для чего они нужны и как они обычно используются ».

Люди в IBM, без сомнения, признают это. Машинное обучение идет поэтапно, а не скачками.

Но они полагают, что в течение пяти лет глубокое обучение сделает достаточно шагов вперед, чтобы, например, компьютеры стали играть гораздо более важную роль в медицинской диагностике, чтобы они могли стать лучше врачей, когда дело доходит до выявления опухолей, тромбов или больная ткань в МРТ, рентген или КТ.

И это может иметь большое значение в нашей жизни.

Видеть значит верить

Вот еще несколько способов, которыми машинное зрение влияет на нашу жизнь:

Выдвигая лучшую руку вперед: Технология, разработанная в Университете Питтсбурга, использует распознавание образов, чтобы параплегики могли контролировать руку робота своими мозгами.
Ваш рот говорит «да», но ваш мозг говорит «нет»: исследователи из Стэнфорда обнаружили, что использование алгоритмов распознавания образов при МРТ-сканировании головного мозга может помочь им определить, действительно ли у кого-то была боль в пояснице или она притворялась.
Когда ваши родинки готовы к крупным планом: в прошлом году румынский стартап под названием SkinVision запустил приложение для iPhone, которое позволяет людям делать снимки родинок на коже, а затем с помощью программного обеспечения распознавания SkinVision выявлять любые нарушения и указывать уровень риска - без предлагая фактический диагноз. Следующим шагом является предоставление людям возможности отправлять изображения своей кожи непосредственно своему дерматологу.
Есть ли у меня сделка для вас: сейчас в разработке находится маркетинговая технология под названием Facedeals. Это работает следующим образом: как только камера на входе в магазин узнает вас, вы отправляете на свой смартфон индивидуальные предложения в магазине. И да, вы должны сначала выбрать.
Я бы знал эту печать где угодно: компьютеризированная система фотоидентификации, которая использует распознавание образов, помогает британским ученым отслеживать серые печати, которые имеют уникальную маркировку на своих пальто.

Видео бонус: Пока мы говорим об искусственном интеллекте, вот рой роботов, играющий Бетховена, комплименты ученых из Технологии Джорджии. Держу пари, ты не ожидал увидеть это сегодня.

Больше от Smithsonian.com

Более человеческий искусственный мозг

Как технологии борются с терроризмом