«МОНА ЛИЗА» ОЖИВАЕТ В КОМПЬЮТЕРНОМ «ЖИВОМ ПОРТРЕТЕ»

Серия «Гарри Поттер» привела мир к идее живых портретов с помощью говорящих картин и движущихся фотографий. Но на прошлой неделе, когда созданный ИИ «живой портрет» Моны Лизы Леонардо да Винчи начал делать обходы в Интернете, многие были поражены, когда знаменитый портрет шевельнул ее губами и огляделся.

Анимированный портрет Лизы Джерардини был одной из нескольких новых «моделей говорящих голов», более известных как «глубокие подделки», созданных исследователями из Центра искусственного интеллекта Samsung в Москве и Научно-технического института Сколково. Используя всего несколько ориентиров или даже одно изображение, исследователи также сделали глубокие подделки таких знаменитостей, как Опра, воплотили в жизнь отдельные снимки Мэрилин Монро и Альберта Эйнштейна и создали новые выражения для известных изображений, таких как « Девочка Вермеера с жемчужной сережкой» .

Исследователи разместили свой метод, который они называют «обучением в несколько выстрелов», на YouTube и в статье, которая еще не рецензировалась в репозитории препринтов arXiv.org. Хотя детали становятся довольно техническими, Минди Вайсбергер из LiveScience сообщает, что для создания живых портретов тип искусственного интеллекта, называемый сверточной нейронной сетью, обучается на основе анализа эталонных изображений. Затем он применяет лицевые движения из серии кадров к статическому изображению, например, Моне Лизе . Чем больше у него углов и эталонных изображений, тем лучше становится живой портрет. Согласно документу, ИИ может создавать «идеальный реализм» (измеряемый способностью человека различать, какие из трех наборов изображений были глубокими), используя всего 32 эталонных изображения.

Мона Лиза, конечно, всего лишь один образ, поэтому три «живых портрета» шедевра Леонардо немного тревожат. Для кратких анимаций нейронная сеть наблюдала три разных обучающих видео, и каждая из трех версий Моны Лизы, основанная на этих кадрах, кажется, имеет разные личности. Если бы Леонардо нарисовал свою знаменитую модель под разными углами, система могла бы создать еще более реалистичный живой портрет.

В то время как оживленная Мона Лиза развлекает, рост глубоких подделок породил обеспокоенность тем, что сгенерированные компьютером сходства могут использоваться для клеветы на людей, разжигания расовой или политической напряженности и дальнейшего разрушения доверия к онлайн-СМИ. «Это подрывает наше доверие ко всем видео, включая подлинные», - пишет Джон Вильясенор из The Brookings Institution. «Сама истина становится неуловимой, потому что мы больше не можем быть уверены в том, что реально, а что нет».

В то время как ИИ используется для создания глубоких подделок, Вильясенор говорит, что, по крайней мере, на данный момент, его также можно использовать для выявления глубоких подделок путем поиска несоответствий, которые не видны человеческому глазу.

Тим Хванг, директор Инициативы по этике и управлению ИИ Гарварда и Массачусетского технологического института, говорит Грегори Барберу из Wired, что мы еще не достигли того уровня, когда плохие актеры могут создавать сложные глубокие подделки на своих личных ноутбуках. «Ничто не подсказывает мне, что вы просто будете использовать это под ключ для создания глубоких подделок дома», - говорит он. «Не в краткосрочной, среднесрочной или даже долгосрочной перспективе».

Это потому, что использование новой системы Samsung стоит дорого и требует опыта. Но статья Барбера указывает на то, что для того, чтобы одурачить людей, не нужно очень сложное фотореалистичное видео, сделанное нейронной сетью. Буквально на прошлой неделе в социальных сетях распространялось видео с манипуляциями, замедленное для того, чтобы спикер Палаты представителей США Нэнси Пелоси пьяным звучал.

В конечном счете, однако, технология будет достаточно хороша, чтобы плохие актеры могли производить глубокие подделки, настолько убедительные, что их невозможно обнаружить. Когда этот день наступит, Хванг говорит Wired, людям нужно будет полагаться на проверку фактов и контекстные подсказки, чтобы разобраться, что реально, а что фальшивка. Например, если недоверчивая полуулыбка Моны Лизы становится зубастой улыбкой, и она пытается продать вам отбеливающую зубную пасту, это, безусловно, глубокая подделка.