Технологии

Nvidia показала нейросеть, превращающую простые скетчи в фотореалистичные изображения

Лайнуть/Поделиться

Искусственный интеллект способен преобразовывать наброски за секунды.

В прошлом году в Калифорнии проходила конференция GTC 2019, организованная компанией Nvidia. На ней представители американского производителя графических процессоров продемонстрировали искусственный интеллект, который за секунды обрабатывает схематичный набросок и превращает его в фотореалистичное изображение.

Нейросеть носит название GauGAN, которое она получила в честь живописца Поля Гогена, чьи работы относят к направлению постимпрессионизма. Она представляет собой генеративно-состязательную сеть (GAN). В нее входит две сети, которые называют генератором и дискриминатором. Генератор создает изображение, а дискриминатор, обученный на реальных фотографиях, подсказывает, как его необходимо исправить.

Интерфейс приложения состоит из трех инструментов: кисти, карандаша и заливки. Помимо них, доступны различные текстуры — от неба до камней и деревьев. Достаточно выбрать нужную текстуру, задать форму, залить, и нейросеть сама создаст на ее месте реалистичный объект.

Для тренировки искусственного интеллекта (ИИ) использовали один миллион фотографий, большую часть которых взяли с портала Flickr. Вице-президент по прикладным исследованиям в области ИИ Брайан Катандзаро (Bryan Catanzaroзаверил, что они соблюдали авторское право.

Создатели отмечают, что нейросеть способна менять время суток и времена года. К примеру, если указать зиму, то изменится не только ландшафт, который теперь покроется снегом, но и небо — оно станет облачным и серым. То же касается и деревьев, которые скинут листья. При этом GauGAN понимает, когда объекты стоят перед водной гладью, и отражает их там. Алгоритм мультимодальный: даже по двум одинаковым эскизам он создаст два отличающихся изображения.

Во время демонстрации программа производила все процессы за секунды в режиме реального времени. Брайан Катандзаро сказал, что такие результаты получились благодаря графическому процессору Titan. Однако, по его словам, с некоторыми доработками алгоритм сможет работать практически на любой платформе, но процесс преобразования займет больше времени.

Пока GauGAN работает только с объектами природы, но авторы не исключают возможности натренировать алгоритм на отображение зданий, дорог, людей и других элементов реальности. По мнению Катандзаро, этот инструмент пригодится ландшафтным дизайнерам, архитекторам и всем тем, кто связан с созданием виртуальных миров. Он надеется, что демоверсия скоро появится на сайте Nvidia — AI Playground, который компания также представила на GTC 2019.

Источник: naked-science

Редакция

Метки: ИИ

Недавние публикации

Костный мозг черепа расширяется на протяжении всей жизни и практически не стареет

Рост сосудов в костном мозге черепа на протяжении всей жизни приводит к увеличению выработки клеток… Читать далее

05/01/2025

Перетягивание каната в мозге: выбор между классическим и оперантным обучением

Исследование Тель-Авивского университета может изменить наше понимание того, как люди учатся и формируют память, особенно… Читать далее

27/12/2024

Сайты, расширяющие кругозор, буквально

Эти сайты расширят ту область, которую вы можете охватить своим взглядом в пространстве-временном континууме. Линейка… Читать далее

25/12/2024

Терпение – не добродетель, а стратегия преодоления жизненных задержек

Новое исследование ставит под сомнение вековое представление о терпении как о моральной добродетели, показывая, что… Читать далее

21/12/2024

Анализ бега австралопитека: Как мы в разы увеличили скорость бега за 3 млн. лет эволюции

3D-модели Australopithecus afarensis указывают на мышечные адаптации, которые сделали современных людей лучшими бегунами. Древние родственники… Читать далее

20/12/2024

Рои роботов, схожие на муравьев, поднимают тяжелые предметы и перепрыгивают через препятствия

Ученые из Южной Кореи разработали рой крошечных магнитных роботов, которые работают вместе, как муравьи, и… Читать далее

19/12/2024