DALL-E и прочие ИИ-инструменты, способные создавать фантастические изображения по текстовому описанию, привлекли внимание к генеративным моделям искусственного интеллекта. Но их возможности этим не ограничиваются – искусственный интеллект уже умеет создавать тексты, придумывать шрифты и изображать нашу речь в картинках.
Лучшие инструменты для создания визуальных произведений
Magenta — исследовательский open-source проект, изучающий роль машинного обучения как инструмента в творческом процессе. Требует навыков программирования.
Processing — гибкая программа для ведения заметок, обучающая программированию в контексте визуальных искусств. Включает p5js (для JavaScript) и Processing.py (для Python). Не использует ИИ, но подходит для работы с генеративным визуальным искусством.
ml5.js — инструмент стремится сделать машинное обучение доступным для широкой аудитории художников, креативных разработчиков и учащихся.
DeepArt.io — позволяет загрузить фото и применить к нему различные художественные стили.
Visionist — инструмент редактирует изображения при помощи стилей на базе ИИ, создавая абстракции, контурные портреты и так далее (версия для iOS — Deep Art generator, разработанный 3DTOPO Inc.).
GoArt — ИИ-эффекты позволяют фотографиям выглядеть как известные портреты (есть версии для Web, Android и iOS. Разработано Fotor).
Deep Angel — редактор автоматически удаляет объекты или людей с изображений.
Fractal Art Generators — не используют ИИ как таковой, но не менее интересны, поскольку относятся к области искусства, сгенерированного машиной.
Обработка и создание изображений
AutoDraw — превращает набросок в графическое изображение.
AI Painter – превращает фотографии в картины, созданные ИИ, или создает абстрактные изображения с помощью нейросети.
Quick, Draw! — игра, в которой нейросеть пытается угадать, что рисует пользователь.
NSynth Sound Maker — позволяет пользователю сочинять собственные гибридные звуки и инструменты.
MuseNet — инструмент воспроизводит 4-минутные музыкальные композиции с помощью 10 инструментов и может комбинировать стили от кантри до Моцарта с помощью MuseNet (также доступен на GitHub).
Движения и танец
AI Sketches With Bill T. Jones — модель PoseNet в буквальном смысле изучает «язык тела», оценивая связь между положением тела, речью и движениями танцоров.
Голос и устный перевод
Scribbling Speech — в реальном времени превращает речь в анимированные рисунки.
Thing Translator — воспроизводит название предмета на разных языках, используя лишь его фотографию.
t-SNE — создает двумерные карты данных с сотнями и даже тысячами измерений.
Обучение нейросетей
Teachable machine — позволяет обучить нейросеть в реальном времени и прямо в браузере, используя собственную камеру. Не требует писать код.
Типографика
FontJoy — создает комбинации шрифтов при помощи глубокого обучения.
Font Map — находит новые связи между шрифтами при помощи машинного обучения.
Генеративно-состязательные сети
GAN (Generative adversarial network, генеративно-состязательные сети) — алгоритмы машинного обучения такого рода построены на комбинации двух нейросетей, одна из которых создает образцы, а другая — стремится отличить подлинные образцы от имитаций. Часто используются для генерации реалистичных изображений.
GAN Zoo — поименный список генеративно-состязательных сетей (GAN), который время от времени обновляется.
TensorFlow.js — библиотека для разработки и обучения МО-моделей на JavaScript.
scikit-learn — один из самых популярных инструментов сбора и анализа данных. Он создан на базе NumPy, SciPy и matplotlib с открытым исходным кодом, пригоден для коммерческого использования (лицензия BSD).