Карта освещения для 2D спрайтов и изображений

Чтобы в 3D окружении текстуры выглядели более выпукло, они реагируют на освещение используя Normal map. Это такая дополнительная карта-текстура, пиксели которой сообщают об вымышленном угле наклона отражения света от текстуры. Такой приём используют не только в 3D но и в 2D играх на спрайтах.

Чтобы упростить создание таких карт даже есть несколько инструментов, например, Laigter, Sprite Lamp, Sprite DLight. Вот, например, наглядное видео про генератор Sprite Dlight, который автоматически по спрайту создаёт такую карту, поскольку информации в спрайте обычно достаточно: придается общая выпуклость всему спрайту по контуру непрозрачности, и, дополнительно, выявляется и накладывается объём у деталей, исходя из контрастной информации соседних пикселей.

И вот недавно появилась публикация о продвинутом инструменте для изменения освещения на основе любой 2D информации. На основе имеющегося рисунка составляется представление об освещении, и, затем, появляется возможность отделить цвет от освещения и поменять источник освещения на изображении.

Это означает, что через какое-то время следует ждать инструмент и для исправления и для автоматического рисования освещения. Разумеется, эти инструменты не заменят рисование света и теней руками, но серьёзно сократят время потраченное на рутинную работу по поиску подходящего освещения и созданию наброска, что облегчит значительную часть работы.

Вот инструкция как имеющуюся карту нормалей можно использовать в 2D графике.

Как распознать голос из видео на Youtube в текст

Отличный простой, полуручной, способ сделать титры для собственного видео на ютюбе, не перенабирая текст руками:
Для распознавания голоса с Ютюб в текст надо установить виртуальную звуковую карту VoiceMeeter, сделать в Windows устройство записи по умолчанию VoiceMeeter Input (виртуальный микрофон), а устройством воспроизведения по умолчанию VoiceMeeter Output (виртуальные колонки). Выбрать в Google Docs меню Инструменты → Голосовой ввод, в появившемся окне с большая иконкой микрофона выбрать в маленькой выпадалочке язык распознавания. Теперь во втором окне запустить видео с речью, и тут же вернуться в окно Google Docs и включить Распознавание (Нажать, на большую иконку микрофона, чтобы стала оранжевой). Фокус с окна Google Docs нельзя убирать! После этого останется лишь отредактировать текст руками, потому что распознавание не идеальное и абзацев автоматически не расставляет.

Разумеется, таким образом можно любой видео или аудиофайл в текст распознать.

Будущее за нейро коммерцией!

Предсказываю, что первой эффективной областью массового использования нейросетей и, конкретнее, дипфейков будут интернет-магазины. Конкретнее, там где требуется продемонстрировать как товар подходит именно вам, например, на интернет-витринах одежды.

Вот как я думаю это будет работать: сейчас интернет-магазин может составить достаточно ясную картину о вас, спасибо инстаграму и фэйсбуку легко отследить не только интересы но и то как вы выглядете. Заходя на сайт для выбора одежды вам будут показывать не просто заготовленные фотографии товаров на манекенах или непохожих на вас людей. Фотографии моделей в одежде будут на лету изменяться, чтобы выглядеть похожими на вас, вашу расу, комплекцию — всё, что поможет вам проассоциировать товар с вами. Такой генератор очень сильно увеличит продажи — то что похожие фотографии продают лучше хорошо известно и вы сами можете это за собой заметить.

Впрочем брать информацию из соцсетей не обязательно. Достаточно будет устроить автоматическое А/Б тестирование, в ходе которого нейросеть будет выдавать гипотезами всё более продающие изображения для каждой выборки посетителей. В итоге нейроэволюционный отбор добудет самые подходящие фотографии под каждую геолокацию.

Ну и чтобы два раза не вставать, посмотрите на любопытный список онлайн генератороров, какие есть в общем доступе: https://thisxdoesnotexist.com/

Вот, например, случайное ненастоящее лицо:

Случайная ненастоящая абстрактная картина:

А вот случайный ненастоящий котик:

…Песен еще ненаписанных, сколько? Скажи, кукушка…

Дамьен Риль и программист и музыкант Ной Рубин разработали алгоритм, который записывал каждую возможную комбинацию из восьми нот и 12 тактов. И опубликовали все мелодии под лицензией CC0, которая позволяет сделать произведения практически «общественным достоянием». Архив мелодий занимает 601 GB. Подробнее на английском. Вот TEDx про это.

Стоит вспомнить, что уже есть библиотека всех текстов libraryofbabel.info. А значит теперь дело за малым — скомбинировать все варианты музыки со всеми вариантами текстов, чтобы сделать все варианты песен!

 

 

Обнаружил визуальный инструмент для работы с DirectX, называется «VVVV». Процедурный генератив, мэппинг на здания и т.п. диджитал арт.
https://vvvv.org
Своеобразный UI, но катастрофически мощный. На Вимео много https://vimeo.com/search/?q=vvvv.