Друг-математик попросил меня сегодня сделать ему дидактический материал, чтобы объяснять на пальцах восьмеричную систему исчисления. Вот что получилось.
Сырьё за 15 минут получил у Дейла ChatGPT: удачный визуал, но с обрезанным 0, без четырёхпалой 2 и без 4.
Еле уговорил создать что-то похожее на 2 так, чтобы большой палец касался одного мизинца — не может Дейл сделать из 4 пальцев знак V, только из пяти пальцев. Легко сгенерил отдельно 4.
И 40 мин фотошопил c clone fill и puppet wrap.
Шрифт Ubuntu для цифр — давно считаю его подходящим для детей, у шрифта очень круглый и чёткий характер.
Работа модели по другому называется inference (вывод) или использование весов модели. Вывод — по сути предсказание следующего токена на основе вашего ввода и всех токенов сгенерированных на предыдущих шагах. Все это образует последовательность.
Токены — это не слова. Токены это кусочки обозначающие текст, который видит модель. В модели они представлены целыми числами или ID токенов. Токенизация — разбиение текста на токены. Распространенные алгоритмы: BPE (byte pair encoding), SentencePiece. Конкретные токены отличаются в разных моделях. Вот иллюстративный пример: “hello” — может быть 1-3 токена, “internationalization” 5-8 токенов.
Контекстное окно — максимальное количество токенов, которые может увидеть модель за раз. Чем больше context тем больше VRAM для KV кеша потребуется и тем медленнее будет декодировка.
В процессе вывода модель предсказывает следующий токен перемножая свои веса. Веса модели — это миллиарды выученных параметров. Параметры модели — миллиарды чисел или весов, которые модель усваивает в процессе обучения. Эти веса кодируют все что модель знает: шаблоны, язык, факты, “мышление”. Когда вы используете модель, она использует эти параметры, чтобы предугадать следующий наиболее вероятный токен. Один токен за раз. Шаг за шагом.
Записал видео-ответ на регулярный вопрос: «Какая есть хорошая бесплатная нейросеть для генерации картинок?»
Ответ: Recraft и за 15 минут показываю его базовые возможности: https://youtu.be/mg6lHDbLkus?si=y5EFeXYQxIfA3n_Q
Кратко:
— Очень удобный наглядный интерфейс: раскладывание изображений на рабочем столе
— Огромный выбор стилей для генерации изображения
— Вариации и изменение пропорций формата
— Удаление фона вокруг объектов до прозрачности
— Стирание лишних элементов, замена областей
— Генерация сетов изображений, все в одном стиле
— Качественное увеличение изображений
— Экспорт в PNG, JPG, TIFF, SVG, PDF
— Подходит для бесплатного ежедневного использования.
ИИ пишет описания вакансий.
ИИ отбирает вакансии.
ИИ пишет резюме.
ИИ пишет сопроводительные письма.
ИИ фильтрует отправленные резюме.
ИИ проверяет кандидатов.
ИИ находит проблемы в отправленных резюме.
ИИ отвечает на отправленные резюме.
ИИ составляет ответы на приглашения.
ИИ проводит скрининг.
ИИ предлагает ответы на вопросы.
ИИ составляет текст предложения о работе.
ИИ рекомендует рецепт победного коктейля.
Я по умениям и увлечениям — дизайнер и иллюстратор, а по майндсету — инженер и арт-директор. С огромным удовольствием использую ИИ и не вижу никакой конкуренции в его лице, ощущаю как помощника. Ставить задачу что джуну, что ИИ — примерно одно и то же, и всё равно потом надо делать ревизию.
ИИ создаёт то, что его просят. Если просить несложное, то на базовом уровне он даёт приемлемый результат. Поэтому какие-нибудь простые штуки типа листовки А4 «Купите мороженое» и вывески «Шиномонтаж» сейчас можно сделать бесплатно с помощью ИИ. Ну и что — раньше эта задача доставалась самому начинающему дизайнеру, тоже забесплатно.
А какие-то сложные штуки — типа брендирования, комплексного визуального оформления, создания продающих сайтов, которые действительно впечатляют, отвечают на запрос посетителя, учитывают предложения конкурентов, работают как реклама, — такое совершенно нельзя сделать через ИИ, потому что поставить задачу, подробить её становится столь же трудоёмким или даже более сложным делом, как и нарисовать это человеку, который хорошо понимает, что хочет получить.
То есть преградой для качественной работы с ИИ оказывается интерфейс общения. (Жду, когда будет микрочип в мозгу, чтобы избежать в работе ограничивающей вербализации.)
Как же быть начинающему? Очень просто — надо использовать ИИ: сперва это даёт буст к качеству, потом, когда приходит понимание качества, это будет давать буст к скорости работы. «Водители», «официанты», «строители», «проектировщики» любого уровня будут нужны всегда, неважно, в какой это сфере индустрии и какой уровень технологий.
Появление фотоаппарата не убило живопись и портреты маслом, а лишь понизило в них нужду. При этом появление фотоаппарата заставило переосмыслить значение художника, от ремесленника к артисту. А так же открыло много других возможностей для работы, от массового рынка рисования по фотографии до ювелирного направления «фотореализм». Так что луддизм в отношении ИИ я не считаю обоснованным, и наоборот вижу в появлении ИИ дар силы и шанса сделать то, на что раньше бы и не решился.
В цифровом мире автор не несёт затрат на копирование. Авторское право существует только из-за юридического легаси. Поэтому не вижу существования проблемы нарушений авторского права в тренировке ИИ — это не прямое копирование и не отнимает у автора ничего.
Наоборот, я надеюсь, что появление ИИ позволит выровнять стоимость на сиюминутную моду, «в нужное время в нужном месте» и прочие истории успеха, которые происходят исключительно благодаря удаче или являются ценностью без основания.