Локальные LLM, Что происходит, когда вы запускаете LLM?

¶ Копипаста. Не я автор этого текста.

Источник: https://x.com/softwarevlogger/status/1974774200612093992

Что происходит, когда вы запускаете LLM?

Работа модели по другому называется inference (вывод) или использование весов модели. Вывод — по сути предсказание следующего токена на основе вашего ввода и всех токенов сгенерированных на предыдущих шагах. Все это образует последовательность.

Токены — это не слова. Токены это кусочки обозначающие текст, который видит модель. В модели они представлены целыми числами или ID токенов. Токенизация — разбиение текста на токены. Распространенные алгоритмы: BPE (byte pair encoding), SentencePiece. Конкретные токены отличаются в разных моделях. Вот иллюстративный пример: “hello” — может быть 1-3 токена, “internationalization” 5-8 токенов.

Контекстное окно — максимальное количество токенов, которые может увидеть модель за раз. Чем больше context тем больше VRAM для KV кеша потребуется и тем медленнее будет декодировка.

В процессе вывода модель предсказывает следующий токен перемножая свои веса. Веса модели — это миллиарды выученных параметров. Параметры модели — миллиарды чисел или весов, которые модель усваивает в процессе обучения. Эти веса кодируют все что модель знает: шаблоны, язык, факты, “мышление”. Когда вы используете модель, она использует эти параметры, чтобы предугадать следующий наиболее вероятный токен. Один токен за раз. Шаг за шагом.

Читать далее…

Почему вас всё бесит

¶ Копипаста. Не я автор этого текста.

 

Если и есть в нейробиологии одна идея, в справедливости которой мне хотелось бы убедить всех людей на земле, то такой идеей я считаю следующую: сознание — это пассажир мозга, который мнит себя машинистом.

Почему это важно? Потому, что если вы этого не понимаете, то с большой вероятностью ведете себя как дебил. Вот представьте, что вы разговариваете по телефону с другом, заходите в лифт, связь прерывается, говорить становится невозможно. И тут вы вместо того, чтобы минуту подождать, начинаете сердиться, ругаться и грозить другу расправой при встрече за то, что он над вами так издевается. Тупо? Тупо. Друг же не виноват, что у вас в лифте телефон не ловит. Вот примерно настолько же резонны 99 % любых проявлений раздражения.
(далее…)