Это первая статья из цикла «Базовый минимум» — коротко про то, как устроен ИИ. Каждая статья будет освещать одно понятие или концепцию, постараюсь делать их короткими и последовательными.
Начнём с общепринятых терминов, далее поговорим про промпт-инжиниринг, RAG-системы и агентов, способных выполнять сложные многоступенчатые задачи.
Видео версия: Смотреть на YouTube
Что такое языковая модель
Языковая модель — это система, которая по уже сказанному предсказывает следующее слово. И так в цикле:
шла → шла Саша → шла Саша по → шла Саша по шоссе → …
Наполняя свой контекст словами, которые сама же модель только что и сказала.
Где мы с ними сталкиваемся
Любой чат-бот — будь то «помощник» из поддержки, который нас бесит, и мы добиваемся поговорить с менеджером, или «умные» чаты вроде DeepSeek или ChatGPT — везде языковая модель.
Отличаются «помощник» из поддержки от «умного» из DeepSeek только масштабом: масштабом набора данных (датасет) и серверов, способных эти данные переварить.
Масштаб параметров
В итоге получаем масштаб параметров:
- 1–7 миллиардов — модели, которые можно запустить на своём локальном ноутбуке
- Триллионы — для которых необходимы кластеры серверов
Модели на триллионы параметров называют фундаментальными: они впитали в себя не просто статистику воспроизведения последовательности слов, но и усвоили знания, которые запечатаны в языке. Ведь язык — это не только инструмент общения, но и форма фиксации коллективного опыта.
ИИ, МО и НС — в чём разница
ИИ (искусственный интеллект) — самое широкое понятие: системы и программы, которые ведут себя «умно» — решают задачи, которые обычно требуют человеческого интеллекта (понимание речи, игра в шахматы, распознавание образов, принятие решений и т.п.). ИИ может быть реализован и без машинного обучения (например, правила, экспертные системы).
МО (машинное обучение) — подмножество ИИ: способ строить ИИ так, чтобы система сама училась на данных, а не по заранее прописанным правилам. Задача — по примерам (данным) находить закономерности и использовать их для предсказаний или решений. МО включает не только нейросети, но и другие методы: деревья решений, линейные модели, кластеризацию и т.д.
НС (нейронные сети) — подмножество МО: модели, устроенные по аналогии с нейронами в мозге (слои, веса, активации). Один из самых мощных инструментов МО, особенно для изображений, текста, речи. Глубокое обучение (deep learning) — это МО с многослойными нейросетями.
Связь: ИИ ⊃ МО ⊃ НС — нейросети являются видом машинного обучения, а машинное обучение — одним из способов реализовать искусственный интеллект.
Закрепляем материал
Небольшие игры помогут проверить, насколько хорошо ты усвоил материал.
Викторина:
Разложи по полочкам — перетащи тезисы на нужные полки (ИИ, МО, НС, Масштаб параметров):
Дальше в цикле
В следующих статьях разберём: как от простых моделей пришли к трансформерам, что такое токены и параметры, чем инструктивные и мультимодальные модели отличаются от «просто текстовых», и зачем это всё нужно.