Базовый минимум про ИИ

Это первая статья из цикла «Базовый минимум» — коротко про то, как устроен ИИ. Каждая статья будет освещать одно понятие или концепцию, постараюсь делать их короткими и последовательными.

Начнём с общепринятых терминов, далее поговорим про промпт-инжиниринг, RAG-системы и агентов, способных выполнять сложные многоступенчатые задачи.

Видео версия: Смотреть на YouTube

Что такое языковая модель

Языковая модель — это система, которая по уже сказанному предсказывает следующее слово. И так в цикле:

шла → шла Саша → шла Саша по → шла Саша по шоссе → …

Наполняя свой контекст словами, которые сама же модель только что и сказала.

Где мы с ними сталкиваемся

Любой чат-бот — будь то «помощник» из поддержки, который нас бесит, и мы добиваемся поговорить с менеджером, или «умные» чаты вроде DeepSeek или ChatGPT — везде языковая модель.

Отличаются «помощник» из поддержки от «умного» из DeepSeek только масштабом: масштабом набора данных (датасет) и серверов, способных эти данные переварить.

Масштаб параметров

В итоге получаем масштаб параметров:

1–7 миллиардов — модели, которые можно запустить на своём локальном ноутбуке
Триллионы — для которых необходимы кластеры серверов

Модели на триллионы параметров называют фундаментальными: они впитали в себя не просто статистику воспроизведения последовательности слов, но и усвоили знания, которые запечатаны в языке. Ведь язык — это не только инструмент общения, но и форма фиксации коллективного опыта.

ИИ, МО и НС — в чём разница

ИИ (искусственный интеллект) — самое широкое понятие: системы и программы, которые ведут себя «умно» — решают задачи, которые обычно требуют человеческого интеллекта (понимание речи, игра в шахматы, распознавание образов, принятие решений и т.п.). ИИ может быть реализован и без машинного обучения (например, правила, экспертные системы).

МО (машинное обучение) — подмножество ИИ: способ строить ИИ так, чтобы система сама училась на данных, а не по заранее прописанным правилам. Задача — по примерам (данным) находить закономерности и использовать их для предсказаний или решений. МО включает не только нейросети, но и другие методы: деревья решений, линейные модели, кластеризацию и т.д.

НС (нейронные сети) — подмножество МО: модели, устроенные по аналогии с нейронами в мозге (слои, веса, активации). Один из самых мощных инструментов МО, особенно для изображений, текста, речи. Глубокое обучение (deep learning) — это МО с многослойными нейросетями.

Связь: ИИ ⊃ МО ⊃ НС — нейросети являются видом машинного обучения, а машинное обучение — одним из способов реализовать искусственный интеллект.

Закрепляем материал

Небольшие игры помогут проверить, насколько хорошо ты усвоил материал.

Викторина:

Разложи по полочкам — перетащи тезисы на нужные полки (ИИ, МО, НС, Масштаб параметров):

Дальше в цикле

В следующих статьях разберём: как от простых моделей пришли к трансформерам, что такое токены и параметры, чем инструктивные и мультимодальные модели отличаются от «просто текстовых», и зачем это всё нужно.