Здесь собраны термины, которые часто встречаются при работе с ChatGPT, Claude, Midjourney и другими нейросетевыми сервисами. Словарь помогает быстро понять новые понятия без погружения в академические детали. Словарь организован в алфавитном порядке. Если какого-то термина нет — вы всегда можете спросить у модели (ChatGPT/Claude) простое объяснение или пример применения.
Для вашего удобства можно скачать данный словарь здесь.
Словарь
А
AGI (Artificial General Intelligence) — гипотетический ИИ общего назначения, способный решать широкий круг задач на уровне человека или выше.
API (Application Programming Interface) — программный интерфейс для подключения возможностей ИИ к приложениям и сайтам.
VAE (Variational Autoencoder) — тип модели, сжимающий данные в «код» и восстанавливающий их обратно; используется в генеративной графике.
Агент ИИ — автономная система на базе модели, которая планирует и выполняет цепочки действий для достижения цели.
Антропоморфизм — приписывание моделям человеческих качеств; важно помнить, что это статистические алгоритмы, а не личности.
Аугментация данных — искусственное расширение датасета (перестановки, шум, синтетика), чтобы модель обобщала лучше.
Аватар ИИ — визуально-голосовой интерфейс для общения с моделью.
Апскейлинг (Upscaling) — увеличение разрешения изображения с улучшением деталей нейросетью.
ИИ (Искусственный интеллект, AI) — набор методов и систем, выполняющих задачи, требующие «умственных» навыков; сегодня чаще — нейросети.
Б
Бенчмарк — стандартный тест для сравнения моделей (например, MMLU, HumanEval).
Бот — программа, имитирующая действия пользователя; чат-боты на ИИ ведут диалог и решают задачи.
Большая языковая модель (LLM) — модель, обученная на больших корпусах текста для понимания и генерации языка (например, GPT, LLaMA, Claude).
В
Векторное представление (эмбеддинг) — числовой вектор, отражающий смысл слова, фразы, изображения и т. п.
Внимание (Attention) — механизм, который помогает модели выделять важные фрагменты входных данных.
Весы модели (Weights) — параметры, полученные в процессе обучения; определяют поведение модели.
Voice cloning (клонирование голоса) — синтез речи, имитирующий тембр и манеру конкретного человека.
Г
GAN — генеративно-состязательные сети из двух частей (генератор/дискриминатор), которые «соревнуются», повышая реализм.
GPT (Generative Pre-trained Transformer) — семейство моделей OpenAI, на которых работает ChatGPT.
Gemini — мультимодальная модель Google (бывш. Bard).
Guidance / CFG (Classifier-Free Guidance) — настройка «насколько строго» генерация изображения следует текстовому описанию.
Генерация контента — практическое применение генеративных моделей (копирайт, иллюстрации, музыка и т. п.).
Д
DALL·E — модель OpenAI для генерации изображений по тексту.
DreamBooth — дообучение модели генерации на нескольких фото конкретного объекта/персоны.
Дата отсечки (Knowledge cutoff) — дата, после которой модель не знает о новых событиях из обучения.
Датасет — набор данных для обучения/оценки.
Дата-скрейпинг — автоматический сбор данных из интернета.
Диффузионная модель — поэтапно убирает «шум» из случайного изображения, «проявляя» картинку; основа Stable Diffusion, Midjourney, DALL·E.
Е
Естественный язык — человеческий язык (русский, английский и т. д.).
Естественно-языковой интерфейс (NLI) — управление программой обычной речью/текстом.
Ё
Ёмкость модели — способность кодировать и обрабатывать информацию; грубо коррелирует с числом параметров и архитектурой.
Ж
Жизненный цикл модели — сбор данных → обучение → валидация → развёртывание → мониторинг → обновления.
Журнал взаимодействий — история диалога/операций; используется для улучшений и восстановления контекста (при наличии соответствующих настроек приватности).
З
Запрос (Prompt) — формулировка задания для модели. Качество запроса сильно влияет на результат.
Знания модели — информация, закреплённая в параметрах после обучения; не обновляется без дообучения или подключения внешних источников.
И
Img2img — генерация нового изображения на основе уже существующего и текста.
Inpainting (дорисовка) — замена/восстановление части изображения.
Инструменты (Tools / Function calling) — вызовы внешних функций/поиска/БД из модели.
Инференс — использование обученной модели для ответов на новые запросы.
Инструкция (Instruction) — указание модели «как отвечать».
Итеративное мышление (Chain-of-thought) — пошаговое рассуждение; обычно скрыто для пользователя.
Интеграция — встраивание ИИ в продукты и процессы.
К
ControlNet — расширение Stable Diffusion для тонкого контроля (контуры, позы, карты глубины).
Копилот (Co-pilot) — помощник на базе ИИ, ускоряющий работу человека (например, GitHub Copilot).
Контекст — объём информации, доступной модели в текущем запросе/диалоге.
Контекстное окно — максимальное число токенов, обрабатываемых за раз (например, 8K, 32K, 100K+).
Кратность (k-shot learning) — обучение на считанных примерах прямо в запросе.
Коэффициент достоверности (Confidence score) — численная оценка уверенности. В языковых моделях обычно не надёжна и редко даётся напрямую; требуются отдельные методы калибровки.
Л
LLaMA — семейство открытых языковых моделей от Meta.
LoRA (Low-Rank Adaptation) — лёгкое дообучение модели с малым числом добавочных параметров.
Latent space (латентное пространство) — сжатое представление данных, где модель «манипулирует» смыслами.
Локальная модель — работает на вашем устройстве/сервере, а не в облаке.
М
Midjourney — сервис генерации изображений по тексту.
Машинное обучение (ML) — методы, позволяющие системам «учиться» по данным.
Модерация — фильтрация нежелательного контента.
Мультимодальная модель — обрабатывает несколько типов данных (текст, изображение, аудио, видео).
Мультиагентная система — несколько ИИ-агентов, координирующих действия.
Н
NSFW-фильтр — блокирует неприемлемый контент.
Негативный промпт — то, чего не должно быть в сгенерированном изображении.