Здесь собраны термины, которые часто встречаются при работе с ChatGPT, Claude, Midjourney и другими нейросетевыми сервисами. Словарь помогает быстро понять новые понятия без погружения в академические детали.
Словарь организован в алфавитном порядке. Если какого-то термина нет — вы всегда можете спросить у модели (ChatGPT/Claude) простое объяснение или пример применения.
Для вашего удобства можно скачать данный словарь здесь.
Словарь
А
AGI (Artificial General Intelligence) — гипотетический ИИ общего назначения, способный решать широкий круг задач на уровне человека или выше.
API (Application Programming Interface) — программный интерфейс для подключения возможностей ИИ к приложениям и сайтам.
VAE (Variational Autoencoder) — тип модели, сжимающий данные в «код» и восстанавливающий их обратно; используется в генеративной графике.
Агент ИИ — автономная система на базе модели, которая планирует и выполняет цепочки действий для достижения цели.
Антропоморфизм — приписывание моделям человеческих качеств; важно помнить, что это статистические алгоритмы, а не личности.
Аугментация данных — искусственное расширение датасета (перестановки, шум, синтетика), чтобы модель обобщала лучше.
Аватар ИИ — визуально-голосовой интерфейс для общения с моделью.
Апскейлинг (Upscaling) — увеличение разрешения изображения с улучшением деталей нейросетью.
ИИ (Искусственный интеллект, AI) — набор методов и систем, выполняющих задачи, требующие «умственных» навыков; сегодня чаще — нейросети.
Б
Бенчмарк — стандартный тест для сравнения моделей (например, MMLU, HumanEval).
Бот — программа, имитирующая действия пользователя; чат-боты на ИИ ведут диалог и решают задачи.
Большая языковая модель (LLM) — модель, обученная на больших корпусах текста для понимания и генерации языка (например, GPT, LLaMA, Claude).
В
Векторное представление (эмбеддинг) — числовой вектор, отражающий смысл слова, фразы, изображения и т. п.
Внимание (Attention) — механизм, который помогает модели выделять важные фрагменты входных данных.
Весы модели (Weights) — параметры, полученные в процессе обучения; определяют поведение модели.
Voice cloning (клонирование голоса) — синтез речи, имитирующий тембр и манеру конкретного человека.
Г
GAN — генеративно-состязательные сети из двух частей (генератор/дискриминатор), которые «соревнуются», повышая реализм.
GPT (Generative Pre-trained Transformer) — семейство моделей OpenAI, на которых работает ChatGPT.
Gemini — мультимодальная модель Google (бывш. Bard).
Guidance / CFG (Classifier-Free Guidance) — настройка «насколько строго» генерация изображения следует текстовому описанию.
Генеративный ИИ — модели, создающие новый контент (текст, изображение, звук, видео).
Генерация контента — практическое применение генеративных моделей (копирайт, иллюстрации, музыка и т. п.).
Д
DALL·E — модель OpenAI для генерации изображений по тексту.
DreamBooth — дообучение модели генерации на нескольких фото конкретного объекта/персоны.
Дата отсечки (Knowledge cutoff) — дата, после которой модель не знает о новых событиях из обучения.
Датасет — набор данных для обучения/оценки.
Дата-скрейпинг — автоматический сбор данных из интернета.
Диффузионная модель — поэтапно убирает «шум» из случайного изображения, «проявляя» картинку; основа Stable Diffusion, Midjourney, DALL·E.
Е
Естественный язык — человеческий язык (русский, английский и т. д.).
Естественно-языковой интерфейс (NLI) — управление программой обычной речью/текстом.
Ё
Ёмкость модели — способность кодировать и обрабатывать информацию; грубо коррелирует с числом параметров и архитектурой.
Ж
Жизненный цикл модели — сбор данных → обучение → валидация → развёртывание → мониторинг → обновления.
Журнал взаимодействий — история диалога/операций; используется для улучшений и восстановления контекста (при наличии соответствующих настроек приватности).
З
Запрос (Prompt) — формулировка задания для модели. Качество запроса сильно влияет на результат.
Знания модели — информация, закреплённая в параметрах после обучения; не обновляется без дообучения или подключения внешних источников.
И
Img2img — генерация нового изображения на основе уже существующего и текста.
Inpainting (дорисовка) — замена/восстановление части изображения.
Инструменты (Tools / Function calling) — вызовы внешних функций/поиска/БД из модели.
Инференс — использование обученной модели для ответов на новые запросы.
Инструкция (Instruction) — указание модели «как отвечать».
Итеративное мышление (Chain-of-thought) — пошаговое рассуждение; обычно скрыто для пользователя.
Интеграция — встраивание ИИ в продукты и процессы.
К
ControlNet — расширение Stable Diffusion для тонкого контроля (контуры, позы, карты глубины).
Копилот (Co-pilot) — помощник на базе ИИ, ускоряющий работу человека (например, GitHub Copilot).
Контекст — объём информации, доступной модели в текущем запросе/диалоге.
Контекстное окно — максимальное число токенов, обрабатываемых за раз (например, 8K, 32K, 100K+).
Кратность (k-shot learning) — обучение на считанных примерах прямо в запросе.
Коэффициент достоверности (Confidence score) — численная оценка уверенности. В языковых моделях обычно не надёжна и редко даётся напрямую; требуются отдельные методы калибровки.
Л
LLaMA — семейство открытых языковых моделей от Meta.
LoRA (Low-Rank Adaptation) — лёгкое дообучение модели с малым числом добавочных параметров.
Latent space (латентное пространство) — сжатое представление данных, где модель «манипулирует» смыслами.
Локальная модель — работает на вашем устройстве/сервере, а не в облаке.
М
Midjourney — сервис генерации изображений по тексту.
Машинное обучение (ML) — методы, позволяющие системам «учиться» по данным.
Модерация — фильтрация нежелательного контента.
Мультимодальная модель — обрабатывает несколько типов данных (текст, изображение, аудио, видео).
Мультиагентная система — несколько ИИ-агентов, координирующих действия.
Н
NSFW-фильтр — блокирует неприемлемый контент.
Негативный промпт — то, чего не должно быть в сгенерированном изображении.
Нейросетевой рендеринг — синтез графики нейросетями.
Нейросетевая компрессия — уменьшение модели (квантование, праунинг) при сохранении качества.
О
Open source — открытые модели/библиотеки (код и веса доступны).
Outpainting (аутпейнтинг) — «расширение» изображения за пределы исходных границ.
Обучение модели — настройка параметров на данных.
Ограничения модели — правила безопасности и запреты на вредный/опасный контент.
П
Плагин — модуль, расширяющий возможности чата/платформы.
Параметры модели — численные веса; их много, но большее число ≠ автоматически лучше.
Персонализация ИИ — адаптация ответов под пользователя/группу.
Персистентность — «память» между сессиями. В публичных чатах по умолчанию ограничена и зависит от настроек/режима «памяти».
Промпт-инжиниринг — приёмы составления запросов для стабильного нужного результата.
Промпт-инжекция — попытка «обмануть» модель через вредоносные инструкции в данных или ссылках.
Промпт-рамка — шаблон структуры запроса под задачу.
Предварительное обучение (Pre-training) — базовое обучение на больших корпусах до специализации.
Р
RAG (Retrieval-Augmented Generation) — дополнение модели внешними документами при ответе.
Reasoning (рассуждение) — способность решать сложные задачи через структурирование шагов и проверку гипотез.
Разметка данных — присвоение меток/аннотаций примерам для обучения с учителем.
Режим инференса — набор параметров генерации (температура, top-p и пр.).
RLHF / RLAIF — обучение с подкреплением по человеческой обратной связи / по обратной связи другой модели.
С
Stable Diffusion — популярная диффузионная модель для графики.
Semantics / семантический поиск — поиск «по смыслу» на эмбеддингах, а не по ключевым словам.
Синтетические данные — сгенерированные примеры для обучения/теста.
Семплинг — выбор токенов/пикселей из распределения предсказаний.
Style transfer — перенос художественного стиля на другой контент.
Seed (сид) — фиксирует случайность; один и тот же сид при прочих равных воспроизводит результат.
Safety (безопасность) — политика по предотвращению вредного использования и защите данных.
Т
Text-to-image / -video / -audio — генерация изображений/видео/звука по тексту.
Температура — регулирует «случайность» текста: выше — разнообразнее, ниже — предсказуемее.
Top-p (nucleus sampling) — ограничивает выбор токенов «наиболее вероятной массой» p.
Токен — минимальная единица для модели (слово, часть слова, знак).
Трансформер — архитектура, лежащая в основе современных LLM.
У
Upscaling (апскейлинг) — см. «Апскейлинг» в разделе «А».
Uncensored-модели — сборки с ослабленными фильтрами; часто нарушают условия лицензий и несут правовые/этические риски.
User alignment — соответствие ответов модели намерениям и ожиданиям пользователя.
Ф
Fine-tuning (тонкая настройка) — дообучение под конкретную задачу/домен.
Фреймворк ИИ — инструменты разработки (PyTorch, TensorFlow, JAX и др.).
Фронтенд/бэкенд ИИ — интерфейс для пользователя и «начинка» сервиса.
Х
Hallucination (галлюцинация) — уверенное, но неверное утверждение модели. Требует проверки источниками.
Характер/персона модели — начальные инструкции, задающие стиль и поведение.
Ц
Цикл хайпа ИИ (AI Hype Cycle) — типичные фазы ожиданий и зрелости технологий.
Ч
Чат-бот — программа для диалога с человеком; в современных — ядро на LLM.
Чейнинг (Chaining) — последовательность шагов/вызовов инструментов для решения задачи.
Ш
Шаги диффузии — количество итераций генерации в диффузионной модели: больше — качественнее и дольше.
Шум (Noise) — случайная инициализация, из которой «проявляется» изображение в диффузионных моделях.
Э
Epoch (эпоха) — один полный проход по обучающему датасету.
Эмбеддинг — см. «Векторное представление».
Этичный ИИ — разработка/применение ИИ с учётом рисков и последствий (безопасность, приватность, недискриминация).
Ю
Юзер-френдли ИИ — интерфейсы и сценарии, понятные не-техничным пользователям.
Я
Ядро модели — базовая часть нейросети (архитектура/веса), поверх которой подключают инструменты и интерфейсы.
Языковая модель — нейросеть, обученная понимать и генерировать текст на естественном языке.
Словарь организован в алфавитном порядке. Если какого-то термина нет — вы всегда можете спросить у модели (ChatGPT/Claude) простое объяснение или пример применения.
Для вашего удобства можно скачать данный словарь здесь.
Словарь
А
AGI (Artificial General Intelligence) — гипотетический ИИ общего назначения, способный решать широкий круг задач на уровне человека или выше.
API (Application Programming Interface) — программный интерфейс для подключения возможностей ИИ к приложениям и сайтам.
VAE (Variational Autoencoder) — тип модели, сжимающий данные в «код» и восстанавливающий их обратно; используется в генеративной графике.
Агент ИИ — автономная система на базе модели, которая планирует и выполняет цепочки действий для достижения цели.
Антропоморфизм — приписывание моделям человеческих качеств; важно помнить, что это статистические алгоритмы, а не личности.
Аугментация данных — искусственное расширение датасета (перестановки, шум, синтетика), чтобы модель обобщала лучше.
Аватар ИИ — визуально-голосовой интерфейс для общения с моделью.
Апскейлинг (Upscaling) — увеличение разрешения изображения с улучшением деталей нейросетью.
ИИ (Искусственный интеллект, AI) — набор методов и систем, выполняющих задачи, требующие «умственных» навыков; сегодня чаще — нейросети.
Б
Бенчмарк — стандартный тест для сравнения моделей (например, MMLU, HumanEval).
Бот — программа, имитирующая действия пользователя; чат-боты на ИИ ведут диалог и решают задачи.
Большая языковая модель (LLM) — модель, обученная на больших корпусах текста для понимания и генерации языка (например, GPT, LLaMA, Claude).
В
Векторное представление (эмбеддинг) — числовой вектор, отражающий смысл слова, фразы, изображения и т. п.
Внимание (Attention) — механизм, который помогает модели выделять важные фрагменты входных данных.
Весы модели (Weights) — параметры, полученные в процессе обучения; определяют поведение модели.
Voice cloning (клонирование голоса) — синтез речи, имитирующий тембр и манеру конкретного человека.
Г
GAN — генеративно-состязательные сети из двух частей (генератор/дискриминатор), которые «соревнуются», повышая реализм.
GPT (Generative Pre-trained Transformer) — семейство моделей OpenAI, на которых работает ChatGPT.
Gemini — мультимодальная модель Google (бывш. Bard).
Guidance / CFG (Classifier-Free Guidance) — настройка «насколько строго» генерация изображения следует текстовому описанию.
Генеративный ИИ — модели, создающие новый контент (текст, изображение, звук, видео).
Генерация контента — практическое применение генеративных моделей (копирайт, иллюстрации, музыка и т. п.).
Д
DALL·E — модель OpenAI для генерации изображений по тексту.
DreamBooth — дообучение модели генерации на нескольких фото конкретного объекта/персоны.
Дата отсечки (Knowledge cutoff) — дата, после которой модель не знает о новых событиях из обучения.
Датасет — набор данных для обучения/оценки.
Дата-скрейпинг — автоматический сбор данных из интернета.
Диффузионная модель — поэтапно убирает «шум» из случайного изображения, «проявляя» картинку; основа Stable Diffusion, Midjourney, DALL·E.
Е
Естественный язык — человеческий язык (русский, английский и т. д.).
Естественно-языковой интерфейс (NLI) — управление программой обычной речью/текстом.
Ё
Ёмкость модели — способность кодировать и обрабатывать информацию; грубо коррелирует с числом параметров и архитектурой.
Ж
Жизненный цикл модели — сбор данных → обучение → валидация → развёртывание → мониторинг → обновления.
Журнал взаимодействий — история диалога/операций; используется для улучшений и восстановления контекста (при наличии соответствующих настроек приватности).
З
Запрос (Prompt) — формулировка задания для модели. Качество запроса сильно влияет на результат.
Знания модели — информация, закреплённая в параметрах после обучения; не обновляется без дообучения или подключения внешних источников.
И
Img2img — генерация нового изображения на основе уже существующего и текста.
Inpainting (дорисовка) — замена/восстановление части изображения.
Инструменты (Tools / Function calling) — вызовы внешних функций/поиска/БД из модели.
Инференс — использование обученной модели для ответов на новые запросы.
Инструкция (Instruction) — указание модели «как отвечать».
Итеративное мышление (Chain-of-thought) — пошаговое рассуждение; обычно скрыто для пользователя.
Интеграция — встраивание ИИ в продукты и процессы.
К
ControlNet — расширение Stable Diffusion для тонкого контроля (контуры, позы, карты глубины).
Копилот (Co-pilot) — помощник на базе ИИ, ускоряющий работу человека (например, GitHub Copilot).
Контекст — объём информации, доступной модели в текущем запросе/диалоге.
Контекстное окно — максимальное число токенов, обрабатываемых за раз (например, 8K, 32K, 100K+).
Кратность (k-shot learning) — обучение на считанных примерах прямо в запросе.
Коэффициент достоверности (Confidence score) — численная оценка уверенности. В языковых моделях обычно не надёжна и редко даётся напрямую; требуются отдельные методы калибровки.
Л
LLaMA — семейство открытых языковых моделей от Meta.
LoRA (Low-Rank Adaptation) — лёгкое дообучение модели с малым числом добавочных параметров.
Latent space (латентное пространство) — сжатое представление данных, где модель «манипулирует» смыслами.
Локальная модель — работает на вашем устройстве/сервере, а не в облаке.
М
Midjourney — сервис генерации изображений по тексту.
Машинное обучение (ML) — методы, позволяющие системам «учиться» по данным.
Модерация — фильтрация нежелательного контента.
Мультимодальная модель — обрабатывает несколько типов данных (текст, изображение, аудио, видео).
Мультиагентная система — несколько ИИ-агентов, координирующих действия.
Н
NSFW-фильтр — блокирует неприемлемый контент.
Негативный промпт — то, чего не должно быть в сгенерированном изображении.
Нейросетевой рендеринг — синтез графики нейросетями.
Нейросетевая компрессия — уменьшение модели (квантование, праунинг) при сохранении качества.
О
Open source — открытые модели/библиотеки (код и веса доступны).
Outpainting (аутпейнтинг) — «расширение» изображения за пределы исходных границ.
Обучение модели — настройка параметров на данных.
Ограничения модели — правила безопасности и запреты на вредный/опасный контент.
П
Плагин — модуль, расширяющий возможности чата/платформы.
Параметры модели — численные веса; их много, но большее число ≠ автоматически лучше.
Персонализация ИИ — адаптация ответов под пользователя/группу.
Персистентность — «память» между сессиями. В публичных чатах по умолчанию ограничена и зависит от настроек/режима «памяти».
Промпт-инжиниринг — приёмы составления запросов для стабильного нужного результата.
Промпт-инжекция — попытка «обмануть» модель через вредоносные инструкции в данных или ссылках.
Промпт-рамка — шаблон структуры запроса под задачу.
Предварительное обучение (Pre-training) — базовое обучение на больших корпусах до специализации.
Р
RAG (Retrieval-Augmented Generation) — дополнение модели внешними документами при ответе.
Reasoning (рассуждение) — способность решать сложные задачи через структурирование шагов и проверку гипотез.
Разметка данных — присвоение меток/аннотаций примерам для обучения с учителем.
Режим инференса — набор параметров генерации (температура, top-p и пр.).
RLHF / RLAIF — обучение с подкреплением по человеческой обратной связи / по обратной связи другой модели.
С
Stable Diffusion — популярная диффузионная модель для графики.
Semantics / семантический поиск — поиск «по смыслу» на эмбеддингах, а не по ключевым словам.
Синтетические данные — сгенерированные примеры для обучения/теста.
Семплинг — выбор токенов/пикселей из распределения предсказаний.
Style transfer — перенос художественного стиля на другой контент.
Seed (сид) — фиксирует случайность; один и тот же сид при прочих равных воспроизводит результат.
Safety (безопасность) — политика по предотвращению вредного использования и защите данных.
Т
Text-to-image / -video / -audio — генерация изображений/видео/звука по тексту.
Температура — регулирует «случайность» текста: выше — разнообразнее, ниже — предсказуемее.
Top-p (nucleus sampling) — ограничивает выбор токенов «наиболее вероятной массой» p.
Токен — минимальная единица для модели (слово, часть слова, знак).
Трансформер — архитектура, лежащая в основе современных LLM.
У
Upscaling (апскейлинг) — см. «Апскейлинг» в разделе «А».
Uncensored-модели — сборки с ослабленными фильтрами; часто нарушают условия лицензий и несут правовые/этические риски.
User alignment — соответствие ответов модели намерениям и ожиданиям пользователя.
Ф
Fine-tuning (тонкая настройка) — дообучение под конкретную задачу/домен.
Фреймворк ИИ — инструменты разработки (PyTorch, TensorFlow, JAX и др.).
Фронтенд/бэкенд ИИ — интерфейс для пользователя и «начинка» сервиса.
Х
Hallucination (галлюцинация) — уверенное, но неверное утверждение модели. Требует проверки источниками.
Характер/персона модели — начальные инструкции, задающие стиль и поведение.
Ц
Цикл хайпа ИИ (AI Hype Cycle) — типичные фазы ожиданий и зрелости технологий.
Ч
Чат-бот — программа для диалога с человеком; в современных — ядро на LLM.
Чейнинг (Chaining) — последовательность шагов/вызовов инструментов для решения задачи.
Ш
Шаги диффузии — количество итераций генерации в диффузионной модели: больше — качественнее и дольше.
Шум (Noise) — случайная инициализация, из которой «проявляется» изображение в диффузионных моделях.
Э
Epoch (эпоха) — один полный проход по обучающему датасету.
Эмбеддинг — см. «Векторное представление».
Этичный ИИ — разработка/применение ИИ с учётом рисков и последствий (безопасность, приватность, недискриминация).
Ю
Юзер-френдли ИИ — интерфейсы и сценарии, понятные не-техничным пользователям.
Я
Ядро модели — базовая часть нейросети (архитектура/веса), поверх которой подключают инструменты и интерфейсы.
Языковая модель — нейросеть, обученная понимать и генерировать текст на естественном языке.