Блог IZYUMpro

Словарь терминов ИИ | нейросеть

Здесь собраны термины, которые часто встречаются при работе с ChatGPT, Claude, Midjourney и другими нейросетевыми сервисами. Словарь помогает быстро понять новые понятия без погружения в академические детали.
Словарь организован в алфавитном порядке. Если какого-то термина нет — вы всегда можете спросить у модели (ChatGPT/Claude) простое объяснение или пример применения.

Для вашего удобства можно скачать данный словарь здесь.

Словарь

А

AGI (Artificial General Intelligence) — гипотетический ИИ общего назначения, способный решать широкий круг задач на уровне человека или выше.

API (Application Programming Interface) — программный интерфейс для подключения возможностей ИИ к приложениям и сайтам.

VAE (Variational Autoencoder) — тип модели, сжимающий данные в «код» и восстанавливающий их обратно; используется в генеративной графике.

Агент ИИ — автономная система на базе модели, которая планирует и выполняет цепочки действий для достижения цели.

Антропоморфизм — приписывание моделям человеческих качеств; важно помнить, что это статистические алгоритмы, а не личности.

Аугментация данных — искусственное расширение датасета (перестановки, шум, синтетика), чтобы модель обобщала лучше.

Аватар ИИ — визуально-голосовой интерфейс для общения с моделью.

Апскейлинг (Upscaling) — увеличение разрешения изображения с улучшением деталей нейросетью.

ИИ (Искусственный интеллект, AI) — набор методов и систем, выполняющих задачи, требующие «умственных» навыков; сегодня чаще — нейросети.

Б

Бенчмарк — стандартный тест для сравнения моделей (например, MMLU, HumanEval).

Бот — программа, имитирующая действия пользователя; чат-боты на ИИ ведут диалог и решают задачи.

Большая языковая модель (LLM) — модель, обученная на больших корпусах текста для понимания и генерации языка (например, GPT, LLaMA, Claude).

В

Векторное представление (эмбеддинг) — числовой вектор, отражающий смысл слова, фразы, изображения и т. п.

Внимание (Attention) — механизм, который помогает модели выделять важные фрагменты входных данных.

Весы модели (Weights) — параметры, полученные в процессе обучения; определяют поведение модели.

Voice cloning (клонирование голоса) — синтез речи, имитирующий тембр и манеру конкретного человека.

Г

GAN — генеративно-состязательные сети из двух частей (генератор/дискриминатор), которые «соревнуются», повышая реализм.

GPT (Generative Pre-trained Transformer) — семейство моделей OpenAI, на которых работает ChatGPT.

Gemini — мультимодальная модель Google (бывш. Bard).

Guidance / CFG (Classifier-Free Guidance) — настройка «насколько строго» генерация изображения следует текстовому описанию.

Генеративный ИИ — модели, создающие новый контент (текст, изображение, звук, видео).

Генерация контента — практическое применение генеративных моделей (копирайт, иллюстрации, музыка и т. п.).

Д

DALL·E — модель OpenAI для генерации изображений по тексту.

DreamBooth — дообучение модели генерации на нескольких фото конкретного объекта/персоны.

Дата отсечки (Knowledge cutoff) — дата, после которой модель не знает о новых событиях из обучения.

Датасет — набор данных для обучения/оценки.

Дата-скрейпинг — автоматический сбор данных из интернета.

Диффузионная модель — поэтапно убирает «шум» из случайного изображения, «проявляя» картинку; основа Stable Diffusion, Midjourney, DALL·E.

Е

Естественный язык — человеческий язык (русский, английский и т. д.).

Естественно-языковой интерфейс (NLI) — управление программой обычной речью/текстом.

Ё

Ёмкость модели — способность кодировать и обрабатывать информацию; грубо коррелирует с числом параметров и архитектурой.

Ж

Жизненный цикл модели — сбор данных → обучение → валидация → развёртывание → мониторинг → обновления.

Журнал взаимодействий — история диалога/операций; используется для улучшений и восстановления контекста (при наличии соответствующих настроек приватности).

З

Запрос (Prompt) — формулировка задания для модели. Качество запроса сильно влияет на результат.

Знания модели — информация, закреплённая в параметрах после обучения; не обновляется без дообучения или подключения внешних источников.

И

Img2img — генерация нового изображения на основе уже существующего и текста.

Inpainting (дорисовка) — замена/восстановление части изображения.

Инструменты (Tools / Function calling) — вызовы внешних функций/поиска/БД из модели.

Инференс — использование обученной модели для ответов на новые запросы.

Инструкция (Instruction) — указание модели «как отвечать».

Итеративное мышление (Chain-of-thought) — пошаговое рассуждение; обычно скрыто для пользователя.

Интеграция — встраивание ИИ в продукты и процессы.

К

ControlNet — расширение Stable Diffusion для тонкого контроля (контуры, позы, карты глубины).

Копилот (Co-pilot) — помощник на базе ИИ, ускоряющий работу человека (например, GitHub Copilot).

Контекст — объём информации, доступной модели в текущем запросе/диалоге.

Контекстное окно — максимальное число токенов, обрабатываемых за раз (например, 8K, 32K, 100K+).

Кратность (k-shot learning) — обучение на считанных примерах прямо в запросе.

Коэффициент достоверности (Confidence score) — численная оценка уверенности. В языковых моделях обычно не надёжна и редко даётся напрямую; требуются отдельные методы калибровки.

Л

LLaMA — семейство открытых языковых моделей от Meta.

LoRA (Low-Rank Adaptation) — лёгкое дообучение модели с малым числом добавочных параметров.

Latent space (латентное пространство) — сжатое представление данных, где модель «манипулирует» смыслами.

Локальная модель — работает на вашем устройстве/сервере, а не в облаке.

М

Midjourney — сервис генерации изображений по тексту.

Машинное обучение (ML) — методы, позволяющие системам «учиться» по данным.

Модерация — фильтрация нежелательного контента.

Мультимодальная модель — обрабатывает несколько типов данных (текст, изображение, аудио, видео).

Мультиагентная система — несколько ИИ-агентов, координирующих действия.

Н

NSFW-фильтр — блокирует неприемлемый контент.

Негативный промпт — то, чего не должно быть в сгенерированном изображении.

Нейросетевой рендеринг — синтез графики нейросетями.

Нейросетевая компрессия — уменьшение модели (квантование, праунинг) при сохранении качества.

О

Open source — открытые модели/библиотеки (код и веса доступны).

Outpainting (аутпейнтинг) — «расширение» изображения за пределы исходных границ.

Обучение модели — настройка параметров на данных.

Ограничения модели — правила безопасности и запреты на вредный/опасный контент.

П

Плагин — модуль, расширяющий возможности чата/платформы.

Параметры модели — численные веса; их много, но большее число ≠ автоматически лучше.

Персонализация ИИ — адаптация ответов под пользователя/группу.

Персистентность — «память» между сессиями. В публичных чатах по умолчанию ограничена и зависит от настроек/режима «памяти».

Промпт-инжиниринг — приёмы составления запросов для стабильного нужного результата.

Промпт-инжекция — попытка «обмануть» модель через вредоносные инструкции в данных или ссылках.

Промпт-рамка — шаблон структуры запроса под задачу.

Предварительное обучение (Pre-training) — базовое обучение на больших корпусах до специализации.

Р

RAG (Retrieval-Augmented Generation) — дополнение модели внешними документами при ответе.

Reasoning (рассуждение) — способность решать сложные задачи через структурирование шагов и проверку гипотез.

Разметка данных — присвоение меток/аннотаций примерам для обучения с учителем.

Режим инференса — набор параметров генерации (температура, top-p и пр.).

RLHF / RLAIF — обучение с подкреплением по человеческой обратной связи / по обратной связи другой модели.

С

Stable Diffusion — популярная диффузионная модель для графики.

Semantics / семантический поиск — поиск «по смыслу» на эмбеддингах, а не по ключевым словам.

Синтетические данные — сгенерированные примеры для обучения/теста.

Семплинг — выбор токенов/пикселей из распределения предсказаний.

Style transfer — перенос художественного стиля на другой контент.

Seed (сид) — фиксирует случайность; один и тот же сид при прочих равных воспроизводит результат.

Safety (безопасность) — политика по предотвращению вредного использования и защите данных.

Т

Text-to-image / -video / -audio — генерация изображений/видео/звука по тексту.

Температура — регулирует «случайность» текста: выше — разнообразнее, ниже — предсказуемее.

Top-p (nucleus sampling) — ограничивает выбор токенов «наиболее вероятной массой» p.

Токен — минимальная единица для модели (слово, часть слова, знак).

Трансформер — архитектура, лежащая в основе современных LLM.

У

Upscaling (апскейлинг) — см. «Апскейлинг» в разделе «А».

Uncensored-модели — сборки с ослабленными фильтрами; часто нарушают условия лицензий и несут правовые/этические риски.

User alignment — соответствие ответов модели намерениям и ожиданиям пользователя.

Ф

Fine-tuning (тонкая настройка) — дообучение под конкретную задачу/домен.

Фреймворк ИИ — инструменты разработки (PyTorch, TensorFlow, JAX и др.).

Фронтенд/бэкенд ИИ — интерфейс для пользователя и «начинка» сервиса.

Х

Hallucination (галлюцинация) — уверенное, но неверное утверждение модели. Требует проверки источниками.

Характер/персона модели — начальные инструкции, задающие стиль и поведение.

Ц

Цикл хайпа ИИ (AI Hype Cycle) — типичные фазы ожиданий и зрелости технологий.

Ч

Чат-бот — программа для диалога с человеком; в современных — ядро на LLM.

Чейнинг (Chaining) — последовательность шагов/вызовов инструментов для решения задачи.

Ш

Шаги диффузии — количество итераций генерации в диффузионной модели: больше — качественнее и дольше.

Шум (Noise) — случайная инициализация, из которой «проявляется» изображение в диффузионных моделях.

Э

Epoch (эпоха) — один полный проход по обучающему датасету.

Эмбеддинг — см. «Векторное представление».

Этичный ИИ — разработка/применение ИИ с учётом рисков и последствий (безопасность, приватность, недискриминация).

Ю

Юзер-френдли ИИ — интерфейсы и сценарии, понятные не-техничным пользователям.

Я

Ядро модели — базовая часть нейросети (архитектура/веса), поверх которой подключают инструменты и интерфейсы.

Языковая модель — нейросеть, обученная понимать и генерировать текст на естественном языке.
ИИ | нейросеть