2026-05-19 Обзор ИИ новостей: Агенты перешли от экспериментов к заводу
Лучшие корпоративные платформы агентного ИИ на 2026 год
Корпоративный агентный ИИ окончательно перешёл от пилотных проектов к промышленному внедрению. В обзорном руководстве ранжируются десять ведущих платформ — Salesforce Agentforce, Microsoft Copilot Studio, ServiceNow, LangGraph и другие — с оценкой по критериям масштабируемости, интеграции с существующей инфраструктурой и зрелости агентных паттернов.
Первоисточник: MarkTechPost — обзор платформ
Как построить продвинутую агентную систему с планированием, вызовом инструментов, памятью и самооценкой через OpenAI API
Практическое руководство по созданию агентной системы с разделением ролей: планировщик, инструментальный агент, исполнитель и критик. Система использует скрытый терминальный ввод для ключа API и конвейер специализированных агентов, каждый из которых выполняет свою функцию в пайплайне.
Первоисточник: Официальная документация OpenAI по агентам
MemPrivacy: фреймворк для защиты данных с локальной обратимой псевдонимизацией
Новое исследование решает противоречие между полезностью облачной памяти LLM-агентов и приватностью пользовательских данных. Предложен фреймворк MemPrivacy, использующий локальную обратимую псевдонимизацию, которая позволяет защищать данные без потери полезности памяти. Проверено на реальных production-сценариях.
Первоисточник: arXiv:2603.23198
Частотный сдвиг в стохастическом градиентном спуске и как Adam это исправляет
Анализ показывает, что современные языковые модели обучаются на данных с крайне неравномерным распределением токенов. Небольшое количество слов встречается в большинстве предложений, тогда как редкие, но значимые токены появляются редко. Исследование объясняет, как этот сдвиг влияет на обучение и как адаптер Adam компенсирует это.
Первоисточник: arXiv — анализ SGD frequency bias
NVIDIA представила 4-битный метод предобучения NVFP4 на гибридной модели Mamba-Transformer
NVIDIA представила методику предобучения на 4 бита вокруг формата NVFP4 — комбинация избирательных слоёв BF16, случайных ортогональных преобразований Харадама на входах Wgrad, двумерного масштабирования весов. Метод валидирован на 12B гибридной модели Mamba-Transformer с горизонтом 10T токенов.
Первоисточник: NVIDIA Developer Blog
Практическая реализация квантизации LLM с FP8, GPTQ и SmoothQuant через llmcompressor
Руководство по применению пост-тренировочной квантизации к instruction-tuned модели. Сравниваются различные методы сжатия: FP8, GPTQ и SmoothQuant. Начинается с FP16 baseline, затем сравниваются множественные стратегии сжатия по метрикам точности и скорости.
Первоисточник: GitHub — NVIDIA llmcompressor
Дайджест сгенерирован 19 мая 2026





















