Itinai.com llm large language model graph clusters multidimen de41fe56 e6b4 440d b54d 14c926747171 1

2026-05-03 Обзор ИИ новостей: От удалённых агентов Mistral до FlashKDA Moonshot

Itinai.com llm large language model graph clusters multidimen de41fe56 e6b4 440d b54d 14c926747171 1





Digest

Mistral AI запускает удалённые агенты в Vibe и выпускает Mistral Medium 3.5 с результатом 77,6% на SWE-Bench

Mistral AI анонсировала удалённых агентов для своей платформы Vibe, позволяющих выполнять кодовые задачи в облаке, а также представила новую флагманскую модель Mistral Medium 3.5 — плотную 128-миллиардную модель с 256k контекстным окном, multimodal возможностями и настраиваемым уровнем усилий рассуждений. Модель доступна с открытыми весами на Hugging Face и демонстрирует сильные результаты на тестах SWE-Bench Verified и τ³-Telecom.

Официальный анонс Mistral AI

Создание мультиагентного ИИ-воркфлоу для моделирования биологических систем

В этом туториале демонстрируется построение единой пайплайна для моделирования ген регуляторных сетей, предсказания белково-белковых взаимодействий, оптимизации метаболических путей и симуляции клеточной сигнализации с использованием специализированных ИИ-агентов. Каждый агент обрабатывает свой биологический домен, а финальная синтеза выполняется большой языковой моделью, объединяющей результаты в целостную научную интерпретацию.

Ноутбук с реализацией воркфлоу

Парсинг, анализ и визуализация трасс рассуждений агентов на базе датасета lambda/hermes-agent-reasoning-traces

Авторы представляют набор инструментов для работы с датасетом agente reasoning traces: парсеры для разделения мыслей, вызовов инструментов и ответов, анализ частоты использования инструментов, длины диалогов и уровня ошибок, а также подготовку данных для обучения языковых моделей с помощью техники SFT. Включены визуализации и примеры реплеера трасс для глубокого понимания поведения агентов.

Датасет на Hugging Face

NVIDIA демонстрирует speculative decoding в NeMo RL, достигая ускорения генерации до 1,8× и общего ускорения до 2,5×

Исследователи NVIDIA интегрировали speculative decoding непосредственно в алгоритм обучения с подкреплением NeMo RL, используя бэкенд vLLM. Это позволяет получатьlossless ускорение генерации токенов как для небольших 8B-моделей, так и для масштабных 235B-моделей, не теряя при этом качества или точности предсказаний.

Препринт исследования на arXiv

Энд-ту-энд декодинг лингвистических признаков из MEG-сигналов с использованием NeuralSet и глубокого обучения

Туториал описывает полный пайплайн преобразования_raw MEG-сигналов в предсказания лингвистических характеристик (например, длины слова): загрузка данных через NeuralSet, кастомный экстрактор признаков, сегментация вокруг событий слова, обучение сверточной нейронной сети и оценка качества декодирования на синтетических и реальных данных.

Ноутбук с реализацией декодера

Meta представляет Autodata: фреймворк для автономного создания обучающих данных ИИ-агентами

Autodata — это агентный фреймворк, в котором языковые модели выступают в роли данных учёных: итерируемо создают, анализируют и улучшают обучающие датасеты через замкнутый цикл генерации-проверки-обратной связи. Подход показал значительное улучшение качества синтетических данных по сравнению с традиционными методами вроде Self-Instruct на наборе из ponad 10 000 научных статей.

Техническое описание Autodata от Meta AI

Практическое руководство по пост-обучению LLM с использованием TRL: от SFT до DPO и GRPO

В этом гайде пошагово рассмотрены четыре ключевые техники пост-обучения больших языковых моделей: supervised fine-tuning (SFT), reward modeling (RM), direct preference optimization (DPO) и group relative policy optimization (GRPO) с verifiable rewards. Все методы реализованы на доступном оборудовании (например, Google Colab T4) с использованием эффективных адаптеров LoRA и библиотек Hugging Face.

Библиотека TRL с примерами и документацией

Qwen AI выпускает Qwen-Scope: открытый набор инструментов для анализа внутренних признаков LLM через sparse autoencoders

Qwen-Scope предоставляет исследователям и разработчикам набор sparse autoencoders (SAE), позволяющих выявлять интерпретируемые признаки во внутренних представлениях больших языковых моделей, таких как Qwen-серия. Инструмент включает предобученные модели, код для обучения и визуализации, а также детальную документацию по применению в задачах анализа и отладки моделей.

Коллекция моделей и ресурсов Qwen-Scope на Hugging Face

Глубокий погружение в agente UI: генерация интерфейсов, синхронизация состояний и обработка прерываний

Автор разбирает создание agente пользовательских интерфейсов с нуля на чистом Python, без依赖 на внешние фреймворки. Освещаются паттерны генерации UI на основе агентных решений, техники синхронизации состояния между бэкендом и фронтендом, а также подходы к обработке прерываний и одобрения действий в реальном времени для безопасного взаимодействия человека и агента.

Ноутбук с примерами agente UI

Moonshot AI открывает исходный код FlashKDA: высокопроизводительные ядра CUTLASS для Kimi Delta Attention

Moonshot AI выпустила библиотеку FlashKDA — реализацию механизма Kimi Delta Attention на базе ядер CUTLASS, обеспечивающую значительное ускорение операции внимания в языковых моделях при переменной длине батчей. Библиотека включает оптимизированные ядра для архитектур Hopper и Ampere, бенчмарки показывающие доходы в скорости и эффективности по сравнению с базовыми реализациями.

Репозиторий FlashKDA с исходным кодом и бенчмарками


Запустите свой ИИ проект бесплатно

ИИ-агенты искусственный интеллект онлайн для бизнеса

Лучший ИИ онлайн