Mistral AI запускает удалённые агенты в Vibe и выпускает Mistral Medium 3.5 с результатом 77,6% на SWE-Bench
Mistral AI анонсировала удалённых агентов для своей платформы Vibe, позволяющих выполнять кодовые задачи в облаке, а также представила новую флагманскую модель Mistral Medium 3.5 — плотную 128-миллиардную модель с 256k контекстным окном, multimodal возможностями и настраиваемым уровнем усилий рассуждений. Модель доступна с открытыми весами на Hugging Face и демонстрирует сильные результаты на тестах SWE-Bench Verified и τ³-Telecom.
Создание мультиагентного ИИ-воркфлоу для моделирования биологических систем
В этом туториале демонстрируется построение единой пайплайна для моделирования ген регуляторных сетей, предсказания белково-белковых взаимодействий, оптимизации метаболических путей и симуляции клеточной сигнализации с использованием специализированных ИИ-агентов. Каждый агент обрабатывает свой биологический домен, а финальная синтеза выполняется большой языковой моделью, объединяющей результаты в целостную научную интерпретацию.
Ноутбук с реализацией воркфлоу
Парсинг, анализ и визуализация трасс рассуждений агентов на базе датасета lambda/hermes-agent-reasoning-traces
Авторы представляют набор инструментов для работы с датасетом agente reasoning traces: парсеры для разделения мыслей, вызовов инструментов и ответов, анализ частоты использования инструментов, длины диалогов и уровня ошибок, а также подготовку данных для обучения языковых моделей с помощью техники SFT. Включены визуализации и примеры реплеера трасс для глубокого понимания поведения агентов.
NVIDIA демонстрирует speculative decoding в NeMo RL, достигая ускорения генерации до 1,8× и общего ускорения до 2,5×
Исследователи NVIDIA интегрировали speculative decoding непосредственно в алгоритм обучения с подкреплением NeMo RL, используя бэкенд vLLM. Это позволяет получатьlossless ускорение генерации токенов как для небольших 8B-моделей, так и для масштабных 235B-моделей, не теряя при этом качества или точности предсказаний.
Препринт исследования на arXiv
Энд-ту-энд декодинг лингвистических признаков из MEG-сигналов с использованием NeuralSet и глубокого обучения
Туториал описывает полный пайплайн преобразования_raw MEG-сигналов в предсказания лингвистических характеристик (например, длины слова): загрузка данных через NeuralSet, кастомный экстрактор признаков, сегментация вокруг событий слова, обучение сверточной нейронной сети и оценка качества декодирования на синтетических и реальных данных.
Ноутбук с реализацией декодера
Meta представляет Autodata: фреймворк для автономного создания обучающих данных ИИ-агентами
Autodata — это агентный фреймворк, в котором языковые модели выступают в роли данных учёных: итерируемо создают, анализируют и улучшают обучающие датасеты через замкнутый цикл генерации-проверки-обратной связи. Подход показал значительное улучшение качества синтетических данных по сравнению с традиционными методами вроде Self-Instruct на наборе из ponad 10 000 научных статей.
Техническое описание Autodata от Meta AI
Практическое руководство по пост-обучению LLM с использованием TRL: от SFT до DPO и GRPO
В этом гайде пошагово рассмотрены четыре ключевые техники пост-обучения больших языковых моделей: supervised fine-tuning (SFT), reward modeling (RM), direct preference optimization (DPO) и group relative policy optimization (GRPO) с verifiable rewards. Все методы реализованы на доступном оборудовании (например, Google Colab T4) с использованием эффективных адаптеров LoRA и библиотек Hugging Face.
Библиотека TRL с примерами и документацией
Qwen AI выпускает Qwen-Scope: открытый набор инструментов для анализа внутренних признаков LLM через sparse autoencoders
Qwen-Scope предоставляет исследователям и разработчикам набор sparse autoencoders (SAE), позволяющих выявлять интерпретируемые признаки во внутренних представлениях больших языковых моделей, таких как Qwen-серия. Инструмент включает предобученные модели, код для обучения и визуализации, а также детальную документацию по применению в задачах анализа и отладки моделей.
Коллекция моделей и ресурсов Qwen-Scope на Hugging Face
Глубокий погружение в agente UI: генерация интерфейсов, синхронизация состояний и обработка прерываний
Автор разбирает создание agente пользовательских интерфейсов с нуля на чистом Python, без依赖 на внешние фреймворки. Освещаются паттерны генерации UI на основе агентных решений, техники синхронизации состояния между бэкендом и фронтендом, а также подходы к обработке прерываний и одобрения действий в реальном времени для безопасного взаимодействия человека и агента.
Moonshot AI открывает исходный код FlashKDA: высокопроизводительные ядра CUTLASS для Kimi Delta Attention
Moonshot AI выпустила библиотеку FlashKDA — реализацию механизма Kimi Delta Attention на базе ядер CUTLASS, обеспечивающую значительное ускорение операции внимания в языковых моделях при переменной длине батчей. Библиотека включает оптимизированные ядра для архитектур Hopper и Ampere, бенчмарки показывающие доходы в скорости и эффективности по сравнению с базовыми реализациями.
Репозиторий FlashKDA с исходным кодом и бенчмарками



















