
Дайджест новостей искусственного интеллекта за 16 мая 2026 года. Без маркетинга — только факты и ссылки на первоисточники. NVIDIA SANA-WM: открытая World Model на 2,6 млрд параметров NVIDIA представила SANA-WM — опенсорсную World Model с 2,6 млрд параметров, способную генерировать 60-секундное видео в разрешении 720p на одном GPU. Модель построена на архитектуре Diffusion Transformer (DiT) ➡️➡️➡️
Ежедневный дайджест новостей искусственного интеллекта за 11 мая 2026 года. ➡️➡️➡️
9 Best AI Tools for Spec-Driven Development in 2026: Kiro, BMAD, GSD, and More Compare Источник: kiro.dev — Официальный сайт AWS Kiro AWS Kiro представляет собой agentic IDE, построенный вокруг концепции spec-driven development (SDD). Инструмент требует от разработчиков формализации намерений перед написанием кода, направляя их через трехфазный процесс: Требования, Дизайн и Задачи, создавая структурированные артефакты: ➡️➡️➡️
Обзор последних новостей в области искусственного интеллекта: релизы моделей, новые архитектуры и платформы. ➡️➡️➡️
Zyphra представила модель ZAYA1-8B типа Mixture of Experts на AMD аппаратном обеспечении Компания Zyphra AI выпустила языковую модель ZAYA1-8B с архитектурой Mixture of Experts, имеющую 760 миллионов активных параметров и 8,4 миллиарда общего числа параметров. Модель обучена исключительно на аппаратном обеспечении AMD Instinct MI300 и демонстрирует конкурентоспособные результаты на бенчмарках по математике и коду по ➡️➡️➡️
Google добавляет event-driven вебхуки в Gemini API, убивая необходимость постоянного опроса Google представил событие-ориентированные вебхуки для Gemini API — систему push-уведомлений, которая избавляет разработчиков от необходимости постоянно опрашивать API о статусе длительных операций. Это решение направлено на одну из главных болей в agentic и высоконагруженных ИИ-воркфлоуах, где задачи типа Deep Research или генерации длинных видео ➡️➡️➡️
Digest of AI News Как построить production-grade ML пайплайн с ZenML: кастомные материализаторы и гиперпараметрический поиск Тutorial демонстрирует создание end-to-end машинного обучения пайплайна с использованием фреймворка ZenML. Показан процесс создания кастомного материализатора для доменно-специфичного объекта DatasetBundle, что позволяет бесшовно сериализовывать и извлекать метаданные. Пайплайн включает разделение данных, масштабирование, обучение нескольких моделей кандидата (Random Forest, Gradient ➡️➡️➡️
Zyphra представляет Tensor и Sequence Parallelism (TSP): аппаратно-осознанная стратегия обучения и вывода Zyphra представила новую технику параллелизма TSP, которая объединяет тензорное и последовательное параллелизм на одной оси устройственного mesh, уменьшая как память весов, так и память активаций на одинаковый коэффициент 1/D. Тестирование на до 1024 GPU AMD MI300X показало 2.6x увеличение пропускной способности по сравнению ➡️➡️➡️
Топ API для поиска и извлечения данных для создания ИИ-агентов в 2026 году В 2026 году экосистема поисковых и извлекательных API для ИИ-агентов значительно созрела, предложив специализированные инструменты, заменяющие старый подход с оберткой вокруг сырых данных Google SERP. Лидеры рынка включают TinyFish с агентно-ориентированным дизайном и низким потреблением токенов, Tavily с глубокой интеграцией в LangChain ➡️➡️➡️
Даже в потоке новостей бывают прорывы: Moonshot открывает FlashKDA, Microsoft учит World-R1 3D-согласованности, IBM выпускает Granite Speech 4.1 2B. ➡️➡️➡️
Новое исследование NVIDIA показывает ускорение генерации rollout в NeMo RL на 1.8× при 8B и прогнозируемый 2.5× при 235B благодаря спеkulative декодированию Команда исследователей NVIDIA интегрировала спеkulative декодирование непосредственно в цикл обучения с подкреплением NeMo RL, достигнув потери ускорения генерации rollout в 1.8 раза для моделей масштаба 8B и прогнозируемого 2.5-кратного ускорения end-to-end для моделей ➡️➡️➡️
Digest Mistral AI запускает удалённые агенты в Vibe и выпускает Mistral Medium 3.5 с результатом 77,6% на SWE-Bench Mistral AI анонсировала удалённых агентов для своей платформы Vibe, позволяющих выполнять кодовые задачи в облаке, а также представила новую флагманскую модель Mistral Medium 3.5 — плотную 128-миллиардную модель с 256k контекстным окном, multimodal возможностями и настраиваемым уровнем ➡️➡️➡️