AI News

  • Новая модель VLM2VEC и бенчмарк MMEB: универсальные мультимодальные эмбеддинги для бизнеса

    Введение в VLM2VEC и MMEB Доклад от Salesforce представляет VLM2VEC и MMEB: контрастная структура и бенчмарк для универсальных мультимодальных эмбеддингов. Что такое мультимодальные эмбеддинги? Мультимодальные эмбеддинги объединяют визуальные и текстовые данные в едином представлении, позволяя системам понимать и связывать изображения и язык. Эти эмбеддинги поддерживают различные задачи, такие как визуальное ответ на вопросы, поиск, классификация…

  • Новая методика сжатия LLM: доступность и экономия для бизнеса

    Новые Возможности для Бизнеса с Использованием LLM Исследователи из MIT, KAUST, ISTA и Яндекса разработали новый подход к быстрому сжатию больших языковых моделей (LLM) без значительной потери качества — метод HIGGS. Преимущества HIGGS Метод HIGGS позволяет сжимать LLM без использования дополнительных данных или затратных параметрических оптимизаций. В отличие от других методов сжатия, HIGGS не требует…

  • Nvidia представила Llama-3.1-Nemotron-Ultra-253B-v1: Идеальный ИИ для бизнеса и инноваций

    Выпуск Llama-3.1-Nemotron-Ultra-253B-v1 от Nvidia Nvidia представила Llama-3.1-Nemotron-Ultra-253B-v1 — современную модель ИИ, которая сочетает в себе масштаб, мощность рассуждений и эффективное развертывание для инноваций в бизнесе. Проблемы, с которыми сталкиваются предприятия С увеличением внедрения ИИ в цифровую инфраструктуру предприятия и разработчики сталкиваются с необходимостью балансировать между вычислительными затратами и производительностью. Быстрое развитие больших языковых моделей (LLMs)…

  • Балансировка точности и эффективности в языковых моделях: двухфазный подход RL для краткого рассуждения

    Балансировка Точности и Эффективности в Языковых Моделях Введение Недавние достижения в области больших языковых моделей (LLM) значительно улучшили их способности к рассуждению, особенно через обучение с подкреплением (RL). Исходно обученные на основе контролируемого обучения для предсказания токенов, эти модели проходят послеследующее обучение RL, исследуя различные пути рассуждения для получения правильных ответов. Однако этот процесс может…

  • RoR-Bench: Как оценка моделей ИИ выявляет их недостатки в рассуждениях

    RoR-Bench: Открытие различий между повторением и рассуждением в больших языковых моделях В последние годы быстрый прогресс больших языковых моделей (LLMs) создает впечатление, что мы приближаемся к достижению Искусственного Общего Интеллекта (AGI). Однако остается важный вопрос: действительно ли LLMs рассуждают как люди или просто повторяют шаблоны, усвоенные во время обучения? Проблемы текущих моделей Несмотря на то,…

  • Полное руководство по работе с CSV/Excel файлами и EDA в Python для бизнеса

    Полное руководство: Работа с файлами CSV/Excel и EDA в Python В этом практическом руководстве вы узнаете, как работать с файлами CSV и Excel, а также проводить исследовательский анализ данных (EDA) в Python. Мы будем использовать реалистичный набор данных о продажах в электронной коммерции, который включает в себя транзакции, информацию о клиентах, данные об инвентаре и…

  • DeepCoder-14B: Открытая модель для генерации кода с высокой точностью и эффективностью

    Выпуск DeepCoder-14B-Preview от Together AI Компания Together AI совместно с командой Agentica представила DeepCoder-14B-Preview — полностью открытое решение для кодирования, которое демонстрирует значительный прогресс в области интеллектуального программирования. Что такое DeepCoder-14B? DeepCoder-14B-Preview представляет собой модель кодирования с 14 миллиардами параметров, которая достигает 60.6% точности на платформе LiveCodeBench. Это сопоставимо с результатами таких моделей, как o3-mini-2025,…

  • Higgs Audio: Революционное AI-решение для бизнеса с пониманием и генерацией аудио в реальном времени

    Boson AI представляет Higgs Audio Understanding и Higgs Audio Generation Современный бизнес, особенно в страховании и поддержке клиентов, использует голосовые и аудиоданные не просто как записи; это ценнейшие точки соприкосновения, которые могут изменить операционные процессы и опыт клиентов. С помощью AI обработки аудио организации могут автоматизировать транскрипцию с высокой точностью, выявлять важные инсайты из разговоров…

  • Интервью с Хамзой Тахиром: как ZenML меняет подход к MLOps и LLMOps

    Интервью с Хамзой Тахиром: Соучредителем и техническим директором ZenML Биография: Хамза Тахир — разработчик программного обеспечения, ставший инженером машинного обучения. Он увлечен созданием и запуском продуктов, основанных на данных. Его предыдущие проекты включают BudgetML и другие. На основе своего опыта внедрения машинного обучения в производственные процессы, он совместно создал ZenML — открытый фреймворк MLOps для…

  • OpenAI запускает BrowseComp: новый стандарт для оценки способности ИИ к веб-серфингу

    OpenAI открывает BrowseComp: новый стандарт для оценки способности ИИ-агентов к интернет-серфингу Несмотря на успехи больших языковых моделей (LLMs), ИИ-агенты всё ещё сталкиваются с серьёзными ограничениями в поиске сложной информации в открытом интернете. Хотя многие модели показывают отличные результаты на статичных тестах знаний, они часто недобирают при выполнении задач по нахождению тонких, контекстуально зависимых фактов из…

  • Google AI представляет Ironwood: новый TPU для оптимизации ИИ-инференса

    Google AI представляет Ironwood: TPU, созданный для эпохи вывода данных На мероприятии Google Cloud Next 2025 Google представила Ironwood, своё новое поколение процессоров Tensor Processing Units (TPUs), специально разработанных для задач AI вывода на крупномасштабном уровне. Этот релиз отмечает стратегический сдвиг к оптимизации инфраструктуры для вывода, отражая растущий акцент на развертывании AI моделей, а не…

  • VAPO: Новая рамочная система обучения с подкреплением для сложных задач рассуждения от ByteDance

    ByteDance представляет VAPO: Новая структура обучения с подкреплением для сложных задач рассуждения В обучении больших языковых моделей (LLM) с использованием методов обучения с подкреплением (RL) без учета ценности, таких как GRPO и DAPO, было достигнуто значительное успехи. Однако истинный потенциал заключается в методах на основе ценности, которые позволяют более точно назначать вознаграждения, отслеживая каждое действие…

  • Эффективное понимание длинных видео: новый подход T* и LV-Haystack

    T* и LV-Haystack: Рамка пространственно-ориентированного временного поиска для эффективного понимания длинных видео Понимание длинных видео, продолжительностью от минут до часов, представляет собой значительную проблему в области компьютерного зрения, особенно по мере того, как задачи понимания видео выходят за рамки коротких клипов. Одной из ключевых трудностей является эффективное выявление немногих релевантных кадров из тысяч в длинном…

  • Эффективные стратегии масштабирования вычислений для моделей генеративного вознаграждения и самосогласованности

    Введение в исследование Данная работа по искусственному интеллекту представляет собой фреймворк машинного обучения для оценки вычислительных затрат на вывод для методов самосогласованности и Генеративных Моделей Наград (GenRM). Проблема и вызовы Большие языковые модели (LLM) продемонстрировали значительные достижения в области рассуждений в различных областях, таких как математика и наука. Однако улучшение этих способностей в процессе тестирования…

  • Google представляет Agent2Agent: новый протокол для безопасного взаимодействия ИИ-агентов в бизнесе

    Google представляет Agent2Agent (A2A) Недавно Google AI анонсировала Agent2Agent (A2A) — открытый протокол, разработанный для обеспечения безопасной и совместимой коммуникации между AI-агентами, созданными на различных платформах и фреймворках. A2A предлагает стандартизированный подход к взаимодействию агентов, что позволяет оптимизировать сложные рабочие процессы с участием специализированных AI-агентов, которые работают над задачами различной сложности и продолжительности. Проблема взаимодействия…

  • Запуск Open-Source фреймворка ADK от Google для разработки многоагентных систем

    Публикация о наборе инструментов для разработки агентов от Google Введение Google выпустил набор инструментов для разработки агентов (ADK) — открытый фреймворк, который упрощает создание, управление и развертывание многопользовательских систем на основе искусственного интеллекта. Этот набор инструментов написан на Python и предлагает модульную и гибкую структуру, подходящую как для простых, так и для более сложных случаев…

  • Роль первых токенов в стабилизации больших языковых моделей: исследование внимания

    Раскрытие внимания: функциональная роль фокуса на первом токене в стабилизации больших языковых моделей Большие языковые модели (LLM) часто демонстрируют странное поведение, когда первый токен в последовательности привлекает необычно высокое внимание, что называется “внимательным колодцем”. Несмотря на то, что этот токен может показаться незначительным, он часто доминирует в внимании на многих уровнях в трансформерах. Исследования показывают,…

  • TorchSim: Революционный движок атомистического моделирования для ускорения научных исследований

    TorchSim: Инновационный Симулятор для Материаловедения TorchSim: Инновационный Симулятор для Материаловедения Компания Radical AI представила TorchSim — современный симулятор атомистических процессов, разработанный на базе PyTorch. Этот инструмент значительно ускоряет симуляции материалов, что меняет традиционные научные подходы. Проблемы Современного Исследования Материалов Текущие исследования в области материалов требуют больших команд, сосредоточенных на отдельных задачах, что приводит к медленному…

  • Evals API от OpenAI: Автоматизация оценки моделей для разработчиков

    Введение в Evals API от OpenAI OpenAI представляет Evals API: Упрощенная оценка моделей для разработчиков Значение Evals API OpenAI представила Evals API, новый инструмент, который упрощает процесс оценки производительности больших языковых моделей (LLMs). Ранее оценки были доступны только через панель управления OpenAI, но теперь разработчики могут определять тесты, автоматизировать запуски оценок и работать с подсказками…

  • Новые модели Salesforce AI: APIGen-MT и xLAM-2-fc-r для многоповоротного обучения агентов

    Введение в APIGen-MT и xLAM-2-fc-r Salesforce AI представила новые модели APIGen-MT и xLAM-2-fc-r, которые значительно продвигают обучение многоходовых агентов с использованием проверенных данных и масштабируемых архитектур больших языковых моделей (LLM). Проблемы традиционных чат-ботов Современные AI-агенты становятся ключевыми компонентами для обработки сложных взаимодействий с пользователями, особенно в бизнесе, где диалоги могут быть многоходовыми. В отличие от…