✅ Фреймворк CogniDual для языковых моделей: развитие от осознанного рассуждения к интуитивным ответам через самостоятельное обучение

«`html

Продвижение языковых моделей от обдуманного рассуждения к интуитивным ответам через самостоятельное обучение

Когнитивная психология стремится понять, как люди обрабатывают, хранят и вспоминают информацию, и теория двойных систем Канемана предоставляет важную основу. Эта теория различает между Системой 1, которая работает интуитивно и быстро, и Системой 2, которая включает обдуманные и сложные рассуждения. Языковые модели (ЯМ), особенно те, которые используют трансформерные архитектуры, такие как GPT-4, сделали значительный прогресс в искусственном интеллекте. Однако основной вызов заключается в определении, могут ли ЯМ последовательно генерировать эффективные и точные результаты без явного подталкивания к цепочке рассуждений (CoT). Это указало бы на развитие интуитивного процесса, аналогичного мышлению Системы 1 у человека.

Практические решения и ценность

Несколько попыток были предприняты для улучшения способностей ЯМ к рассуждению. Поддержка CoT стала популярным методом, который помогает моделям разбивать сложные проблемы на более мелкие шаги. Однако этот подход требует явного подталкивания и может быть ресурсоемким. Другие подходы сосредоточились на настройке моделей с дополнительными данными обучения или специализированными наборами данных, но эти методы не полностью преодолевают вызов развития интуитивных рассуждений. Цель остается в создании моделей, способных генерировать быстрые и точные ответы без полагания на обширное подталкивание или дополнительные данные обучения.

Исследователи из Шанхайского университета инженерных наук, INF Technology (Шанхай) Co., Ltd., Монашского университета в Мельбурне, Австралия, и Шанхайского университета Фудань предложили CogniDual Framework for LLMs (CFLLMs). Этот инновационный подход исследует, могут ли языковые модели эволюционировать от обдуманных рассуждений к интуитивным ответам через самостоятельное обучение, отражая развитие когнитивных способностей человека. CFLLMs выделяют когнитивные механизмы, лежащие в основе генерации ответов ЯМ, и предоставляют практические преимущества путем снижения вычислительных затрат во время вывода. Более того, исследователи доказали существенные различия в точности ответов между подходами с CoT и без него.

Предложенный метод разработан для исследования пяти ключевых вопросов о когнитивных и рассуждательных способностях языковых моделей, таких как Llama2. Эксперименты проводятся для определения, обладают ли эти модели характеристиками, аналогичными двойной когнитивной системе человека, и может ли самостоятельная практика без руководства CoT улучшить их рассуждательные способности. Более того, эксперимент исследует, обобщаются ли улучшенные рассуждательные способности на различные задачи рассуждения. Этот детальный подход обеспечивает глубокую оценку того, насколько хорошо ЯМ могут развивать интуитивные рассуждения, аналогичные когнитивным способностям человека.

CFLLMs продемонстрировали существенное улучшение производительности без подталкивания CoT, особенно на задачах, включающих логический вывод на естественном языке. Например, на наборе данных LogiQA2.0, более маленькие модели, такие как Llama2-7B и Vicuna-7B, продемонстрировали улучшения в точности без CoT после применения этой структуры. Это указывает на потенциал превращения способностей Системы 2 в интуитивные ответы, аналогичные Системе 1, через практику. Однако структура показала минимальное улучшение на наборе данных GSM8K из-за заражения задачей во время обучения. В целом, более крупные модели требовали меньше примеров для достижения своей емкости Системы 1, показывая их большую способность использовать ограниченные данные для улучшения.

В заключение, исследователи представили CogniDual Framework for LLMs (CFLLMs), инновационный подход для определения, могут ли языковые модели эволюционировать от медленного рассуждения к интуитивным ответам. Экспериментальные результаты демонстрируют, что ЯМ могут сохранять улучшенные способности в решении проблем после самостоятельного обучения без явных подталкиваний CoT. Это подтверждает гипотезу о том, что ЯМ могут превратить рассуждения Системы 2 в более интуитивные ответы, аналогичные Системе 1, с помощью соответствующего обучения. Будущие усилия должны решить текущие ограничения и исследовать, как CFLLMs влияют на когнитивные предпочтения обработки ЯМ, с целью развития более эффективных и интуитивных систем искусственного интеллекта.

Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter и присоединиться к нашей группе в LinkedIn. Если вам нравится наша работа, вам понравится наш новостной бюллетень.

Не забудьте присоединиться к нашему сообществу Reddit.

БЕСПЛАТНЫЙ ВЕБИНАР ПО ИСКУССТВЕННОМУ ИНТЕЛЛЕКТУ: «SAM 2 для видео: как настроить на ваши данные» (Ср, 25 сентября, 4:00 — 4:45 EST)

Статья CogniDual Framework for LLMs: Advancing Language Models from Deliberate Reasoning to Intuitive Responses Through Self-Training была опубликована на MarkTechPost.

Как использовать искусственный интеллект для развития вашего бизнеса

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте CogniDual Framework for LLMs: Advancing Language Models from Deliberate Reasoning to Intuitive Responses Through Self-Training.

Проанализируйте, как ИИ может изменить вашу работу. Определите, где возможно применение автоматизации: найдите моменты, когда ваши клиенты могут извлечь выгоду из AI.

Определитесь какие ключевые показатели эффективности (KPI): вы хотите улучшить с помощью ИИ.

Подберите подходящее решение, сейчас очень много вариантов ИИ. Внедряйте ИИ решения постепенно: начните с малого проекта, анализируйте результаты и KPI.

На полученных данных и опыте расширяйте автоматизацию.

Если вам нужны советы по внедрению ИИ, пишите нам на Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.

Попробуйте AI Sales Bot. Этот AI ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж, снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab. Будущее уже здесь!

«`

Фреймворк CogniDual для языковых моделей: развитие от осознанного рассуждения к интуитивным ответам через самостоятельное обучение

Продвижение языковых моделей от обдуманного рассуждения к интуитивным ответам через самостоятельное обучение

Практические решения и ценность

Как использовать искусственный интеллект для развития вашего бизнеса

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Запустите свой ИИ проект бесплатно

Монетизация Telegram-канала с цитатами и мотивацией

AI-монетизация для преподавателя по математике

Монетизация экспертного канала по саморазвитию

Монетизация AI в нише эзотерики

ИИ-агенты искусственный интеллект онлайн для бизнеса

ИИ-Агент по обработке клиентских запросов : автоматизация поддержки и анализа диалогов

ИИ-Специалист по автоматизации интеграции систем : настройка API и потоков данных

ИИ-Агент для автоматизации медицинских записей : структурирование данных пациентов

ИИ-Специалист по соблюдению норм : автоматизация проверки документов

Что писать в первом письме клиенту: искусственный интеллект сгенерирует текст под вашу воронку и ЦА

Как быстро реагировать на жалобы покупателей: искусственный интеллект предложит шаблоны ответов на типовые претензии

Как провести экспресс-анализ резюме за 3 минуты: искусственный интеллект подскажет, на что смотреть первым

Скрипт “дозвона после неудачного контакта”: искусственный интеллект предложит шаблон повторного касания

Как рассчитать совокупный риск проекта: ИИ построит карту рисков и формулу расчетов

Как описать пользовательские истории по Agile: ИИ предложит шаблоны user stories и acceptance criteria

Лучший ИИ онлайн

MiroMind-M1: Открытые решения для математического моделирования с использованием многослойного обучения

Stacklock выпустил Promptwright: библиотеку Python для генерации синтетических наборов данных с использованием LLM (локально или в облаке)

Знакомьтесь с Taylor AI: стартап, финансируемый YC, использующий свой API для классификации текста в большом масштабе и доступный по более низкой цене, чем LLM.

OpenWebVoyager: Создание многомодальных веб-агентов через итеративное исследование, обратную связь и оптимизацию

Оптимизация Байеса для выявления предпочтений с использованием больших языковых моделей

Google выпустил передовые технологии для генерации видео и изображений: 4K видео и создание видео длительностью несколько минут.

Управление авторскими правами в технологиях генеративного искусственного интеллекта: подход игровой теории сотрудничества.

Новая архитектура внимания для графовых трансформеров: улучшение масштабируемости моделей.

Вакансии

Редакционная политика

Авторские права

Контакты

Подписка

Куки-политика