“`html
Использование Large Language Models (LLMs) в качестве моделей когнитивных процессов
Ученые, изучающие Large Language Models (LLMs), обнаружили, что LLMs выполняют когнитивные задачи схожим образом с людьми, часто делая суждения и принимая решения, отклоняющиеся от рациональных норм, таких как риск и избегание потерь. LLMs также проявляют человекоподобные предубеждения и ошибки, особенно в задачах вероятностных суждений и арифметических операций. Эти сходства указывают на потенциал использования LLMs в качестве моделей человеческого познания. Однако остаются значительные проблемы, включая объем данных, на которых обучаются LLMs, и неопределенное происхождение этих поведенческих сходств.
Применение LLMs в качестве моделей когнитивных процессов
Применяемость LLMs в качестве моделей когнитивных процессов вызывает споры из-за нескольких проблем. LLMs обучаются на гораздо больших наборах данных, чем люди, и могли быть подвергнуты тестовым вопросам, что привело к искусственным улучшениям человекоподобных поведенческих черт через процессы выравнивания ценностей. Тем не менее, настройка LLMs, таких как модель LLaMA-1-65B, на наборах данных о выборе человека улучшила точность прогнозирования человеческого поведения. Предыдущие исследования также выделили важность синтетических наборов данных для улучшения возможностей LLMs, особенно в задачах решения проблем, таких как арифметика. Предварительное обучение на таких наборах данных может значительно улучшить производительность в прогнозировании человеческих решений.
Практические решения и ценность
Исследователи предлагают улучшить использование LLMs в качестве моделей когнитивных процессов путем (i) использования вычислительно эквивалентных задач, которые должны овладеть как LLMs, так и рациональные агенты для решения когнитивных проблем, и (ii) изучения распределений задач, необходимых для проявления человекоподобного поведения LLMs. Применительно к принятию решений, в частности к рисковому и межвременному выбору, Arithmetic-GPT, LLM, предварительно обученная на экологически валидном наборе данных по арифметике, прогнозирует поведение человека лучше, чем многие традиционные когнитивные модели. Это предварительное обучение достаточно близко соответствует принятию решений людьми.
Поддержка решений через синтетические наборы данных и нейронные активационные паттерны
Исследователи решают проблемы, связанные с использованием LLMs в качестве моделей когнитивных процессов, путем определения алгоритма генерации данных для создания синтетических наборов данных и получения доступа к нейронным активационным паттернам, критическим для принятия решений. Небольшая модель с Generative Pretrained Transformer (GPT) архитектурой, названная Arithmetic-GPT, была предварительно обучена на арифметических задачах. Синтетические наборы данных, отражающие реалистичные вероятности и значения, были сгенерированы для обучения. Детали предварительного обучения включают длину контекста 26, размер пакета 2048 и скорость обучения 10⁻³. Наборы данных о принятии решений людьми в рисковых и межвременных выборах были повторно проанализированы для оценки производительности модели.
Экспериментальные результаты и выводы
Экспериментальные результаты показывают, что встраивания из модели Arithmetic-GPT, предварительно обученной на экологически валидных синтетических наборах данных, наиболее точно прогнозируют человеческие выборы в задачах принятия решений. Логистическая регрессия с использованием встраиваний в качестве независимых переменных и вероятностей выбора человека в качестве зависимой переменной демонстрирует более высокие значения скорректированного R² по сравнению с другими моделями, включая LLaMA-3-70bInstruct. Сравнения с поведенческими моделями и MLP показывают, что встраивания Arithmetic-GPT все еще обеспечивают сильную соответственность с человеческими данными, особенно в задачах межвременного выбора. Устойчивость подтверждается 10-кратной перекрестной проверкой.
Выводы и рекомендации
Исследование заключает, что LLMs, в частности Arithmetic-GPT, предварительно обученная на экологически валидных синтетических наборах данных, могут близко моделировать человеческие когнитивные процессы в задачах принятия решений, превосходя традиционные когнитивные модели и некоторые продвинутые LLMs, такие как LLaMA-3-70bInstruct. Этот подход решает ключевые проблемы с использованием синтетических наборов данных и нейронных активационных паттернов. Полученные результаты подчеркивают потенциал LLMs в качестве моделей когнитивных процессов, предоставляя ценные исследовательские данные как для когнитивной науки, так и для машинного обучения, с подтверждением устойчивости через обширные методы валидации.
Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter. Присоединяйтесь к нашим каналам в Telegram, Discord и группе в LinkedIn.
Если вам понравилась наша работа, вам понравится наша рассылка.
Не забудьте присоединиться к нашему SubReddit с более чем 43 тыс. подписчиков. Также ознакомьтесь с нашей платформой для событий по ИИ.
Использование искусственного интеллекта в бизнесе
Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте This AI Paper from Princeton and the University of Warwick Proposes a Novel Artificial Intelligence Approach to Enhance the Utility of LLMs as Cognitive Models .
Проанализируйте, как ИИ может изменить вашу работу. Определите, где возможно применение автоматизации: найдите моменты, когда ваши клиенты могут извлечь выгоду из AI.
Определитесь какие ключевые показатели эффективности (KPI): вы хотите улучшить с помощью ИИ.
Подберите подходящее решение, сейчас очень много вариантов ИИ. Внедряйте ИИ решения постепенно: начните с малого проекта, анализируйте результаты и KPI.
На полученных данных и опыте расширяйте автоматизацию.
Если вам нужны советы по внедрению ИИ, пишите нам на Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.
Попробуйте AI Sales Bot здесь. Этот AI ассистент в продажах, помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж, снижать нагрузку на первую линию.
Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab будущее уже здесь!
“`