Выбор инструментальной переменной с помощью LLM для улучшения причинно-следственного вывода

 AI-Assisted Causal Inference: Using LLMs to Revolutionize Instrumental Variable Selection

Применение ИИ в открытии новых инструментальных переменных

Основные проблемы и решения

Проблема эндогенности представляет собой значительное вызов в проведении причинно-следственных выводов в наблюдаемых условиях. Исследователи в социальных науках, статистике и смежных областях разработали различные стратегии идентификации для преодоления этого препятствия путем воссоздания условий естественного эксперимента. Метод инструментальных переменных (IV) стал одним из ведущих подходов, позволяя исследователям находить IV в различных ситуациях и обосновывать их соблюдение исключительных ограничений. Однако эти ограничения исключения являются в основе непроверяемых предположений, часто опирающихся на риторические аргументы, специфичные для каждого контекста. Процесс нахождения потенциальных IV требует контрфактического мышления и творчества и вносит свою долю случайности, что подчеркивает необходимость более строгих и систематических методов в причинно-следственных выводах.

Применение больших языковых моделей (LLM)

Большие языковые модели (LLM) представляют собой многообещающий инструмент для открытия новых IV в исследованиях причинно-следственных связей. Исследователь из Университета Бристоля показывает, что эти системы ИИ с их продвинутыми возможностями обработки языка могут помочь в поиске действительных IV и обосновывать их, аналогично человеческим исследователям, но в разы быстрее. LLM могут исследовать огромное пространство поиска, проводить систематические поиски гипотез и заниматься контрфактическим мышлением, что делает их отлично подходящими для задач причинно-следственных связей. Этот подход, основанный на использовании ИИ, предлагает несколько преимуществ: он позволяет быстро и систематически искать IV, адаптируясь к конкретным исследовательским ситуациям, увеличивает вероятность получения нескольких IV для формального тестирования и повышает шансы на нахождение или направление на создание соответствующих данных, содержащих IV. Предложенный метод включает в себя тщательное создание подсказок, направляющих LLM в поиске действительных кандидатов на IV, включение вербальных переводов ограничений исключения и использование методов имитации ролевых игр для подражания процессам принятия решений агентами.

Полезные ссылки: