Символьная регрессия: новый метод машинного обучения
Значение символьной регрессии
Символьная регрессия – это передовой метод вычислений для нахождения математических уравнений, лучше всего объясняющих набор данных. Этот подход получил широкое признание в научных областях, таких как физика, химия и биология, где исследователи стремятся выявить основные законы, управляющие природными явлениями. Путем создания интерпретируемых уравнений символьная регрессия позволяет ученым более интуитивно объяснять закономерности в данных, что делает ее ценным инструментом в широком поиске автоматизированного научного открытия.
Решение масштабных задач символьной регрессии
Одним из ключевых вызовов в символьной регрессии является огромное пространство поиска потенциальных гипотез. С увеличением сложности данных количество возможных решений растет экспоненциально, делая эффективный поиск вычислительно затруднительным. Традиционные подходы, такие как генетические алгоритмы, часто нуждаются в помощи с масштабируемостью и эффективностью. В результате существует настоятельная необходимость в более эффективных методах обработки больших наборов данных без ущерба точности или интерпретируемости, тем самым стимулируя прогресс в научных открытиях.
Новаторский метод LASR
Исследователи из UT Austin, MIT, Foundry Technologies и Университета Кембриджа разработали новый метод под названием LASR (Learned Abstract Symbolic Regression). Этот инновационный подход объединяет традиционную символьную регрессию с большими языковыми моделями (LLM), чтобы ввести новый уровень эффективности и точности. Метод LASR разработан для создания библиотеки абстрактных, многократно используемых концепций, чтобы направлять процесс генерации гипотез. Путем использования LLM метод сокращает зависимость от случайных эволюционных шагов и вводит механизм, основанный на знаниях, направляющий поиск к более релевантным решениям.