Новый стандарт для машинного обучения на табличных данных: TabReD от Yandex

 Yandex Introduces TabReD: A New Benchmark for Tabular Machine Learning

“`html

Yandex Introduces TabReD: A New Benchmark for Tabular Machine Learning

В последние годы исследования в области машинного обучения на табличных данных значительно выросли. Однако для исследователей и практиков до сих пор существуют значительные вызовы. Традиционные академические бенчмарки для табличного машинного обучения не полностью отражают сложности, с которыми сталкиваются в реальных промышленных приложениях.

Практические решения и ценность

Для решения этих проблем исследователи из Yandex и HSE University разработали TabReD – новый бенчмарк, который тесно отражает промышленные приложения табличных данных. TabReD состоит из восьми наборов данных из реальных приложений в областях финансов, доставки еды и недвижимости. Код и наборы данных доступны на GitHub.

Для создания TabReD исследователи использовали наборы данных из соревнований Kaggle и приложений машинного обучения Yandex. Они следовали четырем правилам: наборы данных должны быть табличными, инженерия признаков должна соответствовать практикам промышленности, исключались наборы данных с утечкой информации, а также убедились, что в наборах данных есть метки времени и достаточное количество образцов для разделения по времени.

Восьмой набор данных в бенчмарке TabReD включает следующее:

  • Homesite Insurance: предсказывает, купит ли клиент домашнюю страховку на основе пользовательских и политических функций.
  • Ecom Offers: классифицирует, будет ли клиент использовать скидочное предложение на основе истории транзакций.
  • HomeCredit Default: предсказывает, будет ли клиент банка допускать дефолт по кредиту, используя внутренние и внешние данные, фокусируясь на стабильности модели со временем.
  • Sberbank Housing: предсказывает цену продажи недвижимости на рынке жилья в Москве, используя подробные показатели недвижимости и экономики.
  • Cooking Time: оценивает время, необходимое ресторану для приготовления заказа на основе содержания заказа и истории приготовления.
  • Delivery ETA: предсказывает предполагаемое время прибытия для онлайн-заказов продуктов, используя доступность курьера, данные навигации и историю доставки.
  • Maps Routing: оценивает время в путешествии в автомобильной навигационной системе на основе текущих дорожных условий и деталей маршрута.
  • Weather: прогнозирует температуру с использованием измерений метеостанции и физических моделей.

Эти наборы данных имеют два ключевых практических свойства, часто отсутствующих в академических бенчмарках. Во-первых, они разделены на обучающие, валидационные и тестовые наборы данных на основе меток времени, что важно для точной оценки. Во-вторых, они включают больше признаков благодаря обширным усилиям по сбору данных и инженерии признаков.

Исследователи провели тестирование недавних методов глубокого обучения для табличных данных на бенчмарке TabReD, чтобы оценить их производительность с разделением данных по времени и дополнительными признаками. Они пришли к выводу, что разделение данных по времени критично для правильной оценки. Выбор стратегии разделения значительно влиял на все аспекты сравнения моделей: абсолютные значения метрик, относительные различия производительности, стандартные отклонения и относительное ранжирование моделей.

TabReD сокращает разрыв между академическими исследованиями и промышленным применением в табличном машинном обучении. Он позволяет исследователям разрабатывать и оценивать модели, которые более вероятно будут хорошо работать в производственных средах, предоставляя бенчмарк, который тесно отражает реальные сценарии. Это критически важно для упрощения принятия новых научных результатов в практических приложениях.

Бенчмарк TabReD заложил основу для исследования дополнительных направлений, таких как непрерывное обучение, управление постепенными временными изменениями и улучшение техник выбора и инженерии признаков. Он также подчеркивает необходимость разработки надежных протоколов оценки для лучшей оценки реальной производительности моделей машинного обучения в динамичных реальных средах.

Проверьте Paper и GitHub. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter и присоединиться к нашему каналу в Telegram и группе в LinkedIn. Если вам понравилась наша работа, вам понравится наш newsletter.

Не забудьте присоединиться к нашему 46k+ ML SubReddit.

Найдите предстоящие вебинары по ИИ здесь.

The post Yandex Introduces TabReD: A New Benchmark for Tabular Machine Learning appeared first on MarkTechPost.

“`

Полезные ссылки: