Система редактирования знаний для интеграции и разрешения конфликтов в графах знаний и больших языковых моделях.

 OneEdit: A Neural-Symbolic Collaborative Knowledge Editing System for Seamless Integration and Conflict Resolution in Knowledge Graphs and Large Language Models

“`html

Искусственный интеллект (ИИ) в системах хранения и управления знаниями

Искусственный интеллект (ИИ) долгое время фокусировался на разработке систем, способных хранить и управлять огромными объемами информации и эффективно обновлять это знание. Традиционно символические системы, такие как Knowledge Graphs (KGs), использовались для представления знаний, обеспечивая точность и ясность. Эти графы отображают сущности и их отношения в структурированной форме, что полезно для приложений, таких как рассуждение, поиск информации и обработка естественного языка. С другой стороны, нейронные системы, особенно Large Language Models (LLMs), предлагают обширные знания через глубокое обучение. LLMs, такие как модели GPT и Qwen, могут обрабатывать множество задач благодаря своим обширным наборам данных и мощным архитектурам. Однако вызов состоит в интеграции этих двух подходов для объединения точности KGs с обширной обработкой данных LLMs.

Проблемы в управлении знаниями и представлении знаний

Одна из основных проблем в управлении знаниями и представлении знаний – это эффективное обновление знаний без переобучения целых систем. KGs, хотя и точны, сталкиваются с проблемой масштабируемости. Они должны улучшить свою способность обрабатывать большие объемы данных, особенно когда новую информацию необходимо интегрировать в реальном времени. В свою очередь, LLMs, обученные на обширных наборах данных, сохраняют статический “снимок” знаний после обучения. Это означает, что без повторного обучения они не могут интегрировать новые данные. В результате они могут предоставлять устаревшую или неточную информацию, особенно в быстро развивающихся областях, таких как актуальные события или научные исследования. Невозможность эффективно обновлять знания затрудняет производительность систем искусственного интеллекта, так как эти системы должны быть актуальными в динамических средах.

Ранее использовавшиеся методы для решения этой проблемы

Ранее методы для решения этой проблемы в целом попадали в три категории: мета-обучение, методы “найти-потом-редактировать” и техники на основе памяти. Модели мета-обучения используют внешнюю сеть для прогнозирования необходимых изменений градиента для обновления знаний, с такими методами, как MEND и MALMEN, в качестве примеров. Модели “найти-потом-редактировать”, такие как ROME и MEMIT, стремятся найти конкретные параметры в модели, которые хранят необходимые знания, которые затем могут быть изменены. Техники на основе памяти, такие как SERAC, хранят конкретные скрытые состояния в модели и обновляют их по мере необходимости. Несмотря на прогресс этих методов, им часто не хватает точной манипуляции знаниями. Эти методы также вносят значительные побочные эффекты, такие как снижение производительности модели и конфликты между новыми и старыми знаниями.

OneEdit: новаторская система редактирования знаний

Исследователи из университетов Чжэцзян, Национального университета Сингапура и Ant Group представили OneEdit в ответ на эти ограничения. Эта нейронно-символическая система редактирования знаний интегрирует символические KGs и нейронные LLMs. OneEdit – это коллективная система, которая позволяет пользователям эффективно обновлять и управлять знаниями с помощью естественных языковых команд. Система построена на модульной структуре, состоящей из трех основных компонентов: Интерпретатора, Контроллера и Редактора. Интерпретатор позволяет пользователям взаимодействовать с системой, используя естественный язык, интерпретируя их команды в запросы на редактирование знаний. Контроллер обрабатывает эти запросы, используя KG для разрешения конфликтов между различными кусками знаний, предотвращая несоответствия или введение токсичной или ошибочной информации. Наконец, Редактор выполняет процесс редактирования, модифицируя KG и LLM на основе предоставленного ввода.

Преимущества OneEdit

OneEdit особенно эффективен в решении конфликтов, возникающих во время обновления знаний, что является распространенной проблемой в масштабных системах искусственного интеллекта. Например, при редактировании знаний OneEdit обеспечивает не только обновление KG, но и поддержание согласованности LLM по всей системе. Система также включает механизм отката, который позволяет ей вернуться к предыдущим версиям знаний в случае ошибок или конфликтов. Эта функция критически важна, когда знание развивается, такое как в политических сценариях или научных достижениях. Механизм отката OneEdit как по времени, так и по памяти эффективен, позволяя системе обрабатывать крупномасштабные обновления, не существенно влияя на производительность.

Эксперименты и результаты

Исследователи провели эксперименты на двух наборах данных для проверки производительности OneEdit: один с фокусом на американских политических деятелях, и другой по академической статистике. Система была протестирована по сравнению с базовыми методами, такими как ROME, MEMIT, GRACE и стандартная тонкая настройка. OneEdit продемонстрировал высокую точность, улучшая метрики производительности по сравнению с существующими подходами. Например, на наборе данных американских политиков OneEdit достиг результатов надежности 0.951 с GRACE и 0.995 с MEMIT, превзойдя другие методы, которые часто не смогли поддерживать локальность или точность при множественных редактированиях. OneEdit также проявил себя в многопользовательских сценариях, где знания редактировались разными пользователями последовательно. В этих тестах OneEdit поддерживал согласованность даже тогда, когда одно и то же знание редактировалось несколько раз. Это критически важно для реального применения, где несколько пользователей могут одновременно обновлять системы искусственного интеллекта.

Заключение

OneEdit предлагает инновационный подход к редактированию знаний путем объединения лучших характеристик символических и нейронных систем. Исследователи успешно продемонстрировали, что система способна эффективно обрабатывать крупномасштабные обновления знаний, минимизируя использование памяти и времени. Благодаря механизмам отката, инструментам разрешения конфликтов и способности работать в различных областях, OneEdit преодолевает ограничения текущих методов редактирования знаний. Способность системы поддерживать точность и надежность в различных областях делает ее значительным прорывом в управлении знаниями с применением искусственного интеллекта, с потенциальными применениями в областях от политики до академии.

Источник изображения: ссылка на источник изображения

Проверьте научную статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на нас в Twitter и присоединиться к нашей группе в LinkedIn. Если вам нравится наша работа, вам понравится наша рассылка.

Подпишитесь на наш Telegram-канал для получения последних обновлений в области ИИ.

Не забудьте присоединиться к нашему сообществу более чем 50 тыс. человек на ML SubReddit

БЕСПЛАТНЫЙ ВЕБИНАР ПО ИСКУССТВЕННОМУ ИНТЕЛЛЕКТУ: «SAM 2 for Video: How to Fine-tune On Your Data» (Ср, 25 сентября, 4:00 – 4:45 EST)

Оригинальная статья: (ссылка на оригинальную статью)


“`

Полезные ссылки: