Как Language Agents переводят длинные романы?

Itinai.com it company office background blured chaos 50 v 37924f9a 5cdc 441e b9ab 1def82065f09 1

«`html

Машинный перевод литературных текстов: вызовы и решения

Машинный перевод (MT) сделал впечатляющие успехи благодаря прорывам в глубоком обучении и нейронных сетях. Однако перевод литературных текстов остается сложной задачей для систем машинного перевода из-за их сложного языка, фигуративных выражений, культурных особенностей и уникального стиля. Это делает литературный перевод одной из самых сложных областей в машинном переводе, часто называемой «последним рубежом машинного перевода».

Применение крупных языковых моделей в машинном переводе

Большие языковые модели (LLM) преобразовали область искусственного интеллекта. Эти модели предварительно обучаются на огромном объеме текстовых данных, учатся предсказывать следующее слово в предложении. После предварительного обучения используется надзорная донастройка (SFT) или инструкционная донастройка (IT) для адаптации моделей к общим языковым знаниям. Также разрабатываются многоагентные системы, которые позволяют агентам понимать окружающую среду, принимать правильные решения и реагировать соответствующим образом.

TRANSAGENTS: многоагентная система для литературного перевода

Исследователи из Университета Монаша, Университета Макао и Tencent AI Lab представили TRANSAGENTS — многоагентную систему для литературного перевода, способную справляться с сложными деталями литературных произведений с использованием многоагентных методов. TRANSAGENTS способна генерировать переводы с более детальными и разнообразными описаниями, и при этом стоит в 80 раз дешевле, чем профессиональные человеческие переводчики при переводе литературных текстов.

Оценка качества переводов

Исследователи представили две стратегии оценки качества переводов: монолингвистическую человеческую предпочтительность (MHP) и билингвистическую предпочтительность LLM (BLP). MHP фокусируется на влиянии перевода на целевую аудиторию, уделяя внимание плавности и соответствию культуре, в то время как BLP сравнивает переводы непосредственно с оригинальными текстами с использованием передовых LLM.

Заключение и рекомендации

TRANSAGENTS представляет собой многоагентную виртуальную компанию, разработанную для литературного перевода, отражающую традиционный процесс публикации переводов. Несмотря на низкие показатели d-BLEU, переводы, сгенерированные TRANSAGENTS, предпочтительнее для человеческих оценщиков и языковых моделей, и стоят в 80 раз дешевле профессиональных человеческих переводчиков. Однако определенные ограничения TRANSAGENTS подчеркивают проблемы в подходах к оценке машинного перевода, такие как плохие метрики оценки и надежность референсных переводов.

Исследование доступно по ссылке. Вся заслуга за это исследование принадлежит исследователям проекта. Также не забудьте подписаться на наш Twitter. Присоединяйтесь к нашему каналу в Telegram, Discord и LinkedIn.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему сообществу в SubReddit.

Исследование было опубликовано на портале MarkTechPost.

«`