“`html
Машинный перевод литературных текстов: вызовы и решения
Машинный перевод (MT) сделал впечатляющие успехи благодаря прорывам в глубоком обучении и нейронных сетях. Однако перевод литературных текстов остается сложной задачей для систем машинного перевода из-за их сложного языка, фигуративных выражений, культурных особенностей и уникального стиля. Это делает литературный перевод одной из самых сложных областей в машинном переводе, часто называемой “последним рубежом машинного перевода”.
Применение крупных языковых моделей в машинном переводе
Большие языковые модели (LLM) преобразовали область искусственного интеллекта. Эти модели предварительно обучаются на огромном объеме текстовых данных, учатся предсказывать следующее слово в предложении. После предварительного обучения используется надзорная донастройка (SFT) или инструкционная донастройка (IT) для адаптации моделей к общим языковым знаниям. Также разрабатываются многоагентные системы, которые позволяют агентам понимать окружающую среду, принимать правильные решения и реагировать соответствующим образом.
TRANSAGENTS: многоагентная система для литературного перевода
Исследователи из Университета Монаша, Университета Макао и Tencent AI Lab представили TRANSAGENTS – многоагентную систему для литературного перевода, способную справляться с сложными деталями литературных произведений с использованием многоагентных методов. TRANSAGENTS способна генерировать переводы с более детальными и разнообразными описаниями, и при этом стоит в 80 раз дешевле, чем профессиональные человеческие переводчики при переводе литературных текстов.
Оценка качества переводов
Исследователи представили две стратегии оценки качества переводов: монолингвистическую человеческую предпочтительность (MHP) и билингвистическую предпочтительность LLM (BLP). MHP фокусируется на влиянии перевода на целевую аудиторию, уделяя внимание плавности и соответствию культуре, в то время как BLP сравнивает переводы непосредственно с оригинальными текстами с использованием передовых LLM.
Заключение и рекомендации
TRANSAGENTS представляет собой многоагентную виртуальную компанию, разработанную для литературного перевода, отражающую традиционный процесс публикации переводов. Несмотря на низкие показатели d-BLEU, переводы, сгенерированные TRANSAGENTS, предпочтительнее для человеческих оценщиков и языковых моделей, и стоят в 80 раз дешевле профессиональных человеческих переводчиков. Однако определенные ограничения TRANSAGENTS подчеркивают проблемы в подходах к оценке машинного перевода, такие как плохие метрики оценки и надежность референсных переводов.
Исследование доступно по ссылке. Вся заслуга за это исследование принадлежит исследователям проекта. Также не забудьте подписаться на наш Twitter. Присоединяйтесь к нашему каналу в Telegram, Discord и LinkedIn.
Если вам нравится наша работа, вам понравится наша рассылка.
Не забудьте присоединиться к нашему сообществу в SubReddit.
Исследование было опубликовано на портале MarkTechPost.
“`