“`html
Использование больших языковых моделей в академическом письме
В последнее время наблюдается быстрый рост использования больших языковых моделей (LLM), таких как ChatGPT, в академическом письме. Это исследование расследует, насколько распространены эти ИИ-инструменты в научной литературе, особенно сосредотачиваясь на выявлении изменений в стиле письма и словарном запасе в аннотациях биомедицинских исследований из PubMed в период с 2010 по 2024 год.
Практические решения и ценность
Широкое распространение LLM вызвало опасения относительно подлинности и оригинальности научных текстов, с влиянием на исследовательскую целостность и оценку академических вкладов.
Методы анализа использования LLM в академической литературе
Традиционные попытки количественно оценить присутствие текстов, сгенерированных LLM, в академической литературе полагались на несколько методов. Один из распространенных подходов включает использование детекторов LLM, обученных различать между человеческим и ИИ-сгенерированным текстом на основе известных образцов. Другой метод моделирует распределение частоты слов в научных текстах, рассматривая их как смеси человеческого и ИИ-сгенерированного контента. Третий подход использует списки маркерных слов, чрезмерно используемых LLM, обычно стилистических терминов, а не содержательной лексики.
Новый подход к анализу использования LLM
Предлагается новый, основанный на данных подход, который избегает некоторых ограничений предыдущих методов. Вместо использования заранее определенных наборов данных человеческих и LLM-сгенерированных текстов, их метод исследует избыточное использование слов для выявления участия LLM. Эта методика позволяет более беспристрастный и всесторонний анализ влияния LLM на научное письмо.
Результаты и выводы исследования
Анализ показал, что определенные слова, особенно стилистические, такие как “погружается”, “демонстрирует” и “подчеркивает”, показали значительное увеличение частоты, что свидетельствует об участии LLM. Исследователи количественно оценили это избыточное использование с помощью двух мер: разницы в избыточной частоте (разница между наблюдаемой и ожидаемой частотой) и отношения избыточной частоты (отношение наблюдаемой к ожидаемой частоте).
Заключение и практическое применение
Исследование подчеркивает значительное изменение стилей академического письма в связи с появлением LLM, а также поднимает важные вопросы о научной целостности и будущем академического письма.
Полный текст статьи доступен по ссылке.
Вся заслуга за это исследование принадлежит его авторам.
Присоединяйтесь к нашему каналу в Telegram и группе в LinkedIn.
Если вам понравилась наша работа, вам понравится и наша рассылка.
Не забудьте присоединиться к нашему сообществу в Reddit.
Статья опубликована на портале MarkTechPost.
“`