С момента своего выпуска в ноябре 2022 года использование ChatGPT и других больших языковых моделей (LLM) распространилось во многих дисциплинах, включая помощь в написании текстов — от речей до контрактов. Поэтому неудивительно, что некоторые учёные могут использовать ChatGPT для ускорения публикации своих исследований.
Влияние на разнообразие, качество и надёжность научных статей
Пока мало известно о том, как использование контента, созданного с помощью ИИ, может повлиять на разнообразие, качество и надёжность научных статей. Поскольку эти технологии всё ещё новы и постоянно развиваются, пока нет надёжного способа обнаружить использование LLM, и многие учреждения всё ещё разрабатывают политику по ограничению их использования.
Исследование использования ChatGPT в научных публикациях
Чтобы лучше понять, как ChatGPT использовался в научном письме за последние несколько лет, группа исследователей недавно провела исследование, проанализировав 1 121 912 научных статей и препринтов из arXiv, bioRxiv и журналов портфолио Nature.
Исследование, [опубликованное](https://www.nature.com/articles/s41562-025-02273-8) в Nature Human Behaviour, использовало новую систему оценки на уровне популяции, основанную на сдвигах частоты слов, чтобы оценить увеличение содержания, модифицированного LLM, в период с января 2020 года по сентябрь 2024 года.
Результаты исследования
Исследование показало, что аннотации и введения чаще всего подвергались влиянию, в то время как разделы с методами и экспериментами демонстрировали меньшее использование ИИ, вероятно, из-за способности LLM к обобщению.
Наблюдался устойчивый рост вероятного использования ChatGPT по различным темам исследований, причём наиболее заметным было использование в области компьютерных наук — дисциплине, тесно связанной с ИИ.
Анализ показал вероятное использование LLM в 22,5% аннотаций и 19,5% введений в области компьютерных наук к сентябрю 2024 года. В ноябре 2022 года эти цифры составляли около 2,4% и были схожими для всех типов статей в то время.
Использование LLM также было относительно высоким в электротехнике и системных науках к 2024 году — 18% для аннотаций и 18,4% для введений.
В то же время использование LLM было значительно ниже в таких областях, как математика, где использование составило 7,7% для аннотаций и 4,1% для введений.
Дополнительные факторы
Анализ был дополнительно стратифицирован по частоте препринтов авторов, длине статьи и географическому региону. Исследователи обнаружили, что модификация с помощью LLM чаще встречается в нескольких различных случаях. Авторы, которые чаще публиковали препринты, были связаны с более частым использованием LLM в своих статьях, возможно, из-за возросшего давления выпускать больше статей в более короткие сроки.
Более короткие статьи — менее 5 000 слов — также были связаны с большей помощью со стороны LLM, наряду со статьями в более конкурентных областях исследований, таких как [компьютерные науки](https://phys.org/tags/computer+science/).
Обнаружение текста, созданного ИИ, в странах, где говорят не на английском языке, сложнее, и ранее были отмечены некоторые предвзятости в методах обнаружения ИИ в отношении авторов, не являющихся носителями английского языка. Это исследование показало более высокое использование LLM в статьях из Китая и континентальной Европы по сравнению с Северной Америкой и Великобританией, но многое из этого, вероятно, связано с помощью на английском языке.
Будущее научных публикаций
Поскольку ландшафт ИИ стремительно развивается в ближайшие годы, он может изменить то, как пишется и распространяется наука, что, в свою очередь, поднимает вопросы о прозрачности, оригинальности и будущем научных публикаций.
Авторы исследования указывают на многие вопросы, на которые необходимо ответить, поскольку наука продолжает внедрять эти технологии:
* Как такие статьи сравниваются с точки зрения точности, креативности или разнообразия?
* Как читатели реагируют на аннотации и введения, созданные с помощью LLM?
* Как модели цитирования статей, созданных с помощью LLM, сравниваются с другими статьями в аналогичных областях?
* Как доминирование ограниченного числа коммерческих организаций в индустрии LLM может повлиять на независимость научных результатов?
Авторы надеются, что их результаты и методология послужат стимулом для дальнейших исследований широко распространённого модифицированного текста LLM и обсуждений о том, как способствовать прозрачным, разнообразным и высококачественным научным публикациям.
© 2025 Science X Network