Новую технологию распознавания сгенерированных текстов разрабатывают в НИУ ВШЭ.
30.07.2024Число текстов, сгенерированных искусственным интеллектом, в последние годы растёт в геометрической прогрессии. И качество таких текстов постоянно улучшается. А это значит, что определить, к примеру, реальное авторство учебной работы будет всё труднее. Ведь текст, порожденный нейросетями, выглядит уникальным, его не распознаёт проверка инструментами вроде «Антиплагиата». Однако справиться с этой задачей обещают исследователи Высшей школы экономики.
Подпроект «Поймай бота: семантические пространства дополненного ума» относится к большому стратегическому проекту НИУ ВШЭ «Устойчивый мозг: нейрокогнитивные технологии адаптации, обучения, развития и реабилитации человека в изменяющейся среде». «Поимка бота» предполагает создание универсальной системы обнаружения сгенерированных текстов.
«Подавляющее большинство аналогичных проектов посвящено задаче идентификации конкретных архитектур генеративных языковых моделей (к примеру, ChatGPT). Это приводит к неизбежному устареванию таких наработок по мере развития инструментов генерации текстов и (или) возникновения новых типов ботов, а также вынуждает потенциальных потребителей использовать на практике сразу несколько моделей, ответственных за обнаружение ботов с различными архитектурами.
«Мы „ловим“ всех ботов, а не только одного или нескольких, находящихся в нашем распоряжении», — рассказывает руководитель проекта Василий Громов, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ. https://www.hse.ru/news/priority/944780179.html
Авторы хотят в скором времени начать тестирование прототипа на разных типах текстов — от художественных произведений до выпускных квалификационных работ студентов НИУ ВШЭ.
Сделать платформу широко доступной планируется в 2025 году. Сначала она будет работать с текстами на русском и английском языках, а позднее разработчики добавят поддержку языков народов России и стран БРИКС.
Портал «Грамота.ру», сетевое СМИ, свидетельство о регистрации СМИ: ЭЛ № ФС 77 - 84700, выдано 10.02.2023; функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации.