Телефоны: +7 (925) 0020022
+7 (903) 7697179

Новую технологию распознавания сгенерированных текстов разрабатывают в НИУ ВШЭ.

30.07.2024

Число текстов, сгенерированных искусственным интеллектом, в последние годы растёт в геометрической прогрессии. И качество таких текстов постоянно улучшается. А это значит, что определить, к примеру, реальное авторство учебной работы будет всё труднее. Ведь текст, порожденный нейросетями, выглядит уникальным, его не распознаёт проверка инструментами вроде «Антиплагиата». Однако справиться с этой задачей обещают исследователи Высшей школы экономики.

Подпроект «Поймай бота: семантические пространства дополненного ума» относится к большому стратегическому проекту НИУ ВШЭ «Устойчивый мозг: нейрокогнитивные технологии адаптации, обучения, развития и реабилитации человека в изменяющейся среде». «Поимка бота» предполагает создание универсальной системы обнаружения сгенерированных текстов.

«Подавляющее большинство аналогичных проектов посвящено задаче идентификации конкретных архитектур генеративных языковых моделей (к примеру, ChatGPT). Это приводит к неизбежному устареванию таких наработок по мере развития инструментов генерации текстов и (или) возникновения новых типов ботов, а также вынуждает потенциальных потребителей использовать на практике сразу несколько моделей, ответственных за обнаружение ботов с различными архитектурами.

«Мы „ловим“ всех ботов, а не только одного или нескольких, находящихся в нашем распоряжении», — рассказывает руководитель проекта Василий Громов, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ. https://www.hse.ru/news/priority/944780179.html

Авторы хотят в скором времени начать тестирование прототипа на разных типах текстов — от художественных произведений до выпускных квалификационных работ студентов НИУ ВШЭ.

Сделать платформу широко доступной планируется в 2025 году. Сначала она будет работать с текстами на русском и английском языках, а позднее разработчики добавят поддержку языков народов России и стран БРИКС.

Портал «Грамота.ру», сетевое СМИ, свидетельство о регистрации СМИ: ЭЛ № ФС 77 - 84700, выдано 10.02.2023; функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации.

https://gramota.ru/journal/novosti-i-sobytiya/novuyu-tekhnologiyu-raspoznavaniya-sgenerirovannykh-tekstov-razrabatyvayut-v-niu-vshe