Великий и ужасный детектор текста

Содержание

  1. 1. Вводные данные
    1. 1.1. Автор эссе
  2. 2. Попытки поиска и сравнения
    1. 2.1. CopyLeaks
    2. 2.2. Content At Scale
    3. 2.3. Smodin
  3. 3. Что же делать "идейным борцам за денежные знаки"?

Вас обманули. Вам дали гораздо лучший текст. Это сгенерированный текст!

Всем привет! Сегодня будем пытаться найти наиболее надежные детекторы сгенерированного текста. Выборка, увы и ах, небольшая - 3 эссе, а массовые проверки по АПВУЗ в штиль, даже по цене в 200 руб, умноженных на несколько сотен эссе - дело достаточно дорогое. 

Вводные данные

Темы эссе взяты на основе одного из заказов, по тем же требованиям, но с измененными темами. Для удобства были взяты темы: 

  • Столяр будущего - кто он?
  • Какими я вижу ВУЗы в 2035 году?
  • Астрология - наука или искусство?

С требованиями: +- 2 стр А4, шрифт TNR14, отступ 1.5, по ширине. Сам текст эссе без форматирования представлен в файлах ниже. 

Используемый запрос: Напиши очень большое детальное научное эссе с множеством примеров из реальной жизни на тему "<указанная тема>".

Автор эссе

В данной статье тестируем GPT 3.5 от OpenAI, GPT 4 пока ограничен для всех по количеству запросов на единицу времени (если веб-версия), или частично неудобный и дорогой (если через API). Остальные языковые модели или ограничены одним\несколькими языками (PaLM, Bard от Google), или обучены на явно меньшем количестве данных(YaLM от Yandex).

Системы проверки: 

Для сравнения были выбраны или системы от законодателя мод (OpenAI, АП.ВУЗ), или же системы без freemium / подписки / покупки проверок.

Т.к. некоторые системы проверки выдают ответ вида "вероятно, текст сгенерирован" (без четких утверждений), то допускаем, что все варианты "(очень \ средне \ ..) вероятно, что текст сгенерирован" - приравниваем к "текст сгенерирован ИИ". Соответственно, (мало \ не очень \ ..) - приравниваем к "текст написан человеком". 

Попытки поиска и сравнения

1. Находим стартовую оригинальность

Для сравнения берем еТХТ, глубокая проверка, слов в шингле - 3. 

  • "ВУЗы" - 97/97% (с/без перефраза),
  • "Столяр" - 99/98%,
  • "Астрология" - 96/96%

2. Теперь очередь более специализированных инструментов:

  • 50/50: не определено точно,
  • V: >50% вероятности что сгенерировал робот,
  • X: >50% что написал человек.

3. И конечно же берем АПВУЗ (список модулей прикреплен ниже): 

  • "ВУЗы" - 96/2/2% (оригинальность / схожесть / цитирования, параметры округлены),
  • "Столяр" - 100/0/0%,
  • "Астрология" -98/0/2%.

"Великий и ужасный" показал, что все 3 текста - написаны человеком. О как!

Как видим, сгенерировать текст явно проще, чем показать, что он - сгенерирован. Даже казалось бы тем, кто генератор текста ранее и создал - OpenAI. На данный момент лидируют:

CopyLeaks

Который даже выделяет красным куски текста, которые могут быть сгенерированы:

Content At Scale

Аналогично №1, но еще и выдает расчеты неких параметров:

Smodin

В целом - похож на №1 и №2, также имеет ужасное ограничение в 5 проверок\день, но при этом визуализация результатов сделана более отчетливо:


Что же делать "идейным борцам за денежные знаки"?

Очевидно - жить стало лучше, жить стало веселей. Абсолютно все текстовые работы без проверки на антигенераторах могут быть что..? Правильно, сгенерированы. Сюда попадают как фабрики однотипных заданий (ТУСУР, РосДистант, частично Витте, ММУ, ..), так и большинство курсовых и других вариантов "научной" деятельности.

На данный момент не под угрозой курсовые по техническим предметам (если расчеты, то считать GPT3.5 не может. GPT4 - научили), чертежи и работы с большой графической частью. Также не могут быть сгенерированы работы по юриспруденции (НПА/ФЗ обновляются быстрее чем модели).


Но самое важное, что уже можно сказать точно - следующий сезон будет сезоном демпинга.

Причина? Скорость написания / генерации!

  • GPT3: около 10-15 секунд / эссе,
  • Человек: ориентировочно 5-10 минут / эссе.

Производительность на пустом месте в +-60 раз не увеличивается :)


Комментарии
17

Ей, а чего .тхт с самими эссе не добавили?

Видимо, случился баг! :(( Отправьте мне пожалуйста в личные сообщения файл, прикреплю его вручную.

Так это. Дайте плиз сами тексты почитать....

"GPT 4 пока ограничен для всех по количеству запросов на единицу времени (если веб-версия), или частично неудобный и дорогой (если через API)." - не совсем корректное утверждение.

GPT 4 пока ограничен для всех по количеству запросов на единицу времени (если веб-версия) - это верно, но это только 50%. Оставшиеся 50% в том, что возможность его юзания заключается в необходимости оплаты подписки через танцы с бубнами, а количество запросов - 25 за три часа. Т.е. ограничено это да, но о платности ничего не сказано))))

Что еще могу сказать. Те, кто генерируют тексты будут жевать хлеб разве что за счет мест обучения где вероятность что препод прочтет работу чуть более 0 =))))

Второе - касаемо собственно содержания. Использование нейросетей приведет к большему количеству бреда в работах, и увеличению юзеров подобных Варечке.

Третье. Чтобы получить хорошие результаты на нейросети, нужно уметь ее юзать в каждой сфере деятельности. Каждая сфера деятельности предполагает свою специфику использования нейросети.

Как итог, могу с уверенностью сказать за свою область - пока не изобретут нейросеть влючающей в себя все труды авторов по юриспруденции (всех веков, всех стран, а также всех видов - монографии, статьи и прочее), огромные массивы судебной практики ну хотя бы и ГАРАНТа, К+, и судакта ( уж молчу про зарубежные), можно не волноваться. Когда же такое может произойти? Не ранее чем лет через 5 так уж точно, и до такого суперкомпьютера еще додуматься надо и будет он еще и платный 100%.

Так что, толковые авторы еще в обоймы надолго.

А вот там, где работы не читают, нейросеть ничего не изменит. Просто бред копипасты заменит чуть более осмысленный бред нейросети.

Говорить что нейросеть заберет хлеб, все равно что говорить что нас вытеснит Варечка и подобные им.

Отставить панику, работаем)))

Про юристов не знаю, но у менеджеров\экономистов\программистов текст читают в 90% на отвались, и большинство заказов именно такие.

Кроме Синергии, ВУЗы с которыми я работаю, именно такие.

Бывает конечно, что научнику абсолютно неинтересно и он бегло смотрит работы особенно не читая, но это буквально единичные случаи.

Про ТУСУР я уж вообще не заикаюсь...

PS. В копилку нейросети - могу сказать, что это невероятно прекрасный оптимизатор времени и помощник в мелких задачах. Но не более, не более.

Работы по юриспруденции генерируют со страшной силой. Получается бред, однако на практике такие работы прокатывают. Я читала тексты, сгенерированные ИИ. Это очень грустно. Однако грустнее то, что преподаватели их принимают. Здесь главное - найти вуз, где преподаватели не вчитываются в текст и не пытаются его осмыслить. Во многих журналах (исключение - рецензируемые) уже стало появляться много бреда, созданного ИИ. Смешно, но немного грустно, потому что потом эти авторы пойдут практиковать или займутся наукой. Риск того, что все научные диспуты превратятся в беседу Шляпника и Мартовского зайца, все выше. И уровень законов постепенно подползет)

Я извиняюсь. А где сами тексты?

Вообще - отгрузил Татьяне вчера еще, сейчас - не знаю

Этот баг требует для исправления чуть больше времени, чем мы ожидали. Наши программисты уже работают над этим!

Автору - большое спасибо за статью, вот это действительно нужный и полезный материал!

Вот какие статьи нужно писать! А не копипаст из интернета...

Интересный текст, легко читается. Спасибо)

Меня больше всего опыты с сочинениями по литературе в чате GPT порадовали. Особенно по "Муму" и "Бежин луг". Я открыл для себя русскую литературу с совершенно иной стороны. Тургенев бы до такого даже не догадался.

О дааааааааа!

Последние статьи
  • Запускаем новый проект – Ворк24!

    Уважаемые пользователи!Долгое время Студворк являлся единственным крупным проектом нашей компании. Сегодня мы рады представить вам наш новый сервис – фриланс-биржу Ворк24.Почему мы решились на создание нового проекта?Удаленная работа окончательно закрепила за собой статус актуальной и доступной. Однако, в связи с санкционными ограничениями, многие зарубежные фриланс-биржи прекратили свою деятельность в РФ. Вывод средств с них существенно усложнился и многие специалисты потеряли источники стабильного заработка.Наш проект предлагает решение этих проблем. Ворк24 – это российский сервис, который объединяет заказчиков и исполнителей, создавая все условия для комфортной работы.Особенности и преимущества Ворк24Ворк24 – это фриланс-биржа широкого спектра для безопасного и удобного сотрудничества исполнителей и заказчиков из разных сфер деятельности.&nbsp;В роли заказчиков могут выступать как юридические, так и физические лица;В роли исполнителей только квалифицированные практики, имеющие подтвержденный опыт: маркетологи, дизайнеры, разработчики, юристы и другие специалисты, которые активно занимаются профессиональной деятельностью в своей сфере.Чем мы лучше российских аналогичных сервисов? Хороший вопрос, на который мы с уверенностью отвечаем:На нашем проекте пока еще низкая конкуренция среди исполнителей, что позволит опытным специалистам, не имеющим опыт фриланса, начать свой путь в этом направлении;Комиссия безопасной сделки в размере 5% для исполнителей – самая низкая по рынку (ниже не найдете, мы проверяли);Комиссия безопасной сделки для заказчиков – 0%.Будьте в числе первыхВорк24 будет полезен и вам, дорогие пользователи Студворк. Расскажем подробнее:&nbsp;На Ворк24 представлено много специальностей. Среди них есть те, что совпадают с вашими рабочими специальностями. В частности:Работа с текстом (копирайтинг и редактура);Инжиниринг (чертежи, схемы и сметы);Переводы (даже с самых сложных языков мира);Юридические услуги (правовое сопровождение, юридическая экспертиза и т.д.);Бухгалтерский и налоговый учет (для физлиц и юрлиц) и другие направления.Поэтому, добро пожаловать, дорогие авторы, ведь дополнительный источник дохода – это всегда прекрасно.Функционал Ворк24 практически идентичен тому, что уже реализован на Студворк. Ваша адаптация на новом сервисе будет максимально мягкой и безболезненной. Дизайн и внутренняя логика сайта во многом совпадают.Убедитесь в этом сами, начав работу на сервисе:В качестве заказчика;Или исполнителя.&nbsp;Но это ещё не всё. Мы дарим всем новым пользователям приветственный бонус в виде бесплатного PRO-аккаунта на месяц по промокоду “STUDWORK31”, чтобы ваше знакомство с платформой было еще более приятным.Желаем успехов в работе!P. S. Размещение и выполнение студенческих и школьных работ на Ворк24 запрещено.

  • Новые идеи — Октябрь 2024

    Дорогие пользователи!Мы стремимся сделать Студворк сайтом, куда вам захочется возвращаться, где удобно работать и общаться с единомышленниками.Поделитесь своими идеями и предложениями по улучшению функционала в комментариях! Самые полезные идеи постараемся воплотить в жизнь в самое ближайшее время.

  • Технические работы — Октябрь 2024

    Дорогие пользователи!Наш сайт постоянно совершенствуется благодаря вашим отзывам. Ваша обратная связь для нас невероятно важна – она помогает выявить ошибки и улучшить работу сервиса.Поделитесь своими замечаниями и предложениями в комментариях или воспользовавшись кнопкой «Что можно улучшить на сайте?». Благодаря вашим комментариям мы всегда будем в курсе всех недочетов и сможем сделать наш сервис еще лучше.Спасибо за активное участие в развитии сайта Студворк!

  • За что могут отчислить из колледжа и университета?

    Давайте рассмотрим основные причины, по которым студентов могут исключить из колледжа или университета.

  • Факультет, специальность, кафедра, профиль обучения в ВУЗе и колледже — в чем разница?

    Разбираемся, чем отличаются факультет, специальность, кафедра и профиль обучения в ВУЗах и колледжах. Узнайте, как выбрать направление, и почему важно понимать эти термины для успешного поступления.

Показать ещё
Поможем написать учебную работу
Первые отклики уже через 10 минут
Гарантированные бесплатные доработки
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Прямой эфир журнала
Показать ещё
Темы журнала
Показать ещё
Прямой эфир