• РЕГИСТРАЦИЯ

Центр прикладного ИИ Сколтеха фильтрует сетевой контент, надежно определяя создан текст машиной или человеком

4 231

Наши люди живут с надежной проверенной опытом установкой, - подобное исправляется подобным. Метод придуман ещё древними латынянами и кочует от народа к народу в известной поговорке «Similia similibus curantur» («подобное излечивается подобным»). Наш российский народ в этом методе ни разу не разочарован: болит голова после пьянки, - надо пьяным вином/пивом опохмелится. Можно конечно по медицинским показаниям разбавить кровь гемодезом или ещё каким заменителем, но оно все равно на то и выходит, - жидкость жидкостью вытесняют. И что интересно, этот метод у нас и в технической сфере применим, вот и в Сколтехе рассудили здраво ИИ-модели машинного обучения надо ИИ-фильтром сортировать, отделяя текстовые симулякры от авторских письмен.

Проблема то ведь далеко непраздная. Из-за быстрого развития больших языковых моделей, которых уже пруд пруди и от больших ИТ-компаний, и частных вариаций ИИ-джипити_чатов. Поэтому "люди все чаще сталкиваются с текстами, часть которых написана человеком, а часть сгенерирована машиной. Между тем есть ситуации, когда, например, необходима атрибуция авторства и важно четко определить семантическую границу между текстом созданным человеческим трудом и созданным машинным ИИ".

Вот этим и озадачился исследовательский коллектив Центра прикладного ИИ Сколтеха, установив различие и сходство работы ИИ моделей семейства BERT (ALBERT, RoBERTa и DistilBERT). Это самые популярные на сегодняшний день трансформеры основанные на принципе энкодер-декодера (обучение/воспроизводство), простая двунаправленость моделирования языка по маске и для предсказания следующего предложения в так называемых контекстуальных представлениях слов.

Сколтеховцы взяли за основу своего подхода известную меру в теории информации, именуемую перплексией и показывающую, насколько хорошо распределение вероятностей предсказывает выборку. Создали свой алгоритм исследования предсказуемости текста и отлично получилось выявлять разницу между между машинными текстами и человеческим творчеством. Там где высокая перплексия — это текст с сюрпризом на каждом шагу, что обычно свойственно человеческому письму. Низкая перплексия означает более предсказуемую структуру, что часто встречается в машинном тексте.

Добившись успеха у себя в Сколтехе представили доклад посвященный результатам исследования, на конференции по языковому моделированию, организованной Университетом Пенсильвании в Филадельфии, США. Выступление было встречено овацией, а статья получила Outstanding Paper Award — награду за лучшую статью "AI-generated text boundary detection with RoFT". Ещё один хороший пример того, что нельзя изолировать Россию на научном поприще. наша наука была и остается востребованной у научной общественности во всём мире.

Облачный серфер Интернета. Библиотаф, жаден до книг. Дискурсмонгер ИИ.

    О несдающихся

    У себя в Телеграм и во многих других местах я часто натыкаюсь на дискуссию: почему украинцы не сдаются. Основные предлагаемые варианты:1. Потому что глупые.2. Потому, что боятся.3. Пото...

    Семья из Донбасса два месяца прятала раненого русского бойца в 20 метрах от дома с ВСУ
    • ATRcons
    • Вчера 13:57
    • В топе

    Страшная история со счастливым концом. Российский боец Артём Князев с позывным "Князь" был тяжело ранен во время штурма села Новый Комар на Донецком фронте. По его словам, сослуживцы, пы...

    Ловушка идеологии

    До сих пор вроде бы достаточно умные люди периодически вздыхают и говорят: "Да, всё хорошо, вот только идеологии нам не хватает". Я бы не удивился, если бы по поводу идеологии так переж...

    Ваш комментарий сохранен и будет опубликован сразу после вашей авторизации.

    0 новых комментариев

      sapere_auditor 30 марта 22:32

      Изобретена логическая ловушка для интернет-поисковиков и ботов с искусственным интеллектом

      Компания Cloudflare представила инновационное решение для защиты от ботов и краулеров (пауков-поисковиков) на основе искусственного интеллекта — «AI Labyrinth».Вместо того чтобы просто блокировать несанкционированных ботов, которые игнорируют директивы «no crawl» в файле robots.txt (запрещающим сканирование файлов с определёнными шаблонами) на страницах сайтов, и сист...
      292
      sapere_auditor 25 марта 12:12

      Новый ИИ тренд в США: продвинутые инструменты для христианских церквей и других религиозных групп

      Есть такое негласное околоцерковное правило, - не имеешь контакта с Богом, - верь своему епископу - (С) неизвестный автор.Компания Gloo, базирующаяся в Боулдере, штат Колорадо, которая предлагает технологические инструменты христианским церквям и другим религиозным группам, сообщила в понедельник, что Пэт Гелсингер бывший генеральный директор Intel присоединяется к к...
      112
      sapere_auditor 21 марта 14:38

      Позитивные новости в Рунете: вКонтакте подтвердил свою безопасность

      Сервис авторизации VK ID получил международный сертификат ISO/IEC 27001:2022. Это такой международный стандарт, который устанавливает требования к системе информационной безопасности. Сертификат подтверждает, что компания соблюдает передовые практики защиты данных и управления рисками.Вообще сертификат ISO/IEC 27001:2022 может получить любая организация, независимо от...
      116
      sapere_auditor 16 марта 13:26

      А что, так можно было таксовать?!

      Не хочешь стоять в пробках? Решение простое – создай свою службу такси и гоняй по выделенной линии.Именно так поступил СЕО авиакомпании Ryanair Майкл О'Лири, как оказалось, находчив не только в области пассажирских перевозок самолётами, но и на земле. Сообщается , что ирландский бизнесмен купил номерной знак такси для своего Mercedes-Benz S-Class под названием «O'Lear...
      783
      sapere_auditor 7 марта 15:18

      Блумберг: бум генеративных платформ заканчивается и требуются коррективы перспектив для производителей ИИ чипов

      На позапрошлой неделе Блумберг выпустил материал о перспективах NVidia. С учетом критики в адрес последних карт RTX 5090, которые стали выходить из строя не успев выйти в продажу, непонятно, сколько еще компания сможет почивать на лаврах. Так вот, Блумберг пишет:"Дальнейший успех [Nvidia] зависит от того, найдут ли Microsoft Corp. , Google и другие технологические гиг...
      81
      sapere_auditor 21 февраля 19:10

      Новация щита и меча сетевой российской информационной безопасности

      Такое сложное понятие как информационная безопасность (ИБ) в первом приближении оказывается легко представимым, что это просто средства защиты от угроз и системы нападения на источники угроз. На самом деле все гораздо сложнее, нет даже какой-то единой классификации, точнее их предложено много, есть даже некие ведомственные стандарты уровней информационной безопасности...
      168
      sapere_auditor 20 февраля 15:20

      Как всегда, мы долго запрягаем в информационную безопасность тоже, - зато потом всех найдем, поймаем и как им всем покажем кузькину мать

      Власти подготовили поправки против телефонных и интернет-мошенников. Эксперты называют документ самым объемным за последние годы, но предупреждают: злоумышленники постоянно адаптируются и находят новые способы обхода закона. А почему так отстаем от не самой передовой технической мысли, как мы дошли до такой дезадаптации подготовки к противодействию мошенникам?? Не гот...
      163
      sapere_auditor 14 февраля 14:40

      Гранды ИИ-индустрии выдумывают новые поводы привлечения инвесторов потому что прежние подходы себя уже скомпроментировали

      Сэм Альтман возглавляющий OpenAI заявил, что объединение LLM и LRM может принести новые научные знания. Обучение все более крупных языковых моделей (LLM) с использованием все большего количества данных заходит в тупик. По словам генерального директора OpenAI Сэма Альтмана, объединение «гораздо больших» предварительно обученных моделей с возможностями рассуждения (LRM)...
      341
      sapere_auditor 1 февраля 23:40

      Киберпреступники начали продавать электротехнику на маркетплейсах... с программными закладками

      Все прекрасно помним, как Израиль заминировал пейджеры «Хезболлы» и затем коварно воспользовался этим тайным преимуществом, взрывным методом дезорганизовав силы и структуры этой организации. Как говорится, дурной пример - заразителен, и всегда найдутся подражатели, что и незамедлило случиться. Киберпреступники в разных странах мира уже могут продавать заражённую вирус...
      1269
      sapere_auditor 24 января 14:27

      Мнения экспертов: Россия и искусственный интеллект

      К настоящему времени 54% российских компаний, входящих в топ-300 внедрили хотя бы по одному ИИ-решению в бизнес-процессы. ChatGPT при этом начал сдавать, поскольку организации предпочитают наработки родного финтеха. Особенно эффективны модели, основанные на ведущих открытых LLM и дообученные на русском языке. Они лучше всего подходят для решения задач бизнеса. По мнен...
      251
      sapere_auditor 21 января 13:36

      Apple вернулся к идее выпуска собственных телевизоров

      Идея состоит в том, чтобы создать плацдарм в доме с помощью устройства, которое станет базой экосистемы Apple HomeKit и будет работать под управлением новой операционки homeOS.Зачем, спросите вы? Развернутый ответ дает Bloomberg.Apple до сих пор очень сильно зависит от Китая в плане производства, что может стать довольно болезненной точкой, на которую сможет давить Тр...
      184
      sapere_auditor 17 января 16:13

      Крах олигарха Гусинского

      Начавшееся в 2000 году правление В. В. Путина ознаменовалось упразднением Семибанкирщины - российского олигархического объединения. Эта группа крупнейших представителей российского финансового бизнеса (т. н. олигархов), играла значительную политическую и экономическую роль. Объединяла владельцев СМИ, банковских активов и неформально объединившихся, несмотря на внутрен...
      422
      sapere_auditor 14 января 14:35

      США вознамерились душить поставки ИИ-процессоров в Россию и Китай и совсем запретить продажу закрытых ИИ-моделей

      Что-то похожее уже было, только с автомобилями, получилось что США прострелили себе ноги/колеса, а Китай нарастил производство и много где вытеснил штатовскую технику с рынка, в том числе и в РФ. Тем не менее США уже представили новые правила экспортного контроля, которые регулируют передачу и продажу в другие страны процессоров для обучения искусственного интеллекта....
      227
      sapere_auditor 2 января 19:15

      Предновогодняя история в лаборатории подотчетности искусственного интеллекта

      Совсем некрасивая история была затеяна хакером со товарищи чтобы получить престижную премию в области искусственного интеллекта. Чувак подался в стажеры холдинговой компании ByteDance (тех самых китайцев что владеют TikTok, платформой Xigua, новостными агрегаторами Toutiao и BaBe, социальной сетью Helo) вместо того чтобы следовать корпоративным правилам, целенапр...
      221
      sapere_auditor 30 декабря 2024 г. 14:20

      Технологические прорывы 2024 и участие в них РФ

      7 главных технологических прорывов 2024 года: выбор CNews Любая инновация сначала переживает период «хайпа», а затем неизбежно проваливается в «яму разочарований». Если бы существовал отдельный аналитический отчет о тех разработках, что так и остались на дне ямы, он, пожалуй, стал бы самым мрачным артефактом в мире ИТ. Лишь немногим удается оттолкнуться от дна и выйти...
      297
      sapere_auditor 19 декабря 2024 г. 16:04

      Китайская «игра в прятки с ИИ–чипами» бьёт экспортный контроль США

      Исследование Университета Беркли спускает в унитаз стратегию США по сдерживанию Китая в области ИИ.В этом исследовании в деталях и на конкретных примерах показывается, что Китай разработал сверхэффективную систему на стыке разведки, технологий, логистики и межотраслевой координации. И эта система обесценивает любые ужесточения экспортного контроля высокопроизводительн...
      246
      sapere_auditor 6 декабря 2024 г. 15:04

      ИИ-робота на базе LLM так же легко взломать, как чат-бота

      Нашумевшая новость недели, жители московского района Печатники увидели на улицах механического пса, с нанесенной на корпус рекламой даркнет - платформы. При этом робот соблюдал правила пешеходного движения пересекал пешеходные переходы подчиняясь сигналам светофоров. Тем не менее люди проявили ответственность и сообщили в полицию о необычном "пешеходе". Полиция остано...
      302
      sapere_auditor 2 декабря 2024 г. 11:21

      Канадские СМИ подали в суд на OpenAI за ... воровство контента

      Пять канадских медиакомпаний,среди которых Globe and Mail, Toronto Star и Канадская телерадиовещательная корпорация (CBC), подали иск против OpenAI, утверждая нарушение авторских прав и условий использования для обучения ChatGPT.  Канадцы усвоили пример владельцев контента из США редакции газеты New York Times (NYT), кстати подавшей иск ещё в 2023 году, но сразу про...
      323
      sapere_auditor 25 ноября 2024 г. 11:26

      Падение OpenAI, Google и Anthropic с Эвереста данных

      Синдром Эвереста — это понятие введенное в 1994 году Маддуксом. Понятие основано на примере непреодолимого желания Джорджа Мэллори, олимпийского чемпиона по альпинизму, погибшего в 20-х годах прошлого века при попытке покорить Эверест, оно описывает тенденцию, согласно которой учителя и преподаватели будут использовать новую технологию, особенно, связанную с Интернето...
      270
      sapere_auditor 17 ноября 2024 г. 10:00

      Фетва надёжнее файервола

      По мнению совета по исламской идеологии Пакистана, использование VPN для доступа к заблокированным сайтам и незаконному контенту противоречит шариату. Председатель Совета по исламской идеологии (CII) доктор Рагиб Хуссейн Наеми объявил использование виртуальных частных сетей (VPN) неисламским, заявив, что правительство имеет религиозное право принимать меры по блокиров...
      191
      Служба поддержи

      Яндекс.Метрика