• РЕГИСТРАЦИЯ

Центр прикладного ИИ Сколтеха фильтрует сетевой контент, надежно определяя создан текст машиной или человеком

4 182

Наши люди живут с надежной проверенной опытом установкой, - подобное исправляется подобным. Метод придуман ещё древними латынянами и кочует от народа к народу в известной поговорке «Similia similibus curantur» («подобное излечивается подобным»). Наш российский народ в этом методе ни разу не разочарован: болит голова после пьянки, - надо пьяным вином/пивом опохмелится. Можно конечно по медицинским показаниям разбавить кровь гемодезом или ещё каким заменителем, но оно все равно на то и выходит, - жидкость жидкостью вытесняют. И что интересно, этот метод у нас и в технической сфере применим, вот и в Сколтехе рассудили здраво ИИ-модели машинного обучения надо ИИ-фильтром сортировать, отделяя текстовые симулякры от авторских письмен.

Проблема то ведь далеко непраздная. Из-за быстрого развития больших языковых моделей, которых уже пруд пруди и от больших ИТ-компаний, и частных вариаций ИИ-джипити_чатов. Поэтому "люди все чаще сталкиваются с текстами, часть которых написана человеком, а часть сгенерирована машиной. Между тем есть ситуации, когда, например, необходима атрибуция авторства и важно четко определить семантическую границу между текстом созданным человеческим трудом и созданным машинным ИИ".

Вот этим и озадачился исследовательский коллектив Центра прикладного ИИ Сколтеха, установив различие и сходство работы ИИ моделей семейства BERT (ALBERT, RoBERTa и DistilBERT). Это самые популярные на сегодняшний день трансформеры основанные на принципе энкодер-декодера (обучение/воспроизводство), простая двунаправленость моделирования языка по маске и для предсказания следующего предложения в так называемых контекстуальных представлениях слов.

Сколтеховцы взяли за основу своего подхода известную меру в теории информации, именуемую перплексией и показывающую, насколько хорошо распределение вероятностей предсказывает выборку. Создали свой алгоритм исследования предсказуемости текста и отлично получилось выявлять разницу между между машинными текстами и человеческим творчеством. Там где высокая перплексия — это текст с сюрпризом на каждом шагу, что обычно свойственно человеческому письму. Низкая перплексия означает более предсказуемую структуру, что часто встречается в машинном тексте.

Добившись успеха у себя в Сколтехе представили доклад посвященный результатам исследования, на конференции по языковому моделированию, организованной Университетом Пенсильвании в Филадельфии, США. Выступление было встречено овацией, а статья получила Outstanding Paper Award — награду за лучшую статью "AI-generated text boundary detection with RoFT". Ещё один хороший пример того, что нельзя изолировать Россию на научном поприще. наша наука была и остается востребованной у научной общественности во всём мире.

Облачный серфер Интернета. Библиотаф, жаден до книг. Дискурсмонгер ИИ.

    «Спасибо, товарищ Бастрыкин»: скандал с барским подарком мэра Мытищ таджикам получил неожиданное продолжение

    История с выделением в Мытищах (Подмосковье) сертификата на жилье многодетной семье Тахмины Самадовой и Рамазана Рахимова из Таджикистана, вызвавшая большой резонанс, получила продолжен...

    ФИНЛЯНДИЯ ПОЛУЧИЛА УДАР В СПИНУ ОТ "ЛЮБИМОЙ АМЕРИКИ": ВЫХОДИТ, ЗРЯ СТАРАЛИСЬ?

    Финляндия так старалась ради "любимой Америки": закрывала границы, сыпала упрёками в сторону России, обвиняла Москву почём зря. И в итоге получила удар в спину. От Америки.Финские право...

    Ваш комментарий сохранен и будет опубликован сразу после вашей авторизации.

    0 новых комментариев

      sapere_auditor Вчера 13:36

      Apple вернулся к идее выпуска собственных телевизоров

      Идея состоит в том, чтобы создать плацдарм в доме с помощью устройства, которое станет базой экосистемы Apple HomeKit и будет работать под управлением новой операционки homeOS.Зачем, спросите вы? Развернутый ответ дает Bloomberg.Apple до сих пор очень сильно зависит от Китая в плане производства, что может стать довольно болезненной точкой, на которую сможет давить Тр...
      111
      sapere_auditor 17 января 16:13

      Крах олигарха Гусинского

      Начавшееся в 2000 году правление В. В. Путина ознаменовалось упразднением Семибанкирщины - российского олигархического объединения. Эта группа крупнейших представителей российского финансового бизнеса (т. н. олигархов), играла значительную политическую и экономическую роль. Объединяла владельцев СМИ, банковских активов и неформально объединившихся, несмотря на внутрен...
      333
      sapere_auditor 14 января 14:35

      США вознамерились душить поставки ИИ-процессоров в Россию и Китай и совсем запретить продажу закрытых ИИ-моделей

      Что-то похожее уже было, только с автомобилями, получилось что США прострелили себе ноги/колеса, а Китай нарастил производство и много где вытеснил штатовскую технику с рынка, в том числе и в РФ. Тем не менее США уже представили новые правила экспортного контроля, которые регулируют передачу и продажу в другие страны процессоров для обучения искусственного интеллекта....
      174
      sapere_auditor 2 января 19:15

      Предновогодняя история в лаборатории подотчетности искусственного интеллекта

      Совсем некрасивая история была затеяна хакером со товарищи чтобы получить престижную премию в области искусственного интеллекта. Чувак подался в стажеры холдинговой компании ByteDance (тех самых китайцев что владеют TikTok, платформой Xigua, новостными агрегаторами Toutiao и BaBe, социальной сетью Helo) вместо того чтобы следовать корпоративным правилам, целенапр...
      165
      sapere_auditor 30 декабря 2024 г. 14:20

      Технологические прорывы 2024 и участие в них РФ

      7 главных технологических прорывов 2024 года: выбор CNews Любая инновация сначала переживает период «хайпа», а затем неизбежно проваливается в «яму разочарований». Если бы существовал отдельный аналитический отчет о тех разработках, что так и остались на дне ямы, он, пожалуй, стал бы самым мрачным артефактом в мире ИТ. Лишь немногим удается оттолкнуться от дна и выйти...
      218
      sapere_auditor 19 декабря 2024 г. 16:04

      Китайская «игра в прятки с ИИ–чипами» бьёт экспортный контроль США

      Исследование Университета Беркли спускает в унитаз стратегию США по сдерживанию Китая в области ИИ.В этом исследовании в деталях и на конкретных примерах показывается, что Китай разработал сверхэффективную систему на стыке разведки, технологий, логистики и межотраслевой координации. И эта система обесценивает любые ужесточения экспортного контроля высокопроизводительн...
      198
      sapere_auditor 6 декабря 2024 г. 15:04

      ИИ-робота на базе LLM так же легко взломать, как чат-бота

      Нашумевшая новость недели, жители московского района Печатники увидели на улицах механического пса, с нанесенной на корпус рекламой даркнет - платформы. При этом робот соблюдал правила пешеходного движения пересекал пешеходные переходы подчиняясь сигналам светофоров. Тем не менее люди проявили ответственность и сообщили в полицию о необычном "пешеходе". Полиция остано...
      248
      sapere_auditor 2 декабря 2024 г. 11:21

      Канадские СМИ подали в суд на OpenAI за ... воровство контента

      Пять канадских медиакомпаний,среди которых Globe and Mail, Toronto Star и Канадская телерадиовещательная корпорация (CBC), подали иск против OpenAI, утверждая нарушение авторских прав и условий использования для обучения ChatGPT.  Канадцы усвоили пример владельцев контента из США редакции газеты New York Times (NYT), кстати подавшей иск ещё в 2023 году, но сразу про...
      269
      sapere_auditor 25 ноября 2024 г. 11:26

      Падение OpenAI, Google и Anthropic с Эвереста данных

      Синдром Эвереста — это понятие введенное в 1994 году Маддуксом. Понятие основано на примере непреодолимого желания Джорджа Мэллори, олимпийского чемпиона по альпинизму, погибшего в 20-х годах прошлого века при попытке покорить Эверест, оно описывает тенденцию, согласно которой учителя и преподаватели будут использовать новую технологию, особенно, связанную с Интернето...
      223
      sapere_auditor 17 ноября 2024 г. 10:00

      Фетва надёжнее файервола

      По мнению совета по исламской идеологии Пакистана, использование VPN для доступа к заблокированным сайтам и незаконному контенту противоречит шариату. Председатель Совета по исламской идеологии (CII) доктор Рагиб Хуссейн Наеми объявил использование виртуальных частных сетей (VPN) неисламским, заявив, что правительство имеет религиозное право принимать меры по блокиров...
      148
      sapere_auditor 12 ноября 2024 г. 20:49

      В розыске 72 тысячи нелегальных мигрантов из Кыргызстана, блукающих по просторам России

      Россия и Кыргызстан совместными усилиями пытаются снизить напряженность в отношении мигрантской темы. Как оказалось прежних усилий властей Кыргызстана (об этом статья на cont.ws от 3 сентября 2024) по противодействию нелегальной миграции собственных граждан в Россию попросту недостаточно, немалая часть мигрантов демонстративно игнорирует требования российского законод...
      222
      sapere_auditor 8 ноября 2024 г. 12:04

      Применение ИИ в рекламе на службе саморекламы самих рекламщиков

      Комиссия экспертов Ассоциации Коммуникационных Агентств России подвела итоги развития российского рекламного рынка за первое полугодие 2024 года. Эксперты отметили продолжающееся динамичное развитие рынка – его суммарный объем превысил уровень в 400 млрд руб., сохранив крайне высокую динамику в +28%. Российский рекламный рынок второй год подряд демонстрирует стабильно...
      218
      sapere_auditor 30 октября 2024 г. 19:02

      Наш асимметричный ИИ ответ на вашингтонский ИИ-меморандум

      Из предыдущей статьи про «Меморандум о продвижении лидерства США в области искусственного интеллекта" ясно Вашингтон делает ставку на поддержание своего лидерства и кибер-сдерживание России, Китая и всех других стран, одни из них записывает в свои вассалы, а других во враги. Гегемон мыслит как и должно кибер-рептилоиду, - хищнечески. Не все решаются дать отвод этому ...
      246
      sapere_auditor 25 октября 2024 г. 19:16

      Вашингтонский меморандум о продвижении лидерства США в области ИИ

      Вашингтон опубликовал документ с названием «Меморандум о продвижении лидерства США в области искусственного интеллекта; Использование искусственного интеллекта для достижения целей национальной безопасности; и повышение безопасности, защищенности и надежности искусственного интеллекта».По большей части он сводится к планам по подготовке аналитических записок и дорожны...
      195
      sapere_auditor 11 октября 2024 г. 13:10

      Илон Маск с очередной Tesla новацией - роботакси Cybercab, равносильное запуску iPhone для Apple

      Совсем скоро Tesla проведёт мероприятие на территории Warner Bros. Studios в Калифорнии, чтобы рассказать о своих очередных планах по созданию беспилотных «роботакси». Роботакси Tesla обеспечит поездки пассажиров без водителя в автомобиле. Беспилотные автомобили составят конкуренцию сервисам по организации поездок, таким как Uber и Lyft, и Tesla также протестирует про...
      229
      sapere_auditor 30 сентября 2024 г. 16:09

      Правительство РФ изучает вопрос о почетном звании заслуженного IT-специалиста

      Правительство рассмотрит вопрос о том, чтобы особо отличившихся айтишников представлять к госнаградам, сообщил «Ведомостям» представитель аппарата вице-премьера Дмитрия Григоренко (курирует, в частности, IT-отрасль). Соответствующее предложение ассоциация разработчиков программных продуктов «Отечественный софт» направила Григоренко и министру цифрового развития Максут...
      174
      sapere_auditor 19 сентября 2024 г. 17:18

      Боль и страдания Дженсена Хуанга в тисках Минюста США

      Уже была на Конте публикация о карьере и судьбе главы Nvidia Дженсена Хуанга о том, как он примерил на себя жанровое амплуа успешности по-американски и дал студентам Оксфорда роскошный совет, пожелав им: «Надеюсь, что вы будете страдать. Я желаю вам умеренных доз боли и страданий». И вот теперь он сам живое воплощение этих карьерных болей и страданий, кое кто обвиня...
      209
      sapere_auditor 17 сентября 2024 г. 18:36

      Google в залоге забвения у поколения Z и санкций Минфина США ... теряет значительную часть русскоязычной аудитории

      Согласно исследованию аналитической компании Bernstein Research, зумеры (рожденные примерно с середины 1990-х до начала 2010-х годов и представители поколения альфа (это те, кто помладше родившиеся примерно с начала 2010-х годов включительно — по середину 2020-х годов) перестали использовать слово «гуглить». Вместо этого они вернулись к более общему термину — «ис...
      577
      sapere_auditor 15 сентября 2024 г. 18:19

      Про автоматизацию на автомобильных дорогах при помощи ИИ

      В 2023 году при помощи видеокамер было выписано рекордное за пять лет количество штрафов за нарушения правил дорожного движения: число постановлений достигло 221 миллиона. Если считать по нижней планке штрафа в 500 рублей, то бюджет, благодаря этому, пополнился на 110 миллиардов рублей. Или на 55 миллиардов, если вдруг все получившие штрафы, оплатили их за две недели....
      201
      sapere_auditor 11 сентября 2024 г. 19:19

      Платформа подписок OnlyFans обыгрывает компанию Safe Superintelligence по финансовым показателям

      Финансовый сектор США меняется: вместо классических банков финтех-компании все более успешно трансформируют эту отрасль. В последнее время внедряются инновационные технологии в финансовой индустрии на базе искусственных нейронных сетей (ИНС), которые способствуют широкому спектру оцифровки финансовых транзакций. За инновациями обычно стоят стартапы или молодые компани...
      374
      Служба поддержи

      Яндекс.Метрика