Русский язык под прицелом нейросетей

46 5657

Говорят, что, дескать, русский мат в армии – это не только речь повседневная, но и, к примеру, способ быстрой передачи сжатой информации во время боевых действий, что позволяет «двумя-тремя» словами, да ещё с вариантами интонаций, резко уменьшить время между командой и её исполнением. Приводится даже количество слов (и знаков тоже) для отдачи приказов в различных армиях с обратно пропорциональной зависимостью с победами. 

Может и так, но, поскольку мы люди интеллигентные, то предлагаю зайти с другой стороны. Тем более, касательно мата в армии «Артикул воинский» Петра I предусматривал: «Ежели кто другаго не одумавшись с сердца, или не опамятовась, бранными словами выбранит, оный пред судом у обиженнаго христианское прощение имеет чинить и просить о прощении. И ежели гораздо жестоко бранил, то сверх того наказанием денежным и сносным заключением наказан будет».

Так что, заход с другой стороны означает, что будем анализировать русский язык без мата, хотя и не литературный в полном смысле слова. Сейчас поясню.

Короче, обратил внимание на такое явление:

Частенько с помощью нейросети перевожу различные видеоматериалы на иностранных языках (чаще английский и французский). Не всем нравится нейроперевод, но это дело вкуса, важно, что смысл на 99% передаётся довольно точно, а это главное. На мой взгляд, даже точнее синхрона если, конечно, его делает не суперпрофессинал.

Поскольку ролики бывают сильно длинными, то при монтаже всегда вырезаю «пустоты», то есть, те куски, где русская речь заканчивается и идёт лёгким фоном иностранная, в результате чего, при монтаже, ролик становился на 15-20% короче, что иногда весьма существенно. Поначалу не придавал значения тому, что перевод идёт фактически с опережением. И тут надо понимать: в тот самый момент, когда нейросеть дала оповещение, что перевод готов, это означает, что весь ролик уже переведён полностью и далее идёт только воспроизведение русской речи на лёгком фоне оригинала. При этом, нейросети в принципе не по зарплате утруждаться даже малейшим творчеством, чтобы максимально точно донести смысл, как это могут делать живые переводчики и особенно при работе со стихами. То есть, перевод тупо идёт слово в слово и никак иначе.

Так вот, в результате задумался, а почему, собственно, так? Неужто получается, что на русском языке иностранный текст (на английском и французском) действительно умещается в меньший объём? И если с другими языками такая же картина маслом, тогда следуют закономерные выводы:

- русский язык и без мата доносит смысл быстрее любого иностранного языка, потому что

- ёмкость русского слова превосходит ёмкость слова иностранного.

Мне могут возразить, что, мол, в иностранных языках куча всяких артиклей, но я подобное не принимаю: все эти артикли, во-первых, как раз и предназначены для уточнения смысла слов, чего русскому языку не требуется, во-вторых, это то, что, с одной стороны, необходимо другим языкам, с другой стороны, однозначно удлиняет текст. Что и требовалось доказать.

В дополнение к сказанному, решил проверить, а как у онлайн-переводчиков, в частности у Гугла, с переводом печатных текстов, для чего, в качестве примеров, приведу несколько кусков случайных оригинальных текстов на 5-ти языках, взятых из сети с последующим их переводом (без редактирования). А чтобы не удлинять статью, вынесу примеры отдельным файлом сюда:

Примеры переводов с помощью Гугл-переводчика

Надеюсь, ресурс на платформе Google открывается у всех. Взято пять европейских языков, в том числе русский, английский, французский, немецкий и испанский, как переводф с русского на иностранные, так и переводы иностранных текстов на все остальные, включая русский.

В результате во всех, случайно взятых текстах, перевод выявил следующее:

- для донесения смысла русскому языку требуется на 15-30% меньше слов,

- с количеством букв в русском варианте не всегда такая же картина, но в большинстве случаев их также действительно меньше.

Что и требовалось доказать. А есть ли в этом скрытый или явный, глубокий или поверхностный смыслы, пусть каждый думает сам.

Примечание: обратный перевод видеоматериалов с русского на иностранный язык сделать, к сожалению, не получилось, хотя для полноты картины и большей объективности было бы нелишне.


Подписывайтесь на тг-канал Спокойно Z Маша

Поддержите Конт – сохраните и развивайте вашу платформу!
  • КОНТ
  • 28 января 16:59
  • Промо

Друзья, мы знаем, что Конт стал важной частью вашего дня. Наша платформа уже давно объединяет огромную аудиторию людей, которые ценят живое общение, интересные материалы и увлекательные дискуссии. Вы ...

Они ТАМ есть! Но есть ВЫ!

Меньшая часть подписчиков — таких же обычных людей, как и все русские, — действительно воспринимает чужую боль, чужое несчастье как своё. Это не значит, что одни — правильные и хорошие,...

Они ТАМ есть! Но есть ВЫ!

Меньшая часть подписчиков — таких же обычных людей, как и все русские, — действительно воспринимает чужую боль, чужое несчастье как своё. Это не значит, что одни — правильные и хорошие,...

Обсудить
  • :thumbsup:
  • > Тем более, касательно мата в армии «Артикул воинский» Петра I предусматривал: Это если не знать что Пётр I автор Петровского Загиба :smirk_cat: Большого и Малого ! :joy:
  • Примечание: обратный перевод видеоматериалов с русского на иностранный язык сделать, к сожалению, не получилось, хотя для полноты картины и большей объективности было бы нелишне. Сами ответили на свой вопрос. Результат будет тем же. В смысле короче. Переводчик убирает паузы между словами и междометия.
  • :thumbsup: :thumbsup: :thumbsup:
  • Старый советский анекдот, времен, когда еще отправляли по почте телеграммы( не путать с нынешним Телеграммом) Телеграмма: ВАСЯ ВСКЛ НУ ЙОБ ТВОЮ МАТЬ ВСКЛ ВСКЛ ВСКЛ ПОДРОБНОСТИ ПИСЬМОМ ТЧК