• РЕГИСТРАЦИЯ

Сжечь Александрийскую библиотеку-2. Google оцифровала 25 млн. книг - почему их нельзя читать?

17 7462

Захватывающая история о том, как человеческая наивность и жадность задушили самый амбициозный IT-проект тысячелетия — проект по оцифровке всех-всех книг, которые только есть в мире.

Из идеи об оцифровке книг и возможности мгновенно искать в них любые отрывки текста родилась Google. Ларри Пейдж и Сергей Брин задумывали создать поисковик не по интернету, но по книгам. Но вышло иначе, а к идее о том, чтобы перевести в цифровой формат все книги они вернулись только в начале "нулевых".

Проект по оцифровке всех сначала американских, а затем вообще всех-всех книг получил кодовое название "Project Ocean". Даже в самой Google те сотрудники, что не были в него вовлечены, рассматривали идею как нечто, слабо совместимое с реальностью. Нечто вроде нынешней "хотелки" Илона Маска отправить человека на Марс. Но проект поддерживали сам Пейдж и Брин, так что у него, разумеется, был более чем зеленый свет.

Начиная с 2002 года Google начала жадно сканировать все книги, до которых могла дотянуться. Для этого она договорилась с крупнейшими библиотеками США и организовала специальные центры сканирования, в которые книги из библиотек свозили фурами. Это не фигура речи — логистически "Project Ocean" был не менее сложным, чем технически.

Да, для реализации проекта Google пришлось придумать специальные "железо" и "софт" — ведь до нее на тот момент задачу быстрого сканирования миллионов книг еще никто не решал.

Сканируемая книга жестко закреплялась на специальном стенде, сверху на нее смотрели несколько фотоаппаратов, а лидар ("трехмерный радар") определял точное положение листов книги в пространстве, чтобы позже специальное программное обеспечение учитывало это и "распрямляло" криво сфотографированные листы бумаги.

Таким образом, в Google решили самую большую проблему при оцифровке книг — их точном закреплении при сканировании, чтобы все получалось ровно и красиво. Тут "голова болела" об этом не у людей, а у программы и ее алгоритмов.

Интересно, что при всей технологической навороченности стендов для "сканирования" книг, листы вручную переворачивали люди — машины не могли делать это достаточно быстро и одновременно достаточно нежно. Ведь перевести в цифровой формат нужно было и старые, и очень старые книги, обращаться с которыми надо было исключительно аккуратно.

Оператор переворачивал страницу, нажимал на педаль на полу, камеры фотографировали, он снова переворачивал — и так до тысячи раз в час.

К августу 2010 года Google потратила на проект в общей сложности 400 млн. долларов. И объявила о том, что по ее подсчетам в мире 129 864 880 книг. И она хочет оцифровать их все.

Тут надо пояснить, что изначально Google вовсе не собиралась открывать полный доступ к книгам — юристы компании этого бы никогда не позволили, они не самоубийцы. Первоначальная идея была — обеспечить возможность поиска по всем-всем книгам с демонстрацией пользователю небольшого отрывка. Юридический отдел Google был уверен, что это попадает под определение "честного использования" и, забегая сильно вперед, отметим, что судебная система в итоге, через много лет тяжб, признала: у компании действительно есть право на подобное использование книг.

Также стоит сказать, что если в большинстве европейских стран книга становится бесплатно доступной обществу через 50 лет после смерти автора, то в США это так не работает. Закон об авторских правах таков, что уже не публикующиеся книги никто не имеет права опубликовать еще раз, не решив все вопросы с автором, издательством или наследниками их прав. То есть книга просто лежит и собирает пыль, а чтобы дать ей вторую жизнь, даже цифровую, надо потратить столько времени и денег, что проще ничего не делать.

Когда издатели и авторы поняли, что Google не шутит насчет "взять и все оцифровать", они моментально возбудились. Шутка ли — компания просто взяла и скопировала содержимое крупнейших американских библиотек! Не спросив разрешения ни у кого, кроме библиотек! В общем, на нее подали в иск — и группа издателей, и Гильдия авторов.

Позже отдельные иски объединили в один коллективный иск, поданные от имени и для защиты прав всех авторов и издателей в США. Это важный, можно даже сказать ключевой момент всей юридической части истории.

В какой-то момент все вовлеченные стороны внезапно поняли — то, что сделала Google, может открыть новый гигантский рынок книг, особенно уже вышедших из обращения.

Однако иск был подан, судебные заседания шли и вместе с ними пришло понимание, что если пустить дело на самотек и доводить его до логического конца, то проиграют все. Так, если авторы и издатели выиграют в суде, то Google им что-то заплатит и прекратит сканировать книги, но не откроет к ним доступ читателям, поскольку не имеет на это права. Если выиграет Google — она сможет показывать читателям отрывки, но не продавать электронные копии книг целиком, поскольку опять же законы это запрещают.

И тогда стороны задумали, вероятно, самое грандиозное в истории соглашение по урегулированию коллективного иска.

Особенность американской судебной системы в том, что во время рассмотрения коллективных исков, представляющих интересы одного или нескольких пластов общества, вы можете в суде "расширить" нормы законов. При условии, что не вмешается Министерство юстиции и согласится судья, рассматривающий дело. Независимость судебной ветви власти во всей своей красе.

На протяжении 2,5 лет юристы Google, библиотек, издателей и Гильдии авторов вели сложнейшие переговоры, суть которых один из их участников кратко, но емко охарактеризовал как "четырехмерные шахматы" — надо было учесть интересы всех сторон.

Самая главная проблема, с которой столкнулись участники переговоров заключалась вот в чем. Ок, допустим, Google делает грандиозный интернет-магазин цифровых книг, в том числе и тех, авторы которых давно умерли, издательства закрылись и вообще непонятно, кому принадлежат права. Кому платить причитающуюся плату? Установление прав на получение денег в каждом конкретном случае стоило бы намного больше, чем любые возможные выплаты. То есть чисто экономически это было бессмысленно.

Но эту проблему решили, придумав создать единое агентство, которому бы шла плата за все старые книги. Наследники авторов и издателей могли бы в него обращаться за своей долей, а часть полученных средств там бы тратили на установление авторства. Поскольку обращались бы, конечно, далеко не все, то схема имела экономический смысл — кому все равно, "спонсировали" бы тех, кто хотел бы, чтобы ему заплатили. Причем правообладатели и авторы в любом случае получали бы 69% от цены электронной книги, а Google бы довольствовалась остальным.

Самое главное — при этом обходились бы нормы американских законов, запрещающих повторную публикацию книг, права на которые ужа давно утратили свою силу и не были заново оформлены.

Грандиозность соглашения привлекла внимание Министерства юстиции США, которое начало расследование и попросило всех, кто возражает против этого соглашения "говорить сейчас или молчать вечно".

Разумеется, возражения поступили. От Microsoft и Amazon с технологической стороны, а также от нескольких тысяч авторов, многие из которых, похоже, не до конца поняли суть соглашения. Против высказывались и многие уважаемые в "книжном" сообществе люди.

По мнению участников тех переговоров, активное противление сделки со стороны "авторитетов" решило вопрос — в Минюсте США вряд ли бы вняли только доводам Microsoft о том, что Google "нечестно" получает доступ ко всем печатным книгам ("Бо-о-о — главный конкурент против!"); не послушали бы там и Amazon, которая на тот момент контролировала 80% рынка электронных книг ("Бу-у-у — монополист на рынке возражает против нового игрока!").

Как полагают отдельные участники переговоров, среди тех авторитетных людей, что высказывались против соглашения, бытовало мнение о том, что сделку стоит завернуть, но потом Конгресс США все равно внесет нужные поправки в законы. Однако они не понимали, что законотворцев какие-то старые книги не интересуют от слова "совсем": с их помощью не выиграешь выборы и не создашь новые рабочие места. "Они, похоже, не понимали, как работает реальный мир", — с горечью замечает участник тех переговоров.

В итоге Минюст США высказал свое очень авторитетное мнение: судье не стоит одобрять сделку, поскольку она а)выходит за рамки сути иска (а иск был о том, можно ли Google показывать выжимки из книг); б)слишком эксклюзивная и создает очень плохой прецедент.

В самом деле — если бы Google договорилась с противниками-ставшими-партнерами в рамках процесса урегулирования коллективного иска, то любой другой технологической компании для получения таких же прав на создание подобного магазина электронных книг пришлось бы заново пройти весь путь. То есть: оцифровать книги —> быть засуженной правообладателями и авторами —> договориться с ними. По мнению чиновников Минюста США, это вообще никуда не годилось. Специально нарушать закон чтобы обойти закон?! Это перебор.

Ну и включить постфактум в иск в качестве ответчиков Microsoft, Amazon и кто бы там еще захотел создать свою цифровую библиотеку такого же масштаба — тоже не было никакой возможности. Это уж было совсем жесткое испытание для системы коллективных исков США, она бы такое не перенесла.

В итоге судья сделку не одобрил, в своем заключении процитировал Минюст США.

Формально в итоге победила, как мы сказали в самом начале, Google — ей позволено показывать отрывки из оцифрованных книг. Но проиграли — все. Читатели не получили гигантской цифровой библиотеки из всех-всех когда-либо напечатанных книг. Издатели и авторы не получили возможности получать постоянно небольшую денежку от их продажи. А Google "заморозила" траты в размере 400 млн. долларов. Даже выиграв, компания охладела к своему проекту и больше не сканирует книги. Кончился запал.

Сегодня где-то далеко на серверах Google лежат 50-60 петабайтов оцифрованных книг. Вот они, только руку протяни. Но доступ к ним имеют лишь несколько инженеров компании, ответственных за то, чтобы никто другой не получил к этим книгам доступ.

Два последних абзаца статьи настолько хороши и от них становится так больно, что мы их просто переведем:

Я спросил у тех, кто занимался этим [в Google] раньше: "Что надо сделать для того, чтобы эти книги были доступны всем?". Я хотел знать — насколько сложно было бы открыть к ним доступ. Что стоит между нами и цифровой публичной библиотекой из 25 млн. томов?

"У тебя были бы большие проблемы [юридического характера], — сказали мне — но все, что надо сделать — написать один запрос к базе данных. Так доступ бы переключился с "Выкл." на "Вкл.". На исполнение такой команды нужно несколько секунд".

Источник: emosurf.com

Любка Соболь навострила лыжи в Женеву: будет позориться на форуме о правах человека

Бывший сотрудник ФБК Виталий Серуканов, покинувший ряды навальнистов после разочарования в блогере и системе обмана населения, высказал свое мнение по поводу предстоящей поездки Любови ...

Вирус не пройдет, спасение есть!

Пока ты дрожишь от страха, следя за победной поступью китайского коронавируса, самый обычный привычный и практически родной грипп деловито выкашивает 10% заразившихся из тех 500-60...

Почему только сейчас?

Сейчас мы приняли целый пакет мер для поддержки семей с детьми. Ответил Путин на вопрос жительницы Санкт-Петербурга, заданный ему во время открытия памятника Собчаку.А что мешало принять эти меры 5,10...

Ваш комментарий сохранен и будет опубликован сразу после вашей авторизации.

0 новых комментариев

    Sage Сегодня 11:28

    Вечная мерзлота в Арктике обильно выделяет метан.

    Исследователи обнаружили тысячи очагов выхода метана на поверхность из постепенно оттаивающей вечной мерзлоты. И это очень плохой знак.Пролетая над некоторыми из самых недоступных частей Аляски и северо-западной Канады, исследователи NASA обнаружили потрясающую по своим размерам территорию оттаивающей вечной мерзлоты — мерзлого слоя почвы, который покры...
    1501
    Sage Вчера 18:44

    Кто такие арии с точки зрения ДНК-генеалогии?

    Смотрим в Большую Советскую Энциклопедию и читаем: «Единственно оправданным и принятым в настоящее время в науке является применение термина «арии» лишь по отношению к племенам и народам, говорившим на индоиранских языках». Это надо же – так лихо и директивно откреститься от своих предков. И далее – «В языкознании арийскими называются индоиранские языки...
    1607

    Базельская башня: тайный план введения мировой валюты.

    PS: Банк Международных расчетов в Базеле (Базельская башня) является банком центробанков. Настоящий хозяин центробанков всех стран, за исключением 3 стран не имеющих ЦБ (Сирия, Иран, Сев.Корея)С сайта ЦБ России:"Банк международных расчетов (БМР) – международная финансовая организация, а также официальный форум центральных банков. Выполняет особую функцию «банка центра...
    1694
    Sage 18 февраля 20:08

    10 научных догм о природе реальности

    Вера в обычную науку состоит в том, что она уже в принципе понимает природу реальности, оставляя только детали, которые нужно заполнить. И, как мы знаем, именно там кроется дьявол. Вот 10 научных догм о природе и мироздании.1. Предположение, что природа механическая или машиноподобная. Животные, растения и мы — это машины. А наш мозг эквивалентен генети...
    337

    8 способов понять, что ваш ум заражен вредоносными программами.

    «Политика — убийца ума.», — Элиэзер Юдковски.Ваш ум похож на компьютер.Ваш мозг — это оборудование, ваше мировоззрение — программное обеспечение.Операционная система, которой вы управляете, в значительной степени зависит от вашей культуры, воспитания, образования и многих других факторов.Разумеется, хорошо функционирующий ум — это ум, который может обно...
    448

    Из чего всё состоит, или Как устроен этот мир.

    Почему нужно знать, как устроен этот мир?Первый вопрос, который вероятно возникает при переходе на эту статью, это вопрос: «А зачем вообще знать, из чего всё состоит, и какое мне дело до того, как этот мир устроен?». Для разрешения так скоро нарисовавшегося вопроса давайте поговорим о воде, ведь вы же о ней зашли почитать?Итак, если ты заходишь в воду, ...
    585

    Квантовая теория биоцентризма: Душа возвращается к другой вселенной после смерти физического тела.

    Квантовая теория и биоцентризм очень занимательное направление науки. С ее помощью можно доказать не только спорную идею существование души, но и переселение сознания в другое место после смерти человека.По мнению ученых, структура Вселенной где мы живем, ее законы и силы, константы, на самом деле содержит тонкую настройку для жизни. Это подразумевает н...
    2345
    Sage 17 февраля 15:44

    Ирландцы и скандинавы – «эмигранты» из Руси

    Интересную гипотезу на основе анализа скандинавскоих мифов приводит российская исследовательница истории нашей страны Н.Павлищева. Оригинальность этой гипотезы состоит в том, что она полностью "выбивает почву из под ног" у прозападных лизоблюдов - сторонников норманской версии истории Руси. Вот, что она пишет...
    1306
    Sage 17 февраля 10:55

    Самолёт протаранил бухгалтерию Пентагона, и 2,3 триллиона долларов бесследно исчезли.

    Как пишет один из авторов американского издания Veterans Today Иен Гринхальх, теракт 11 сентября 2001 года, вследствие которого пострадало здание Пентагона, был «невероятно циничным устранением бухгалтерии Пентагона, которая могла бы выяснить судьбу без вести пропавших 2,3 триллиона долларов, о чем буквально накануне заявил (на тот момент) министр оборо...
    2605
    Sage 14 февраля 17:00

    10 мощных историй о рынке реликвий и святынь.

    Как монахи, воры и даже императоры и цари, не говоря уж про простой средневековый люд, обретали, торговали, крали, раздавали, выгрызали, подменяли, отбирали святые мощи и реликвии. В VIII веке в мире зародился новый очень прибыльный бизнес — продажа мощей. Дело в том, что в 787 году Седьмой Вселенский собор, он же Второй Никейский, запрети...
    1476
    Sage 14 февраля 11:43

    6 странных природных явлений.

    Все эти природные явления выглядят как настоящая магия. Происхождение некоторых из них исследователи уже смогли установить, а некоторые по‑прежнему остаются загадкой.Круги фей в НамибииНа просторах пустыни в Намибии расположены странные круги диаметром до 15 метров, о происхождении которых яростно спорят экологи. Одни утверждают, что их создали термиты,...
    1042

    ЗАЧЕМ СКРЫЛИ ЭФИР ИЗ ТАБЛИЦЫ МЕНДЕЛЕЕВА?

    Мало тех, кто знает, что Д. И. Менделеев был одним из последних всемирно известных русских учёных конца 19-го века, кто отстаивал в мировой науке идею эфира как всемирной субстанциональной сущности, кто придавал ей фундаментальное научное и прикладное значение в раскрытии тайн Бытия и для улучшения народнохозяйственной жизни людей.Официально преподаваем...
    1175
    Sage 13 февраля 15:28

    Мощный циклон принесет в Россию сильный ветер и падение давления.

    Мощный атлантический циклон придет в западные регионы России в выходные дни, а к понедельнику доберется и до Москвы. Он принесет сильный ветер и резкое падение атмосферного давления, сообщил ТАСС в четверг научный руководитель Гидрометцентра России Роман Вильфанд."Сейчас над Атлантикой развивается циклон, по своему давлению супертропический. Такое редко...
    1302
    Sage 13 февраля 09:19

    Давление воздуха над Северной Норвегией было настолько низким, что самолеты перестали летать.

    Это всего лишь еще один пример того, как наша погода становится совершенно сумасшедшей! Давление воздуха над Северной Норвегией упало настолько, что самолеты не смогли доставить к месту назначения более 2000 пассажиров .Атмосферное давление упало до уровня ниже 940 гектопаскалей, не наблюдавшегося в течение нескольких десятилетий.Такое низкое давление д...
    4213
    Sage 11 февраля 23:48

    Когда создали греческий язык?

    Есть в Европе государство Греция. Появилось на политической карте оно в первой половине XIX века отколовшись от Османской империи. Создавалась Греция с военной помощью Великобритании и Франции при попустительстве российского императора Николая I.Сепаратистски настроенная греческая интеллигенция, базировавшаяся, как-то и бывает в таких случаях, загранице...
    1100
    Sage 11 февраля 16:10

    Когда утонул Пра-Питер. Часть 5. Исследование от Владимира Козина (Зодчий1)

    Продолжение, Начало здесь : 1часть 2 часть 3 часть4 частьСледующий раздел. Артефакты, в том числе и письменные источники.В общем-то все 4 предыдущие части показывали артефакты и был приведен ряд письменных источников, к которым относятся и карты. К артеф...
    2780
    Sage 11 февраля 15:39

    Лекция Павла Лурье о древней Согдиане

    Научный сотрудник Эрмитажа Павел Лурье рассказывает о древней стране согдийцев, которая находилась на территории современного Таджикистана, о раскопках города Хисорак и об удивительных находках, которые там сделали. Согдиана, Ария, Бактрия - древнейшая территория расселения арийских племен R1a ...
    302
    Sage 11 февраля 15:24

    В Антарктиде зафиксированы рекордные +18.3С. Адская жара, массовые вымирания и леса в огне: чего ждать от глобального потепления.

    В Антарктиде зафиксирована самая жаркая температура за всю историю наблюдений.: 18,3°C+18,3°C зафиксировано 6 февраля 2020 года, побив предыдущий рекорд на 0,8°c. 17,5°C, предыдущий рекорд зафиксированный в марте 2015 года.Это впечатляет, так как прошло всего пять лет с момента установления предыдущего рекорда, и это почти на один градус выше по Цельсию...
    393
    Sage 10 февраля 14:48

    «Согласие абонента на снятие биометрии не требуется»

    Граждане России упорно не хотят ассоциировать цифровую трансформацию государства, о которой чиновники-форсайтщики кричат на каждом углу, с грубым вмешательством в частную жизнь, ограничением финансовой, медицинской тайн, контролем за перемещениями и т.п. Очередной законопроект, расширяющий использование биометрии при оказании услуг сотовой связи, был вн...
    1769
    Sage 10 февраля 11:51

    Когда утонул Пра-Питер. Часть 4. Исследование от Владимира Козина (Зодчий1)

    Продолжение, Начало здесь : 1часть                                                        ...
    3171
    Служба поддержи

    Яндекс.Метрика