Google Books (Google Книги). Гугле книги


«Google Книги»

5 лет назад 24 февраля 2014 в 15:40 195

W_gb-glav

«Google Книги» (books.google.com), один из масштабных проектов «корпорации добра», обычно обсуждается не так часто, как другие гугловские сервисы. Он просто работает и развивается. Поговорим о том, как можно максимально эффективно использовать все его возможности.

Основа проекта – база электронных книг, пополняемая как напрямую, от издателей, так и масштабной оцифровкой бумажных материалов в сотрудничестве с библиотеками, архивами и другими информационными центрами. В архивах «Google Книг» – миллионы изданий, как книг, так и журналов. Результаты из этой базы подмешиваются в выдачу по запросам в обычном Google, но гораздо интересней пользоваться сервисом напрямую.

Собственная система поиска превращает данный сервис не просто в склад файлов, а в удобный справочный ресурс. Самое главное и полезное его свойство – возможность поиска по текстам электронных книг. Особенно это здорово для отсканированных и оцифрованных изданий.

Как ни крути, но огромный массив печатной информации в Сети не представлен. Особенно это касается изданий «доинтернетовской» эпохи, все еще остающихся «темной материей» для сетевых обитателей. Оцифровка плюс полнотекстовый поиск объединяют сильные стороны старых добрых библиотек и современных технологий и делают «Google Книги» очень ценным источником, которым легко пользоваться. Для чтения найденных материалов на компьютере требуется только браузер, без каких-либо довесков.

В то же время в «Google Книгах» действует важное ограничение, связанное с чтением выложенных изданий. Платформа сервиса по мере возможностей пытается соблюдать баланс интересов правообладателей и пользователей в части доступа к контенту. Правила доступа к тексту произведений определяют правообладатели. Это означает, что на сервисе можно найти как доступные для просмотра в полном объеме произведения, которые можно целиком прочитать в онлайне, так и «закрытые» издания. Так что для комфортного использования важно понимать, что это в первую очередь поисково-справочный ресурс, а не библиотека, предназначенная для чтения книг целиком.Книги, доступные для полного просмотра, можно при желании прочитать от корки до корки, более того, для некоторых из них на боковой панельке присутствует опция сохранения в формате PDF. Как правило, это издания, которые уже перешли в общественное достояние.

Но чаще всего будет встречаться второй вариант – «ограниченный просмотр». Это значит, что в Google отсканирована вся книга, но для просмотра она доступна только частями. Например, если вы вели полнотекстовый поиск, то посмотреть дадут только некоторые фрагменты материала, в которых встретились слова из вашего запроса. Размер этих частей определяется правообладателем: где-то это будет одна страничка, а где-то чуть ли не целая глава. Кроме того, как правило, всегда доступны страницы с оглавлением книги.

Еще более жесткий вариант ограничения просмотра – демонстрация только фрагмента страницы, на котором были найдены ключевые слова. Это очень похоже на текстовые выдержки возле ссылок в результатах обычного интернет-поиска, и польза от данной опции аналогичная. В основном подобные фрагменты пригодны только для выяснения, идет ли вообще в найденном источнике речь о том, что вас интересует. Хотя, конечно, в некоторых случаях достаточно и такой краткой цитаты, благо на нее можно легко сослаться.

Наконец, есть вариант, когда для книжки выводится только ее библиографическое описание. Узнав ISBN (уникальный международный идентификатор издания), можно попытать счастья на других ресурсах и в магазинах.На сервисе предусмотрен режим расширенного поиска книг, среди опций которого есть и фильтр материалов по степени доступности. Так что, если стоит задача найти именно полные издания по интересующей вас теме, не проходите мимо расширенного поиска.

Зная про эти особенности книжного сервиса Google, уже нетрудно представить сценарии его эффективного использования. Во-первых, это фактографический поиск и справки. Полнотекстовый поиск внутри книг – мощная штука, позволяющая увидеть массу интересного, а прошедшие редакционную обработку издания будут получше простых веб-сайтов, достоверность которых еще приходится проверять и проверять. Для работы с конкретным фактом или цитатой бывает достаточно даже самых маленьких превьюшек ограниченного просмотра. Во-вторых, это ознакомление с содержимым издания перед поиском его полной версии в магазине или библиотеке.

Кроме того, на основе сервиса можно построить собственную онлайновую библиотеку. В ней будут храниться ссылки на прочтенные книги, выделена отдельная виртуальная полочка для любимых изданий, собраны ссылки на отзывы и рецензии, которые вы оставляли в ходе чтения. Некоторые разделы можно сделать общедоступными. Вся эта машинерия интегрируется с персональным профилем Google. Кстати говоря, отвязать потом свой профиль от учетной записи «Google Книги» будет невозможно, так что имейте это в виду.

Итак, сплошное чтение книг – явно не конек стандартного сервиса «Google Книги». Да и читать все-таки удобней не в браузере, а на мобильном девайсе. Это направление призван закрыть сервис «Google Play Книги». Хоть он и связан с «просто «Книгами Google», это разные вещи. Идея сервиса состоит в продаже электронных книг через магазин Google Play, причем приобретенные издания добавляются в облачную библиотеку, откуда становятся доступны для устройств, на которых установлено приложение-клиент, объединяющее функции читалки и органайзера личной библиотеки. При использовании приложения на разных девайсах происходит синхронизация всех данных, в том числе закладок, точек, на которых вы находились при закрытии книги. Не так уж редко получается, что одну книгу читают на нескольких устройствах, и эта опция действительно полезна.

Кроме того, недавно добавилась опция пополнения облачной библиотеки самостоятельно загружаемыми файлами. Грузить можно как напрямую, так и через «Диск Google» – работает прямая интеграция. Количество книг ограничено одной тысячей. На мой взгляд, если воспринимать такое облачное хранилище в качестве облачного кармана для читаемых в данный момент книжек и подручной справочной полки, этого более чем достаточно. Если же стоит задача держать в пределах прямой онлайновой досягаемости всю свою библиотеку, то тут придется думать, поскольку такого объема может и не хватить. Поддерживаются только форматы PDF и ePub. Размер отдельного издания – до 50 Мбайт. После загрузки документы конвертируются во внутренний формат сервиса, что может потребовать определенного времени.

Откровенно говоря, в текущем состоянии реализация идеи пока не впечатляет. Выглядит это как небогатая новостройка, требующая немедленного ремонта для получения хоть какого-то уюта. Минимализм в мобильных приложениях – это обычно хорошо, однако в настоящий момент данное приложение, кроме самой «читалки», содержит только несколько служебных виртуальных полок и по доступным возможностям не идет ни в какое сравнение с лучшими специализированными инструментами чтения электронных книг. Преимущества выгрузки собственных книг в облако по сравнению с банальным копированием на девайс неочевидны, да и решения задачи «личная библиотека, доступная в любой точке» можно добиться и другими способами, в том числе и применением обычных облачных хранилищ. Что касается оценки качества самого встроенного книжного магазина, то это вопрос достаточно субъективный. Благо конкурентов, предлагающих собственные базы книг и самые различные коммерческие модели их использования, хватает.

Коль речь зашла о книжном сервисе Google, нельзя не упомянуть отдельную тему приложений-загрузчиков, которые предлагают скачивать целиком издания из архива. Не буду отнимать драгоценное время и сразу скажу, что действительно достойного решения данной задачи в стиле «нажал кнопку  – получил книжку» сейчас нет. Даже считающиеся лучшими программы FSS Google Books Downloader и Google Books Downloader Lite функционируют неважно, хотя и предназначены для обработки исключительно доступных для просмотра в полном объеме книг. Если вы дружите с программированием, достаточно многообещающий вариант  – воспользоваться в качестве основы одним из разнокалиберных скриптов для работы с «Google Книгами», который можно найти на том же Pastebin и попробовать приспособить к своим нуждам.

upweek.ru

Google Books (Google Книги)

Google Books (Google Книги)Один из многочисленных сервисов, предлагаемых компанией Google, называется Google Books (Google Книги). Он был впервые представлен в 2004 году на книжкой выставке во Франкфурте как сервис полнотекстового поиска по книгам, но за годы существования его функционал слегка изменился.

В октябре 2004 года, на момент презентации, сервис носил название Google Print. В ноябре 2005 года его название было изменено на Google Book Search, теперь же мы знаем его под названием Google Books, или Google Книги. Сервис был создан для выполнения полнотекстового поиска по книгам, отсканированным и сохраненным в цифровой базе данных Google.

В декабре 2005 года компания заключила соглашение о начале оцифровки библиотечных фондов с пятью крупнейшими библиотеками США и Великобритании. Это были библиотеки Стэнфордского, Мичиганского, Гарвардского и Оксфордского университетов, а также Нью-Йоркская публичная библиотека. Постепенно партнерами проекта становились все больше библиотек и издательств. В марте 2012 года количество оцифрованных книг превысило отметку в 20 миллионов.

Использование сервиса Google Books мало отличается от использования обычного поиска Google. Вы просто вводите интересующий вас запрос в поисковую строку и нажимаете кнопку «Искать книги». На странице результатов вы увидите перечень книг, в тексте которых встречается данная фраза, с указанием страницы. Также доступен расширенный поиск книг, который позволяет уточнять критерии поиска (язык, название, автор, издатель, дата публикации и т. п.).

Кликнув по названию книги, вы сможете получить общие сведения о ней. Кроме того, на странице результатов можно будет увидеть фрагменты книги, содержащие ключевое слово или фразу. В некоторых случаях есть возможность изучить страницу полностью или даже часть книги, если издателем или автором было выдано соответствующее разрешение. Каждый автор или издатель, участвующий в партнерской программе Google Books, сам определяет процент содержания книги, который будет доступен для просмотра. Если книга не защищена авторским правом, можно будет просмотреть ее полностью.

Такой просмотр книги можно сравнить с походом в книжный магазин: вы перелистываете издание и принимаете решение — покупать книгу или нет. Сервис Google Books позволяет приобрести книги через Интернет. Для этого вам нужно кликнуть ссылку «Получить печатную версию» или «Загрузить книгу» (если текст доступен в формате электронной книги Google).

Недавно Google Books был интегрирован с Google Play: появилась возможность приобретать электронные книги в этом магазине приложений. Однако для нашей страны этот сервис пока недоступен.

Также Google Books предоставляет пользователям возможность завести собственную онлайн библиотеку. Найденные при помощи поиска по книгам издания можно добавлять в библиотеку, распределяя их по полкам: «Мои книги в Google Play», «Избранное», «Читаемые сейчас», «Прочитать», «Прочитанные» (похожее распределение по полкам использует социальная сеть читателей LiveLib).

Еще в вашей библиотеке будут выводиться списки купленных, отрецензированных и недавно просмотренных книг, история просмотров и рекомендуемые для вас книги. Можно создавать собственные полки, а также изменять права доступа как к собственным полкам, так и к предлагаемым по умолчанию, делая их личными или общедоступными. Специально регистрироваться в Google Books для создания библиотеки не нужно — достаточно войти в систему с помощью вашего аккаунта Google.

Важно понимать, что Google Books – это не бесплатная электронная библиотека. Полностью доступны лишь те книги, которые не защищены авторским правом, все остальные придется покупать. Однако при помощи этого сервиса можно кратко ознакомиться с интересующей вас книгой и принять решение о том, стоит ли ее приобретать. Кроме того, библиотека сервиса Google Книги поможет вам упорядочить ваш «читательский опыт».

Google Books (Google Книги)

strana-sovetov.com

Взлет и падение Google Books

Рубрика «Инновации в корпорациях» выходит при поддержке Spinon.

Книги способны творить чудеса. Как однажды сказал Франц Кафка, «книга должна быть топором для замерзшего моря внутри нас».

Это изречение принадлежит Кафке, так ведь? Гугл может подтвердить. Но где и в каких условиях Кафка это сказал? Поиск выводит на веб-сайты с цитатами, но на них полагаться не стоит. Обычно они ошибочно приписывают все цитаты Марку Твену.

Чтобы ответить на этот и подобные вопросы, нужно воспользоваться Google Book Search – инструментом, способным искать текст по миллионам оцифрованных изданий. Нужно только найти маленькую кнопку «еще» в верхней части поисковой выдачи – она идет после вкладок «Картинки», «Видео» и «Новости». Нажмите на эту кнопку и выберите пункт «Книги».

Оказывается, цитата Кафки о «замерзшем море» появилась в «Письмах друзьям, родным и редакторам» Кафки в его послании Оскару Поллаку, датированном 27 января 1904 года.

Фото: Клайв Дарра/Flickr

Google Book Search – потрясающе эффективный инструмент для подобных задач. Когда сервис появился 15 лет назад, эта затея казалась невозможно амбициозной: молодая технологическая компания, которой только недавно удалось охватить и организовать непроходимые информационные джунгли Всемирной паутины, собирается расширить возможности своего поиска в офлайн. Сканируя миллионы печатных книг из библиотек, которые присоединились к проекту, компания могла добавить в свою базу данных всю человеческую историю до появления интернета.

«В книгах содержатся тысячи лет человеческих знаний, причем, возможно, в самом качественном виде из возможных, – сказал сооснователь Google Сергей Брин в интервью журналу The New Yorker в то время. – Не воспользоваться этим – слишком большое упущение».

Сегодня Google знаменита своим подходом к амбициозным проектам, своей готовностью браться за колоссальные задачи в масштабах всего мира. Многие ветераны Google сходятся во мнении, что Books был первым подобным проектом в истории компании: только подумайте, сканировать все книги мира!

На этапе зарождения Google Books должен был дать миру видение «утопической литературы», в которой удобство электронной эпохи сочетается с мудростью печатных книг. В то время эта идея казалась чем-то вроде сингулярности для печатного слова: мы загрузим все книги в эфир, и каким-то образом это приведет к повышению уровня грамотности всех людей на Земле. Однако вместо этого Google Books достигла разве что тихого средневековья, раздавая цитаты и фрагменты текстов из более чем 25 миллионов книг своей базы.

Сотрудники Google говорят, что на большее и не рассчитывали. Возможно, это действительно так. Но можно точно сказать, что они заставили всех остальных надеяться на большее.

На пути от космических обещаний до обыденности с Google Books произошли два события. Вскоре после запуска проект превратился из рая для идеалистов в юридический ад: авторы стали бороться с правом Google индексировать их труды, и издатели также стали защищать свою индустрию от натиска электронных сервисов. За этим последовали юридические тяжбы длиной в десятилетие – все закончилось лишь в прошлом году, когда Верховный суд США отклонил иск Гильдии писателей и окончательно снял все преграды на пути Google к литературным амбициям.

Однако в это время с Google Books произошло еще одно изменение – то, которое знакомо едва ли не каждой организации или группе людей, увязших в долгих юридических тяжбах. Проект потерял былой драйв и амбиции.

Когда я начал работать над этим текстом, я опасался, что проект Books уже не существовал в качестве существенной части Google, что компания его полностью свернула. Вокруг Google Books, как и в случае со многими другими идеями компании, всегда была некая завеса тайны, однако сейчас, когда я стал задавать вопросы, все как будто сквозь землю провалились. Неделями я не мог найти никого, хоть отдаленно способного рассказать о текущем состоянии проекта.

На странице «История» на сайте Google Books рассказ обрывается на 2007 годе, а блог проекта перестал обновляться в 2012 году. С того момента все новости стали выходить в основном блоге «Поиска Google», где информацию о Books найти практически невозможно. Google Books сохранил свою актуальность в качестве работающего и полезного сервиса. Однако как действительно живой проект с собственными планами, анонсами и видимостью работы он словно перестал существовать. Особенно странно все это выглядит, учитывая итоговую победу над противниками в судах.

Фото: imadc/Depositphotos

Несколько бывших сотрудников проекта, с которыми я разговаривал, поделились своими подозрениями по поводу того, что компания перестала сканировать книги. Впоследствии я узнал, что небольшая группа работников все еще работает над поиском по книгам и добавляет новые издания, пусть и с гораздо меньшей интенсивностью, чем на пике работы проекта в 2010-2011 годах.

«Для нас не так важны модные фишки и функции, которые сразу видны пользователям, – рассказывает нынешний глава проекта Стефан Джаскевиц (Stephane Jaskiewicz), который работал в команде около десяти лет. – Мы скорее работаем за кадром и оттачиваем техническую сторону: добавляем новый контент, обрабатываем его так, чтобы можно было просматривать книгу в сети, и отлаживаем алгоритм поиска».

Одна задача всегда была важна для Google Books: совершенствование сканеров, которые добавляют новые книги к «корпусу», как принято называть базу данных. На этапе зарождения проекта, в 2002 году, Ларри Пэйдж и Марисса Майер решили прикинуть, сколько времени займет сканирование всех книг на Земле, и поставили метроном рядом с цифровой камерой на штативе. Как только компания поставила себе цель вывести скорость на эффективный уровень, подробности работы стали тщательным образом скрываться.

Джаскевиц подтверждает, что установки для сканирования продолжают совершенствоваться, и обновления выходят раз в шесть месяцев. Очень помогают технологии светодиодной подсветки, которые были не так распространены на момент запуска проекта. Также полезно изучение более производительных техник перелистывания страниц для операторов установок. «Это очень похоже на игру на гитаре перебором, – рассказывает Джаскевиц. – Мы находим людей, у которых есть свои собственные способы перелистывания – особая постановка большого пальца и прочие подобные приемы».

Однако основная часть работы в Google Books остается повышением «качества поиска» – так, чтобы вы смогли еще быстрее и еще надежнее найти нужную вам цитату Кафки. Это игра, победителям которой не достается всеобщее признание – максимум, награда лучшему игроку запаса.

Чтобы понять, как проект Google Books пришел к этому, нужно знать кое-что об авторских правах, по которым все книги делятся на три категории. Некоторые книги являются общедоступными, то есть с их текстом можно делать все что угодно. В основном, это книги, опубликованные до 1923 года, а также более современные труды, чьи авторы решили отказаться от стандартных авторских прав. Многие из более новых книг до сих пор издаются и попадают под защиту авторских прав: если вы хотите использовать их текст для своих целей, нужно договориться об этом с автором и издателем.

Есть еще третья категория: книги, которые уже вышли из печати, но все еще защищены авторским правом – их неофициально называют «сиротскими работами». Таких изданий достаточно много – «от 17-25% опубликованных работ и около 70% специализированных коллекций», сообщают результаты исследования, проведенного Агентством по защите авторского права США.

Какому количеству книг соответствует эта доля? Сложно сказать, поскольку никто точно не знает, сколько существует книг за Земле в общей сложности. Это число зависит от того, что принято считать «книгой», и определить эти рамки не так-то просто. В 2010 году инженер Google Леонид Тэйчер (Leonid Taycher) в записи в блоге написал, что после анализа метаданных Google Books определил общее число книг (на тот момент) на уровне 130 млн. Другие специалисты назвали это исследование «вздором». Скорее всего, реальное количество книг ниже оценки Тэйчера, но значительно выше тех 25 миллионов, что сейчас содержатся в базе Google Books.

Таким образом, значительная доля от этого огромного числа приходится на «сиротские работы». До недавнего времени они не доставляли особых проблем. Можно было взять такую в библиотеке или найти в книжном магазине без каких-либо проблем. Но стоило Google заявить о своем желании отсканировать эти книги и сделать их доступными в интернете, все заявили свои права на них.

Развернувшиеся после этого юридические прения стали, по сути, битвой за право опеки над этими сиротами. Google, издатели и авторы пытались завладеть правом контролировать процесс перевода этих книг в новый дом в цифровом мире. В итоге три этих стороны пришли к компромиссу, который получил название «Договор о Google Books». По его условиям Google получала возможность полностью разместить книги в интернете без необходимости выплачивать компенсации правообладателям. Однако в 2011 году федеральный судья аннулировал договор под предлогом опасений о том, что частная коммерческая компания навсегда станет регистратором новых книг и сборщиком прибыли со всей мировой литературы.

Как только договор перестал работать, Google снова начала сканировать книги, а издатели погрузились в перспективный рынок электронных книг, который навредил позициям Google в гонке за лидерство благодаря успеху Amazon Kindle. Но Гильдия авторов не отменила свой иск, напирая на то, что дерзкая попытка Google сканировать и индексировать все книги без разрешения правообладателей была незаконной.

Google – богатая компания, но не настолько, чтобы игнорировать угрозу многомиллиардных штрафов за нарушение авторских прав (миллионы книг и тысячи долларов штрафа за каждую). Весь этот процесс длился, пока Верховный суд США не положил ему конец в прошлом году, раз и навсегда закрепив право Google составить каталог книг и показывать краткие выдержки («сниппеты») в поисковой выдаче так же, как это делается для веб-страниц.

Это решение суда стало фундаментальным достижением для будущего онлайн-поиска – для Google и всего мира. «Теперь это официальный прецедент, от которого выиграют все, – рассказывает Эрин Саймон (Erin Simon), нынешний советник по продукту Google Books. – Этот случай будет в учебниках. В первую очередь, важно определить, что именно означает “правомерное использование”». (Также Саймон с улыбкой отметила, что на момент подачи иска от правообладателей она еще даже не приступила к обучению в юридической академии.)

Пусть Гильдия авторов и проиграла суд, ее представители уверены, что боролись за правое дело. Google «пошла не по тому пути с самого начала», считает Джеймс Глейк (James Gleick), президент Гильдии: «Они начали работать, не привлекая к делу творческое сообщество, за счет которого и развивают свой проект. Крупные компании относятся к творческому труду так, будто у них есть “право первой ночи”. Они считают себя хозяевами мира. Вместо этого нужно было просто получить лицензии».

Можно было бы подумать, что победа в Верховном суде означала новый прилив сил в работе над Google Books: запускайте сканеры, полный вперед! Однако все указывает на то, что в данном случае ничего такого не произошло – отчасти потому, что база и так уже было огромна.

«У нас есть фиксированный бюджет на все нужды, – объясняет Джаскевиц. – Сначала мы сканировали все, что попадало в руки. В какой-то момент стало получаться много дубликатов». Сейчас Google стал предоставлять сотрудничающим библиотекам списки самых интересных книг.

Фото: Amy/Flickr

Есть множество других объяснений потери былого энтузиазма Google. Неприятный осадок после судебных тяжб. Взлет перспективных новых идей, которые быстрее себя окупали. И еще: постепенное осознание того, что сканирование всех книг мира, какую бы пользу оно ни принесло, может и не изменить мир так сильно, как этого хотелось.

Для многих библиофилов стремление Google стать всемирной библиотекой не имело смысла: с этой ролью прекрасно справлялись некоторые общественные организации. Как только Google показала, что идея сканирования всемирной литературы вполне осуществима, за ее реализацию взялись и другие. Internet Archive Брюстера Каля (Brewster Kahle), в которой задокументированы этапы развития интернета, уже отсканировала собственную базу. «Цифровая общественная библиотека Америки» выросла из встреч в Центре Беркмана в Гарварде в 2010 году и теперь служит в качестве собрания цифровых коллекций многих библиотек и организаций.

Когда Google договаривалась с университетскими библиотеками о том, чтобы сканировать их коллекции, компания обязалась предоставлять библиотекам копии полученных данных, и в 2008 году общество HathiTrust начала собирать и предлагать эти файлы в пользование. (Ей тоже пришлось защищаться от исков Гильдии авторов.)

В HathiTrust входят 125 организаций и учреждений, которые «уверены, что вместе могут помогать научным исследованиям и культурному обмену лучше, чем по одиночке, или оставив это дело компаниям вроде Google», считает директор общества Майк Ферлоу (Mike Furlough). Кроме того, есть еще и Библиотека Конгресса, новый руководитель которой – Карла Хэйден (Carla Hayden) – взялась за то, чтобы оцифровать свои коллекции и выложить их в открытый доступ.

Каждая из этих организаций в каком-то смысле является конкурентом Google Books. Однако в реальности Google ушла настолько далеко вперед, что вряд ли хоть одна из них сможет соперничать с компанией на равных.

Многие эксперты сходятся во мнении, что Google потребовалось несколько сотен миллионов долларов на создание Google Books, и ни одна другая организация не пойдет на такие расходы, чтобы получить альтернативу.

Однако у некоммерческих организаций есть преимущество, которого нет у Google: они неподвластны переменам приоритетов, которые могут произойти с гигантской корпорацией. Все их внимание сосредоточено на книгах, и им не приходится распылять свое внимание на управление одним из крупнейших рекламных бизнесов в мире или операционной системой для смартфонов. В отличие от Google, некоммерческим организациям всегда будет интересно искать новые способы связывать читателей с книгами, которые помогут, как сказал бы Кафка, растопить замерзший разум.

Не раз в истории нескончаемые судебные процессы превращались в мощные водовороты, которые затягивали и топили всех участников дела. (В литературе это наиболее ярко показал Диккенс в «Холодном доме»: растянувшееся на несколько поколений дело «Джарндис против Джарндиса» привело к тому, что все стоящие на кону активы ушли на оплату судебных расходов.)

В мире высоких технологий такие дела, как знаменитый иск о нарушении антитрестового законодательства, преследовавший IBM долгие годы, могут вставать на пути корпораций и давать конкурентам шанс заполнить освободившуюся нишу. Сама Google достигла лидерства в области онлайн-поиска, пока Microsoft отбивалась от атак Министерства юстиции.

Однако эта «битва за книги» никогда не была для Google чем-то принципиальным, на что бросались все доступные ресурсы. Да и вообще, тратой ресурсов это не назовешь. Этот конфликт дал Google ценный урок.

Как отметил Джеймс Глейк из Гильдии авторов, Google запускала проект Books с позиции «лучше извиняться потом, чем сейчас просить разрешения», которая распространена в сегодняшнем мире стартапов. В каком-то смысле корпорация повела себя как Uber в мире интеллектуальной собственности, став сервисом для совместного чтения и ожидая, что весь мир станет видеть в Google то же, что она видела в себе – орден добрых волшебников, служащих всему человечеству. Это был наивный взгляд на мир, и последовавший вскоре жесткий отпор стал для компании шоком.

К счастью, Google вынесла из этого опыта урок, который оказался невероятно полезен стремительно растущей компании: технологии – это хорошо, но они не могут решить всех проблем. Иногда нужно заниматься политикой: общаться с заинтересованными сторонами, искать союзников, находить компромисс с оппонентами.

В результате этого Google собрала команду лоббистов и юристов, которые помогли компании выйти из других сложных ситуаций – например, путаницы с авторскими правами в YouTube – с гораздо лучшим результатом и меньшими потерями. Компания выросла, стала взрослее. Она осознала, что стремиться в космос можно всегда, но не всегда удается туда попасть.

Возможно, что когда-нибудь Google предпримет еще одну попытку решить проблему сиротских работ. Однако сейчас, похоже, компания ждет, пока ее примеру последуют другие. «Не думаю, что мы можем что-то изменить при нынешней правовой базе», – отмечает Джаскевиц.

Пока я работал над статьей, я не мог перестать думать о книге, которую прочитал несколько лет назад. Это был эксцентричный, до занудства внимательный к деталям роман «Круглосуточный книжный мистера Пенумбры» (Mr. Penumbra’s 24-Hour Bookstore) Робина Слоуна (Robin Sloan). В ней рассказывается о тайном обществе, которое пытается разгадать вековую загадку, связанную с книгопечатанием и типографией. Google играет в романе критически важную роль, пока главный герой работает над поиском разгадки. Оказывается, что даже необъятной информационной базы компании недостаточно, чтобы все получилось. Затем протагонист находит одну книгу, которая помогает разрешить загадку. Все, что было нужно – и этой фразой Слоун заканчивает свое произведение – «нужная книга в нужное время».

Роман напоминает, что возможности инженерной мысли Google не безграничны. Разделение задач на простые этапы, представление их в виде данных и применение эффективных методик – это хороший способ работать. Так вы сможете серьезно продвинуться в деле создания «библиотеки утопии», но не сможете преуспеть.

Но даже если и сможете, жизнь не превратится в утопию. Вас все еще будет ждать тяжелая работа. Ведь превратив книгу в данные, вы упрощаете процесс поиска цитат и сниппетов, но никак не изменяете процесс чтения книги – этот неповторимый способ временного перемещения опыта одного человека в разум другого.

До сих пор для полноценного чтения книги требуется участие человека с обоих сторон. Индексная система вроде Google Books помогает нам находить и анализировать текст, но пока что использование этих фрагментов остается нашей заботой. Возможно, стремлению оцифровать все книги было предначертано обернуться разочарованием и не преобразить жизнь людей.

Как и многие другие продвинутые в техническом плане библиофилы, Слоун активно использует Google Books, однако его расстраивает то, что сервис перестал развиваться и поражать воображение. «Я бы хотел, чтобы Google Books был красивым и полезным сервисом, который бы развивался и постоянно становился еще интереснее», – мечтает он. Кроме того, Слоуна волнует еще один вопрос: ясно, что Google по закону не может сделать полные тексты книг доступными для всех желающих – но что если дать прочитать их машинам?

Сегодня инструменты машинного обучения, способные анализировать тексты разными способами, развиваются очень быстро. Слоун отмечает, что «культура вокруг этой индустрии во многом напоминает то, что происходило в “Домашнем компьютерном клубе” и первых интернет-компаниях». Однако для продвижения в исследованиях ученым нужно снабжать свои программы огромным количеством данных.

«Если бы Google могла взять этот корпус данных, разделить его по жанрам, темам, временным промежуткам и всем остальным возможным категориям и затем предоставить доступ к базе инженерам и энтузиастам машинного обучения, из этого могло бы получиться что-то интересное – сейчас даже невозможно сказать, что», – объясняет Слоун. Он предположил, что Google уже делает это внутри компании. Джаскевиц и другие специалисты Google комментировать эти догадки отказались.

Возможно, когда очередная нейросеть из будущего получит сознание и почувствует присущий Кафке экзистенциальный кризис, она сможет найти утешение в правильной книге, которая поможет растопить лед. Или, в отличие от нас эта сеть сможет прочитать все отсканированные нами книги – действительно прочитать, как это и нужно делать. Что бы она тогда сделала?

Источник

Материалы по теме:

Квиз дня: что вы знаете о Google?

Наконец-то, в Кремниевой долине нашлась работа и для гуманитариев

Как прочитать полезную книгу за 90 минут

Barnes & Noble против Amazon. Как традиционные книжные могут выиграть у интернет-магазинов

Фото на обложке: Сэнди ван Хелден (Sandy van Helden)

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

rb.ru

Google Книги — WiKi

В октябре 2004 года на книжной выставке во Франкфурте Google представила сервис Google Print. 17 ноября 2005 года его название было изменено на Google Book Search. Этот сервис выполняет полнотекстовый поиск по книгам, которые Google сканирует и сохраняет в своей цифровой базе данных. В декабре того же года компания Google заключила соглашение с пятью крупнейшими библиотеками США и Великобритании о начале оцифровки их библиотечных фондов.

По состоянию на 2008 год, партнёрами проекта стал ряд европейских библиотек и некоторое количество издательств.

На 2010 год в рамках проекта было доступно около 15 миллионов книг, около 1 миллиона из них — находящихся в общественном достоянии. Сотрудники проекта оценили количество существующих в мире книг (без учёта переизданий) в 130 миллионов[1] и намеревались оцифровать все к концу десятилетия.

С мая 2011 года поиск по книгам перестал быть полнотекстовым. Если раньше в книге категории «Ограниченный просмотр» можно было находить цитаты со страниц, не включённых в общий просмотр, то теперь этих страниц в книге как бы не существует, и определить, действительно ли есть такая цитата в данном произведении, стало не всегда возможно.

Всего было оцифровано около 25 миллионов книг, после чего темпы оцифровки очень сильно уменьшились[2].

Проект по сканированию книг (в том числе защищённых авторским правом) вызывал нарекания со стороны объединений авторов и отдельных лиц, полагавших, что реализация проекта приведёт к установлению монополии Google в данной сфере и нарушению авторских прав; в частности, американская Гильдия авторов предъявила к Google Inc коллективный иск почти на 3 млрд долларов в качестве компенсации за нарушение авторских прав этим проектом[3].

В 2011 году стороны совместно предложили мировое соглашение, в рамках которого Google смогла бы не только показывать фрагменты текста, в которых были найдены ключевые слова по запросу пользователя (что было изначальным предметом иска), но и предоставлять пользователям платный доступ к полным текстам любых книг, которые больше не издаются. При этом не требовалось бы заключение отдельного соглашения с правообладателем, которого во многих случаях трудно даже установить, а бо́льшая часть вырученных средств поступала бы в специальный фонд, распределявший деньги среди правообладателей. Однако министерство юстиции США объявило, что такое соглашение выходит за рамки юридических актов, которые могут быть приняты в рамках коллективного иска, а также выразило опасения, что соглашение сделает Google монополистом в области торговли книгами, которые больше не издаются. Соглашение было отклонено судом[2].

14 ноября 2013 г. окружной судья Нью-Йорка Денни Чин отклонил иск, указав в решении, в частности, что использование Google сканированных книг сродни такому использованию библиотеками, и поскольку библиотеки, используя сканы книг, не несут ответственности за нарушение авторских прав, постольку и Google не может привлекаться к такой ответственности[4].

ru-wiki.org

Поиск книг Google

О Поиске книг Google• Общая информация• Мысли и мнения• Справка по общим вопросам

Партнерская программа• Издателям и авторам• Присоединяйтесь• Справка по партнерской программе

Библиотечный проект• Общая информация• Библиотеки-партнеры• Справка по библиотечному проекту

О Поиске книг Google

Обзор | История | Мифы и реальность

История Поиска книг Google

В начале был Поиск книг Google.

Ну... не совсем. Однако бесспорно то, что проект появился почти тогда же, когда и компания Google. В 1996 году создатели Google Сергей Брин и Ларри Пейдж заканчивали обучение по специальности "Информатика" и работали над исследовательским проектом под эгидой проекта оцифровки библиотеки Стэнфордского университета. Целью проекта было создание действующих цифровых библиотек, а идея заключалась вот в чем: в будущем, когда будут оцифрованы огромные количества книг, люди смогут использовать интернет-поиск по содержанию книг и анализировать связи между ними, находя соответствия и отслеживая количество и вид цитат из других книг.

"Поисковик", который они в итоге начинали разрабатывать, назывался BackRub и представлял собой усовершенствованный вариант привычного анализа цитирования. Он-то и вдохновил их на создание алгоритмов Google PageRank – основной технологии поиска, которая делает Google тем, что он есть сейчас.

Уже тогда воображение Ларри и Сергея рисовало им, как люди, живущие в любой точке планеты, смогут найти нужную им книгу среди всех книг мира. Однако они и представить не могли, что в один прекрасный день запустят проект, который воплотит эту мечту в жизнь. Вот краткий обзор основных вех этой истории:

[2002]

Небольшая группа сотрудников Google официально запускает секретный "книжный" проект. Они обсуждают с экспертами свои задачи, начиная с простого, но серьезного вопроса: сколько нужно времени, чтобы оцифровать все книги на свете? Как ни странно, оказалось, что никто этого не знает. Ларри Пейдж, как и положено в Google, решил проверить все сам. Однажды в офисе он и Марисса Майер, одна из наших первых менеджеров продукта, взяли метроном, чтобы он задавал ритм, и принялись методично перелистывать 300-страничный том. До конца они дошли за 40 минут.

Заинтересовавшись необычными проектами оцифровки во всем мире – например, проектом Библиотеки Конгресса США "Память Америки", Проектом "Гутенберг", Проектом "Миллион книг" и проектом Universal Library – команда стала посещать эти проекты, чтобы больше узнать о том, как они работают.

Для сбора материалов Ларри Пейдж отправился в Мичиганский университет, свою альма-матер и создателя первых цифровых библиотек, включая JSTOR и Making of America. Узнав, что расчетное время сканирования семи миллионов книг университетской библиотеки – тысяча лет, он пообещал ректору университета Мэри Сью Коулман, что Google может справится с задачей за шесть лет.

[2003]

Участник команды отправился на благотворительную книжную ярмарку в Фениксе, штат Аризона, чтобы купить книги для проверки технологий сканирования, не причиняющих книгам вреда. После множества экспериментов команда нашла способ сканирования, который причиняет намного меньше вреда, чем обычные высокоскоростные процессы. Команда была очень рада этому – но еще больше обрадовались книги.

В то же время программисты команды достигли определенного прогресса в решении сложных технических задач, связанных с обработкой информации из книг, изданных в нестандартном формате, напечатанных необычным шрифтом или с другими особенностями – для 430 языков.

[2004]

Библиотека Бодли, основанная сэром Томасом Бодли в 1602 г. в Оксфорде, всегда стремилась служить не только университетскому сообществу, но и всему миру. В этой прославленной библиотеке команду встретил ошеломляюще теплый прием.

Во время экскурсии по книгохранилищам библиотекари показали старинные "неразрезанные" книги, которые редко достают из хранилищ. Впервые со времен Шекспира мечта о том, чтобы значительно расширить круг знатоков словесности, имеющих доступ к этим книгам, близка к осуществлению.

Визит воодушевил обе стороны, а дальнейшие встречи и дискуссии привели к официальному сотрудничеству с целью оцифровки в последующие три года невероятной коллекции, состоящей из более чем миллиона книг XIX века, находящихся в общественном достоянии.

Тем временем начали приносить плоды предварительные переговоры с некоторыми из крупнейших мировых издательств. В октябре на Франкфуртской книжной ярмарке в Германии Ларри и Сергей объявили о создании программы "Google Print". Первыми к программе присоединились следующие издательства: Blackwell, Cambridge University Press, University of Chicago Press, Houghton Mifflin, Hyperion, McGraw-Hill, Oxford University Press, Pearson, Penguin, Perseus, Princeton University Press, Springer, Taylor & Francis, Thomson Delmar и Warner Books.

В декабре мы объявили о начале работы библиотечного проекта "Google Print", ставшего возможным благодаря сотрудничеству с Гарвардом, Мичиганским университетом, Нью-Йоркской публичной библиотекой, Оксфордом и Стэнфордом. В общей сложности коллекции этих огромных библиотек составляют более 15 миллионов книг.

[2005]

Через год после запуска "Google Print" команда вернулась на Франкфуртскую книжную ярмарку, чтобы объявить, что теперь "Google Print" принимает партнеров из восьми европейских стран: Австрии, Бельгии, Франции, Германии, Италии, Нидерландов, Испании и Швейцарии.

Наша цель – систематизировать мировую информацию и сделать ее доступной и полезной. Поэтому мы пожертвовали 3 миллиона долларов Библиотеке Конгресса, чтобы помочь в создании Мировой цифровой библиотеки, которая обеспечит интерактивный доступ к редким и уникальным книгам во всем мире. Мы также дополнили пилотную программу сканирования Библиотекой, в которую вошли оцифрованные работы из юридического отдела Библиотеки Конгресса, представляющие историческую ценность.

Компания Google переименовала "Google Print" в Поиск книг Google – это более точно отражало цель, с которой люди пользуются программой. Также команда ответила на возражения против Библиотечного проекта в рамках публичного обсуждения его основополагающих принципов.

[2006]

В проникновенной речи в Ассоциации американских издателей (AAP) ректор Мичиганского университета Мэри Сью Коулман рассказала, почему университет стал нашим партнером в Библиотечном проекте, подчеркнув важность оцифровки книг с учетом природных катастроф вроде урагана "Катрина" и добавив: "Мы всегда в это верили".

В марте мы посетили Лондонскую книжную ярмарку, на которой некоторые из наших партнеров-издателей поделились накопленным опытом.

Вскоре после этого мы спросили партнеров, хотят ли они продавать читателям полный доступ к своим книгам в Интернете – прямо через браузер. Эта новая функция стала первой из множества созданных в тесном сотрудничестве с издательствами, чтобы помочь им испробовать современные методы продажи книг в Интернете.

Летом мы помогли театральному проекту Shakespeare in the Park отпраздновать пятидесятилетие тремя спектаклями в Нью-Йоркском Центральном парке, создав место, где можно найти полные тексты пьес великого барда в Интернете. В то же время мы посетили выставку Book Expo America и дали издателям и авторам США представление о том, что увидят пользователи, присоединившись к Партнерской программе Google Книги.Мы выпустили серию усовершенствований, чтобы сделать Поиск книг более полезным и удобным в использовании. Прежде всего мы расширили возможность доступа к отсканированным книгам, находящимся в свободном доступе, добавив кнопку Загрузить PDF ко всем книгам, не защищенным авторским правом. Несколько месяцев спустя мы создали новый интерфейс, который упростил обзор и навигацию по Поиску книг. Новый интерфейс сопровождался новыми страницами Об этой книге, которые используют алгоритмы Google для получения подробной информации о книге: для начала – похожих книг, избранных страниц и цитат из научных работ. 

Осенью к Библиотечному проекту присоединились еще четыре библиотеки: библиотеки Калифорнийского университета, Мадридского университета "Комплютенс", университета Висконсина (Мэдисон) и университета Виргинии.

[2007]Мы взяли новый интерфейс за отправную точку и стали разрабатывать новые способы взаимодействия людей и книг.

  • Места, упомянутые в этой книге: Мэшап с Картами позволил пользователям совершать виртуальное путешествие по местам, упомянутых в тексте (чуть позже мы добавили экспериментальный слой KML для службы Google Планета Земля, который делает обратное: пользователь выбирает место, а мы находим связанные с ним книги).
  • Популярные отрывки: Мы создали новый способ перемещения между книгами, который отслеживает использование одного отрывка в нескольких книгах.
  • Моя библиотека: Мы дали пользователям возможность использовать поисковые возможности Google для поиска по их собственным собраниям книг. Пользователи начали делиться своими личными библиотеками, отзывами и оценками друг с друг

books.google.az

Google Books - это... Что такое Google Books?

URL: Тип сайта: Владелец: Начало работы:
Google Books

http://books.google.com/

Онлайн-библиотека

Google

2005

Google Books («Google Книги») — сервис полнотекстового поиска по книгам, оцифрованным компанией Google (свыше 10 миллионов книг из крупнейших библиотек США).

В октябре 2004 года, на книжной выставке во Франкфурте, Google представила сервис Google Print. 17 ноября 2005 года его название было изменено на Google Book Search. Этот сервис выполняет полнотекстовый поиск по книгам, которые Google сканирует и сохраняет в своей цифровой базе данных. В декабре того же года компания Google заключила соглашение с пятью крупнейшими библиотеками США и Великобритании о начале оцифровки их библиотечных фондов.

По состоянию на 2008 год партнёрами проекта стали ряд европейских библиотек и некоторое количество издательств.

С мая 2011 года поиск по книгам перестал быть полнотекстовым.

Если раньше в книге категории «Ограниченный просмотр» можно было находить цитаты со страниц, не включенных в общий просмотр, то теперь этих страниц в книге как бы не существует и определить, действительно ли есть такая цитата в данном произведении стало не всегда возможно.

На 2010 год, в рамках проекта было доступно около 15 миллионов книг, около 1 миллиона из них — находящихся в общественном достоянии. Сотрудники проекта оценили количество существующих в мире книг (без учета переизданий) в 130 миллионов и намереваются оцифровать все к концу десятилетия.

См. также

Ссылки

В этой статье не хватает ссылок на источники информации. Информация должна быть проверяема, иначе она может быть поставлена под сомнение и удалена. Вы можете отредактировать эту статью, добавив ссылки на авторитетные источники. Эта отметка установлена 12 сентября 2011.

biograf.academic.ru

Google Книги — Википедия РУ

В октябре 2004 года на книжной выставке во Франкфурте Google представила сервис Google Print. 17 ноября 2005 года его название было изменено на Google Book Search. Этот сервис выполняет полнотекстовый поиск по книгам, которые Google сканирует и сохраняет в своей цифровой базе данных. В декабре того же года компания Google заключила соглашение с пятью крупнейшими библиотеками США и Великобритании о начале оцифровки их библиотечных фондов.

По состоянию на 2008 год, партнёрами проекта стал ряд европейских библиотек и некоторое количество издательств.

На 2010 год в рамках проекта было доступно около 15 миллионов книг, около 1 миллиона из них — находящихся в общественном достоянии. Сотрудники проекта оценили количество существующих в мире книг (без учёта переизданий) в 130 миллионов[1] и намеревались оцифровать все к концу десятилетия.

С мая 2011 года поиск по книгам перестал быть полнотекстовым. Если раньше в книге категории «Ограниченный просмотр» можно было находить цитаты со страниц, не включённых в общий просмотр, то теперь этих страниц в книге как бы не существует, и определить, действительно ли есть такая цитата в данном произведении, стало не всегда возможно.

Всего было оцифровано около 25 миллионов книг, после чего темпы оцифровки очень сильно уменьшились[2].

Проект по сканированию книг (в том числе защищённых авторским правом) вызывал нарекания со стороны объединений авторов и отдельных лиц, полагавших, что реализация проекта приведёт к установлению монополии Google в данной сфере и нарушению авторских прав; в частности, американская Гильдия авторов предъявила к Google Inc коллективный иск почти на 3 млрд долларов в качестве компенсации за нарушение авторских прав этим проектом[3].

В 2011 году стороны совместно предложили мировое соглашение, в рамках которого Google смогла бы не только показывать фрагменты текста, в которых были найдены ключевые слова по запросу пользователя (что было изначальным предметом иска), но и предоставлять пользователям платный доступ к полным текстам любых книг, которые больше не издаются. При этом не требовалось бы заключение отдельного соглашения с правообладателем, которого во многих случаях трудно даже установить, а бо́льшая часть вырученных средств поступала бы в специальный фонд, распределявший деньги среди правообладателей. Однако министерство юстиции США объявило, что такое соглашение выходит за рамки юридических актов, которые могут быть приняты в рамках коллективного иска, а также выразило опасения, что соглашение сделает Google монополистом в области торговли книгами, которые больше не издаются. Соглашение было отклонено судом[2].

14 ноября 2013 г. окружной судья Нью-Йорка Денни Чин отклонил иск, указав в решении, в частности, что использование Google сканированных книг сродни такому использованию библиотеками, и поскольку библиотеки, используя сканы книг, не несут ответственности за нарушение авторских прав, постольку и Google не может привлекаться к такой ответственности[4].

http-wikipediya.ru