Блог, посвященный е-книгам

  •  
  • Главная
  • Обеспечение доступности научных изданий в Сети

Обеспечение доступности научных изданий в Сети

Опубликовано 27 мая 2010

Эта тема уже поднималась в блоге.  Михаил Рогов активно комментировал и я попросил его описать то, что он знает на своём опыте. Сейчас, с глубокой благодарностью, публикую присланный материал:

Электронные библиотеки и обеспечение доступности научных изданий в сети Интернет (взгляд палеонтолога)

Михаил Рогов, ГИН РАН, http://jurassic.ru

Введение

В последнее время в Интернете весьма активно обсуждаются проблемы, связанные с доступом к электронным версиям книг и журналов, электронными библиотеками и возможностью оцифровки книг в обычных библиотеках, а также весьма непростым взаимодействием всех этих проблем с действующим законодательством. Однако в большинстве обзоров речь идет, за редким исключением, о художественных и, в меньшей степени, образовательных изданиях. Реже рассматриваются особенности, связанные с распространением электронных версий научных журналов, тогда как проблемы доступности научных книг, насколько мне известно, практически нигде не обсуждались.

К сожалению, правовые нормы закона об авторских правах, тон которым задают США, адаптированы почти исключительно к защите коммерческих интересов крупных компаний-производителей аудио- и видеопродукции, в меньшей степени художественной литературы, издающейся огромными тиражами. Однако научные публикации имеют ряд специфических особенностей, резко отличающих их от остальных печатных материалов. Как правило, они издаются небольшими тиражами, в большинстве случаев не переиздаются (особенно это касается журнальных статей, которые могут быть переизданы только в «Избранных трудах» весьма немногочисленных известных ученых), и их издание для авторов не подразумевает коммерческой выгоды (в случае с изданием книг – наоборот, как правило, идет к весьма значительным затратам). При этом широкий доступ к электронным версиям научных публикаций является важнейшим стимулом к развитию дальнейших научных исследований, чем выгоден как научному сообществу, так и государству. Несмотря,  на это, на научную литературу распространяются те же самые ограничения, что и на художественные произведения – в Европе они не попадают в открытый доступ, пока не пройдёт 70 лет со смерти автора, в США подобные ограничения касаются всех книг, изданных после 1923 года.

Впрочем, это не значит, что научные публикации недоступны в электронном виде. Ниже на примере из той области науки, к которой я имею непосредственное отношение – палеонтологии – я постараюсь продемонстрировать текущее состояние рассматриваемого вопроса, существующие проблемы и возможные пути их решения. Палеонтология, как представляется, является удачным примером ещё и потому, что палеонтологам (также как систематикам-зоологам и ботаникам) в своей работе постоянно необходимо обращаться к изданиям, в которых присутствуют первоначальные описания тех или иных организмов вне зависимости от времени публикации последних. Соответственно, если для представителей большинства других научных дисциплин (кроме исторических) доступ к публикациям XVIII – начала ХХ века не представляет почти никакого интереса, то для палеонтологов возможность обращаться к таким публикациям – каждодневная необходимость. Представительность в Интернете периодических и непериодических научных изданий резко различается, поэтому они рассматриваются отдельно.

И напоследок, прежде чем перейти к сути статьи, остановлюсь на используемых форматах электронных научных публикаций. Практически во всех рассмотренных ниже случаях речь идет о формате pdf. В .htm и .doc представлено крайне незначительное число публикаций, формат .djvu наиболее распространен или в случае оцифрованных российскими энтузиастами книг или как один из возможных вариантов для публикаций, размещенных на портале http://archive.org.

Периодические издания (журналы и в меньшей степени труды научных обществ и организаций)

Подавляющее число ведущих издателей научных периодических изданий в настоящее время предоставляют (сами или через дистрибьютора) платный либо бесплатный доступ к электронным версиям публикаций. Лишь немногие крупные и известные в научном мире издательства по старинке распространяют в основном бумажные версии журналов. Таково, например, одно известное немецкое издательство с почти 200-летней историей (Schweizerbart): всего несколько журналов этого издательства имеют электронные версии, доступные по подписке через сайт http://ingentaconnect.com).

Как правило, текущие выпуски большинства периодических изданий доступны по подписке научным и учебным организациям (таким, как институты Российской Академии Наук, крупные университеты) на сайтах издателей (http://sciencedirect.com, http://springerlink.com, http://www3.interscience.wiley.com) или порталах, специализирующиеся на организации доступа к электронным публикациям (http://ingentaconnect.com, http://bioone.org, http://geoscienceworld.org и др.). Обычно (но не всегда) статьи из таких изданий доступны и индивидуальным пользователям, но их цена по сравнению со стоимостью подписки для организации на пакет журналов весьма и весьма велика (как правило, $30-40 за статью). Значительное число научных журналов (приблизительно 1/5 от имеющихся в Интернете)  находится в открытом доступе. Достаточно полные подборки ссылок на сайты таких изданий можно посмотреть здесь: http://rzblx1.uni-regensburg.de/ezeit/, http://www.openj-gate.com, http://www.doaj.org; крупнейшая в мире подборка ссылок на такие издания по геологии, биологии и смежным дисциплинам доступна по адресу http://jurassic.ru/links.htm. При это часть таких  журналов, включая некоторые чисто электронные издания, не издающиеся в бумажном виде,относятся к весьма престижным (например, журналы, издающиеся Public Library of Science, http://www.plos.org/, имеют импакт-фактор от 4,1 до 12,6). Имеющиеся тенденции при этом противоречивы. С одной стороны, регулярно появляются всё новые издания, предоставляющие возможность для пользователей скачивать свои публикации бесплатно. С другой стороны, до самого недавнего времени статьи из ряда китайских и корейских англоязычных журналов (Science in China; Chinese Science Bulletin, Geoscience Journal,  и др.), доступных только по подписке (или за деньги) на сайтах их западных партнеров можно было скачать бесплатно с сайтов издателей. В начале 2010 года, судя по всему, вступили в действие новые соглашения между этими издателями и их европейскими партнерами, и теперь перечисленные выше издания в бесплатном доступе отсутствуют.  Кроме того, в ряде случаев издатель оцифровывает старые выпуски журналов, доступ к которым может осуществляться как бесплатно, так и за деньги. Особняком стоит проект JSTOR (http://jstor.org), через который организации могут получить подписку на пакет выпусков журналов начиная с самых первых выпусков (начало-середина XIX века). Подписка для организаций на коллекции JSTOR недорога и по российским меркам – на подборку из нескольких десятков, а то и сотен журналов годовой доступ для института РАН составляет около $2000.

Кроме издателей оцифровкой и предоставлением доступа (в большинстве случаев бесплатного) к периодике занимаются крупные национальные консорциумы. Среди наиболее крупных проектов такого рода можно назвать портал японского Национального института информатики (http://ci.nii.ac.jp/), портал Хорватских периодических изданий (http://hrcak.srce.hr/) и портал «Наукова періодика України» (http://www.nbuv.gov.ua/portal/). Крупный проект такого рода – http://elibrary.ru – имеется и в России. В настоящее время через elibrary.ru открыт бесплатный доступ к более чем 700 периодическим российским изданиям, однако многие издания (особенно высокорейтинговые) доступны только по подписке, которая для организаций лишь в несколько раз больше стоимости годовой подписки на бумажные версии журналов. Некоторые статьи возможно приобрести отдельно, хотя механизм оплаты пока нельзя назвать удачным (по смс или через банк), и при наличии сканера и библиотеки под боком отсканировать выходит заметно дешевле. К сожалению, англоязычный интерфейс у сайта отсутствует, а поскольку доступ к контенту возможен только для зарегистрированных пользователей, даже находящиеся в открытом доступе pdf’ы не индексируются поисковиками и фактически закрыты для зарубежных исследователей, что существенно понижает цитируемость российских статей за рубежом.

Ученые тоже не сидят сложа руки. Во-первых, довольно широко распространено размещение препринтов на сайтах исследовательских организаций или межорганизационных порталов вроде http://arxiv.org/ (список подобных репозитариев см. здесь: http://roar.eprints.org). Минусом подобных хранилищ является невозможность точного цитирования работ с указанием страниц и нередко плохое качество иллюстраций в присылаемых издательствами корректурах. Во-вторых, несмотря на то, что большинство крупных издателей, предоставляющих платный доступ к статьям, в договорах с авторами запрещают размещать финальные версии статей в Интернете, реально научные статьи такого рода многими десятками размещаются на сайтах лабораторий, институтов, исследовательских групп и т.д. Это связано как с тем, что в некоторых случаях по условиям гранта результаты исследований должны быть размещены в открытом доступе, так и с тем, что издатели получают прибыль в основном с подписки организаций на пакеты из сотен и тысяч журналов и особого смысла в том, чтобы гоняться за единичными статьями, для них нет. Даже в том случае, когда издатели предъявляют претензии владельцам сайтов, как правило, эти претензии не имеют материального характера. Показательным примером здесь может служить крупный сайт по головоногим моллюскам CephBase.org (из-за отсутствия финансовой поддержки в настоящее время почти прекративший своё существование). На этом сайте было, среди прочего, выложено несколько тысяч статей по головоногим моллюскам, в основном присланные авторами. За всё время активного развития сайта (1998-2006 гг.) к его создателям лишь однажды обратились правообладатели с просьбой убрать одну из статей. Статья была убрана из базы, и вопросов больше не возникало. За почти пятилетнюю историю существования крупной электронной библиотеки по геологии на базе сайта Jurassic.ru претензий со стороны правообладателей также зафиксировано не было.

Кроме того, статьи (в том числе из закрытых источников) размещаются пользователями на порталах вроде http://www.scribd.com. Среди исследователей из России и ближнего зарубежья, у которых возможности покупки статей или их получения по подписке ограничены, распространено обращение за помощью к коллегам (чаще всего – бывшим нашим соотечественникам, постоянно или временно пребывающим в Западной Европе или США в научно-образовательных учреждениях) через специализированные  форумы и сообщества в Живом Журнале.

Следует заметить, что размещение изданий в открытом доступе выгодно как издателям (несмотря на некоторые материальные потери, это увеличивает цитируемость статей, ведет к притоку новых рукописей и как следствие – к возможности выбора наиболее интересных работ и повышению рейтинга издания), так и авторам. Некоторые издатели предлагают авторам возможность за плату предоставить открытый доступ к своей статье на сайте издателя – и авторы на это идут, ведь при рассмотрении заявок на грант может учитываться и цитируемость предыдущих публикаций. Впрочем, к российским авторам это в основном не относится – отечественные организации-грантодатели цитируемость публикаций учитывают очень редко.

Иная ситуация с периодическими изданиями XIX и начала ХХ века. Они в большом  количестве оцифровываются и размещаются в открытом доступе в рамках крупных проектов по оцифровке как периодических, так и непериодических изданий, таких кА http://books.google.com или конкурирующего с ним http://archive.org. Следует отметить, что доступ к публикациям, размещенным на GoogleBooks, различается в зависимости от IP посетителей – для американских пользователей доступно в несколько раз больше книг и журналов. Впрочем, часть книг и журналов с GoogleBooks, открытых только для посетителей из США, благодаря активности пользователей размещено сейчас в открытом доступе на портале archive.org (кроме оцифрованных организациями изданий публикации здесь также могут размещаться зарегистрированными пользователями). Стоит также отметить сайт Национальной библиотеки Франции (http://gallica.bnf.fr), благодаря которому есть возможность ознакомиться более чем с миллионом французских книг и периодики. Следует заметить, что по договору с правообладателями на таких сайтах также в ряде случаев размещаются и достаточно свежие выпуски периодических изданий, но пока это скорее исключение, чем правило. К сожалению, нам здесь похвастаться совершенно нечем. Небольшое количество российских периодических изданий XIX-начала ХХ века имеются в коллекциях всё тех же http://books.google.com и http://archive.org, но ни одного сколько-нибудь крупного отечественного проекта по оцифровке и размещению в Интернете старой научной периодики в настоящее время не существует.

Диссертации

Ситуация с электронными версиями диссертаций в России принципиально отличается от таковой за рубежом. У нас электронные версии диссертаций, доступные для ознакомления (но не скачивания) через сайты Российской государственной библиотеки и её филиалов, тем не менее, обычно их легко можно купить через многочисленные сайты. Диссертации, в отличие от авторефератов, в открытом доступе у нас практически отсутствуют. За рубежом, напротив, с крупных национальных или университетских порталов легко можно скачать как относительно свежие диссертации (предоставленные авторами уже в виде pdf), так и работы более старые (отсканированные).

Книги

Как и в случае с диссертациями, представительность и доступность в электронной форме непериодических изданий (книг) в России и за рубежом сильно различается. Если не принимать во внимание старые книги, оцифрованные в рамках уже упоминавшихся проектов вроде http://books.google.com и http://archive.org, то зарубежные книги  в основном оцифровываются и размещаются в Интернете издателями и, как правило, доступны только по подписке или за деньги. В большинстве случаев это – совсем свежие издания, полученные конвертированием электронного макета в файл PDF; лишь недавно крупные издатели начали оцифровку серий книг 70х-90х годов («докомпьютерной эпохи»). Пользователи, в свою очередь, во множестве загружают такие книги на файлообменники, размещая сведения о книгах и ссылки для их скачивания на сайтах вроде http://gigapedia.com. Отдельно стоит упомянуть о тех книгах, которые доступны для частичного просмотра через http://books.google.com – как и следовало предполагать, нашлись умельцы, придумывавшие софт, позволяющий ограничения гугла обходить. Для работ, полностью открытых для просмотра, но закрытых от копирования, наиболее удачным представляется использование соответствующих скриптов для Firefox, а для частично открытых для просмотра книг – программы GoogleBookDownloader, которую необходимо регулярно снабжать свежими списками прокси-серверов.

В России издатели не продают электронные версии своих научных книг и не размещают их в открытом доступе – последнее скорее делают институты, в которых работают авторы, но пока и эта практика крайне мало распространена. Зато число книг, которые оцифровываются и размещаются в Интернете энтузиастами, в России и странах бывшего СССР весьма велико. Большинство таких книг (в основном – изданных во второй половине ХХ века – начале XXI века справочников и работ общего или образовательного плана) размещаются на файлообменниках, ну а ссылки на такие работы молниеносно расползаются по многочисленным сайтам. Эти книги почти во всех случаях представлены в формате .djvu (как наиболее компактном и при этом сохраняющем идентичность с оригиналом), и за редчайшим исключением лишены текстового слоя. Проектов по оцифровке старой литературы практически нет – некоторое количество книг имеется на сайте проекта «Научное наследие РАН» (http://nasledie.enip.ras.ru), но таких централизованных проектов совсем немного и количество имеющихся там книг невелико (в большинстве любительских русскоязычных библиотек книг заметно больше). При этом большие по объёму книги, как правило, напрямую с данного сайта не могут быть загружены из-за ошибок, и их приходится загружать небольшими частями. Среди крупнейших созданными энтузиастами отечественных электронных библиотек, содержащих прямые ссылки на книги и статьи по геологии и биологии, следует назвать библиотеку по зоологии и ботанике «Флора и фауна» (http://herba.msu.ru/shipunov/school/sch-ru.htm), где представлены в основном работы в формате .djvu, сайт «Проблемы эволюции» (http://evolbiol.ru/), преимущественно включающий статьи и книги в форматах .doc и .htm, а также тематические библиотеки по геологии и палеонтологии сайта http://jurassic.ru, в которых преобладают публикации в формате .pdf.

Существующие проблемы

Можно наметить две основные группы проблем, связанных с доступностью научных публикаций в электронном виде: 1) несовершенство существующего законодательства в области авторского права и 2) неготовность издателей к изменению принципов распространения изданий. К этим проблемам добавляется и чисто отечественная – на фоне соответствующего законодательства наблюдается полное отсутствие заинтересованности государства в финансировании крупных проектов по оцифровке научного наследия и, как следствие, даже вышедшие из-под ограничения драконовских законов публикации оцифровываются почти исключительно в частном порядке.

Некоторые выводы

Судя по имеющимся тенденциям, все научные публикации ведущих государств Западной Европы и США скоро будут переведены в электронную форму и станут доступны для скачивания или чтения через Интернет на платной или бесплатной основе. С отечественными научными публикациям ситуация, к сожалению, пока иная. Поскольку денег на оцифровку государством или организациями не выделяется, а правообладатели обычно ведут себя в роли хорошо известного животного на стоге сена, возможности доступа к научным статьям и книгам в основном обеспечиваются благодаря усилиям нарушающим действующее законодательство, но активных энтузиастов. Однако узкоспециализированные книги или журнальные статьи остаются почти недоступными для широких пользователей. При сохранении текущего пассивного подхода к оцифровке научной литературы работы отечественных исследователей будут неизбежно терять в цитируемости, что не может не сказаться на авторитете российской науки, и вместо работы со своими электронными библиотеками мы рано или поздно будем вынуждены приобретать доступ к электронным версиям русскоязычных журналов и книг у проектов типа Google Books.

Таким образом, в цифровой форме на сегодняшний день существует крупный фонд научных статей, причем большая часть старых изданий (до 1900 г.), срок имущественных авторских прав на которые истек, доступна бесплатно, а свежие статьи (начиная с 2000 г.), полученные конвертацией электронных макетов, обычно распространяются за плату. Нужно отметить, что сказанное относится в первую очередь к англоязычной научной литературе и, в меньше степени, к публикациям на других распространенных европейских языках (немецкий, французский, испанский, португальский), тогда доля русскоязычных изданий, доступных в цифровой форме через Интернет, сравнительно мала. Учитывая возрастающую роль Интернета как основного инструмента в работе исследователя, мы вправе сделать пессимистичный прогноз: при сохранении текущего положения дел статьи российских ученых, опубликованные в отечественных журналах, через 10 лет прекратят цитировать за рубежом.

Необходимо выработать комплекс мер для реализации крупных отечественных проектов, связанных с оцифровкой публикаций при обязательном и полном соблюдении законов РФ. В качестве базовых вариантов подобных проектов, может быть создание тематических библиотек, ориентированных на старые источники, а также перевод в цифровую форму трудов научных институтов, владельцами авторских прав на которые являются сами институты. Ещё одной необходимой мерой – уж коли в последнее время так много говорится о модернизации – является коренное изменение действующего законодательства в области авторских прав на научные публикации. Можно надеяться, что лобби букинистов не окажется слишком сильным – ведь изданные 10-15 лет назад и раньше научные книги и журналы отыскать где-нибудь кроме букинистического магазина и библиотеки затруднительно : ).

Ссылки на некоторые другие публикации, затрагивающие рассматриваемые проблемы, размещенные в Интернете в формате .htm:

Московкин В. (2008) Тайные вклады? // Поиск, 30 мая. (к сожалению, сейчас, в отличие от написанного в статье, Наука-Интерпериодика не относится к издателям, которые придерживаются green-policy. Многочисленные публикации В.М. Московкина, в т.ч. посвященные проблеме открытого доступа к научным журналам, организации репозитариев и т.д., доступны в виде pdf-файлов на его страничке: http://library.bsu.edu.ru/Resourse/Biobibl/Moskovkin.asp, а презентации в виде .ppt-файлов – в DSpace БГУ http://dspace.bsu.edu.ru/jspui/handle/123456789/125 )

Орлова О. (2008) Российским научным журналам запрещено выставлять статьи в Интернете // svobodanews.ru, интервью с А. Марковым (за прошедшее время ситуация несколько изменилась к лучшему по сравнению с описанной в статье )

Рогов М.А., Ипполитов А.П., Полякова М.В. (2009) Электронные библиотеки в Интернете и их роль для палеонтологии и стратиграфии: текущее состояние дел и перспективы дальнейшего развития // ПАЛЕОСТРАТ-2009. Годичное собрание секции палеонтологии МОИП и Московского отделения Палеонтологического общества. Москва, 26-27 января 2009 г. Программа и тезисы докладов. С.36-37.

P.S. Спасибо А.П. Ипполитову (ГИН РАН, Jurassic.ru), взявшему на себя труд внимательно прочесть написанное и сделать ряд полезных замечаний
____________________
Автор, насколько я мог заметить, комментирует эхо-посты в ЖЖ (у данного поста адрес эха http://ekniga.livejournal.com/785298.html). Поэтому, рекомендую и комменты, адрессованые автору публикуемого материала, оставлять там. Кто не может – оставляйте здесь, я переброшу в Эхо сам

Теги: , , , , , , , , ,
Рубрика: е-книга и ридер в библиотеке, Новости, Обзоры, Продажи (в т.ч. через Интернет), Рынок чтения, Ценообразование, Цифровой контент, Цифровой контент. е-газеты и е-журналы, Цифровой контент. е-книги



Один комментарий:

  1. bne:
    6 июня 2010, 18:16

    В принципе список сайтов со ссылками на файлообменники много шире чем просто Гигапедиа
    Но некоторые из них и впрямь близки к криминальным (можно подхватить и рекламу и кое-что заметно хуже)
    Странно, но при Питерском университете даже продают коллекции из электронных копий недавних книг еще живых авторов
    Как такой бизнес никто не пресек просто недоумеваю

    Плохо с файлообменниками другое, что ссылки обычно долго не держатся и приходится скачивать пока свежие, на что систематически тратится куча времени
    Кроме того пиратские сайты такого рода практически не каталогизированы – искать сложно
    Практически отсутствуют и предметные обзоры (в чем вина и Yandex, поскольку за ссылки на файлообменники сайт или блог нередко исключают из результатов поиска – был личный опыт!)

    Вместе с тем, с учетом того что число иностранных книг поступающих в БЕН и РГБ на порядок меньше чем число копируемых пиратскими методами изданий это явление могу только приветствовать
    От таких пиратов науке IMHO пользы больше чем от премьера, правительства и АН вместе взятых


еkniga rss

Ежедневник

Май 2010
Пн Вт Ср Чт Пт Сб Вс
 12
3456789
10111213141516
17181920212223
24252627282930
31  

Архив

Рубрикатор

free counters
 
 

Рейтинг блогов

Рейтинг блогов