Блог, посвященный е-книгам

Снова о семантике и библиотекаре

Опубликовано 14 июля 2011

В далёком 2009 я сделал пост от 22 апреля (Оценка достоверности сайтов БЕЗ АНАЛИЗА СЕМАНТИКИ). в котором проанализировал попытки автоматического анализа достоверности  на основе формальных приёмов сравнения с некими эталонами. Ккак я рассуждал – смотрите по ссылке, а вывод был такой (цитирую):

Неа, робяты. Без семантики это всё “не пляшет”.
А кто сегодня может выполнять функцию семантического анализатора достоверности?
Человек, которого этому учили. Библиотекарь называется
Так что, с ростом “масштабов бедствия” под названием “Информационные ресурсы” роль библиотекарей будет только возрастать именно в этом направлении, а вот их роль в качестве “приставки” при системе выдачи-приеме книг будет (я надеюсь), наоборот снижаться (в т.ч. за счёт работы с е-книгами)…
Представляете, лет эдак через много, специалист по семантическому анализу (бывший библиотекарь) будет звучать не менее гордо, чем сейчас “банкир”… И оплачиваться будет не хуже…
Как это у Некрасова (если не ошибаюсь):
Жаль только – жить в эту пору прекрасную уж не придется ни мне ни тебе“….

Минуло два года и наткнулся я на свежий материал от 14 июня 2011 (Анатолий Шперх. Как оценить достоверность результатов поиска?) и предшествовавший ему материал (Анатолий Шперх. Поучительная история, как важно действительно уметь пользоваться Google’ом, рассказанная Альбертом Эйнштейном в 1954 году).

Поводом “наткнуться” послужила ссылка на упомянутый материал. То, что его процитировали – приятно, но толковый материал о поиске и оценке семантики попадается нечасто.

В Материале про Эйнштейна на конкретных примерах из эры “до Google” и эры “при Google” рассказывается о том, что должен знать и понимать ищущий в некой “достаточно большой информационной совокупности, в которой заведомо есть противоречащие друг другу, сомнительные и заведомо неверные данные “. Рассказано о том периоде в жизни Эйнштейна, когда он (фактически) выступал в роли библиографа, профессионально просеивающего и оценивающего материалы по теме.

В теоретическом материале даются совершенно правильные рекомендации, которые (на взгляд новичка) выглядят очевидными и которые (точнее, неумение пользоваться которыми) явно проявляются при провальных результатах поиска и отбора.

Очень интересно было (по наводке автора теоретической статьи)  познакомиться с узконаправленной экспертной вопрос-ответной системой по продвижению сайтов и её цитатами:

Важно то, что технология работы экспертной системы базируется на привлечении “асессоров” (специалистов по оценке качества и достоверности ответов). И всё это ещё раз подтверждает моё мнение о том, что при отсутствии умения манипулировать с семантикой никакого другого выхода, кроме использования специально обученного человека (будет он называться асессор или библиограф сути не меняет) НЕТ и ещё долго не будет


Теги: , , , ,
Рубрика: Новости, Обзоры, Публикации, Сопутствующие технологии, Цифровой контент

Комментарии к записи Снова о семантике и библиотекаре отключены

Зачем нужны библиотекари

Опубликовано 3 июля 2011

Где-то прочитал, что объём генерируемой информации растёт экспоненциально и подчиняется закону “типа закона Мура” с периодом удвоения 7-8 лет (память и быстродействие компьютеров удваиваются каждые 2-3 года, что обеспечивает некий запас производительности для манипулирования этой информацией).

И что сие означает с точки зрения “человека с улицы”? А означает сие, что потребность в специалистах по поиску, анализу, оценке и отбору информации как минимум не убывает. И вопрос состоит в том, станут ли этими специалистами библиотекари (которых именно этому учили “надлежащим образом”) или ими станут коммерсанты, которые ничего толком не умеют,  кроме того, что умеют “подать себя” (это, как раз, то, чего библиотекари не умеют)?

_________________________

А “до кучи” материал от CyberSecurity (В 2011 году общество произведет 1,8 зеттабайт цифровой информации 18:34 28.06.2011), который (как мне кажется) подтверждает моё мнение (цитирую целиком):

Согласно данным совместного исследования компаний IDC и EMC, в 2011 году будет произведено и сохранено более 1,8 зеттабайт информации по всему миру. 1,8 зеттабайт – это 1,8 трлн гигабайт данных. Полученный гигантский массив информации компании именуют “цифровой вселенной” и по их данным этот массив в 2011 году вырастет по всем основным направлениям – бизнес-данные, мультимедиа, пользовательские данные и прочая информация.

В отчете компаний говорится, что современное общество с каждым годом генерирует все больше информации, но с другой стороны производимая информация открывает возможности по уникальной детализации.

“В течение следующей декады количество работающих серверов по всему миру возрастет десятикратно. Количество управляемой информации, размещаемой в датацентрах по всему миру – 50-кратно, количество индивидуальных файлов на серверах и компьютерах возрастет по меньшей мере в 75 раз. В то же время, количество ИТ-профессионалов, управляющих данными информационными потоками, увеличится лишь в 1,5 раза”, говорят в IDC.

Аналитики говорят, что на фоне растущих информационных потребностей продолжит увеличиваться и количество датацентров, специализирующихся на создании виртуализованных и облачных сред.

Одним из трендов 2011 года аналитики называют появление “больших данных” – информационных массивов, работающих в интересах одного клиента, но измеряющихся десятками или сотнями терабайт.

______________________

Под ДЕКАДОЙ, насколько я понял, понимается десятилетие


Теги: , , , , , , , ,
Рубрика: Новости, Программное обеспечение, Публикации, Рынок чтения, Сопутствующие технологии

Комментарии к записи Зачем нужны библиотекари отключены

Колобок

Опубликовано 20 марта 2011

Постсовременная библиотека (Колобок – серьёзный поисковик по электронным библиотекам) описала специализированный поисковик по е-библиотекам. Интересно. Надо будет попробовать


Теги: , ,
Рубрика: е-книга и ридер в библиотеке, Новости, Обзоры, Программное обеспечение, Проекты, Рынок чтения, Цифровой контент, Цифровой контент. е-книги

Один комментарий

Efron – ещё один поиск печатной книги

Опубликовано 24 июня 2010

2010-06-24-efron-1Поисковые системы по нескольким интернет-магазинам, которые продают печатные книги в Интернет не новость. На вскидку назову несколько:

Все они, на мой взгляд, страдают главным недостатком – “самопальностью”. Делали их на энтузиазме, качество поиска “не очень”, база данных сделана так непрофессионально, что пополнить её недостаточно, Её надо перерабатывать полностью

Сегодня увидел ещё один поисковик (Efron). И понял, что делали его профессионалы, которые “очень даже” понимают в библиографии…

Из раздела “О проекте” (цитирую):Откуда взялся проект каталогов Ефрон
Найти нужную книгу не так просто, как может показаться. Особенно, если не знаешь ни названия, ни имени автора, а помнишь только цвет обложки и о чем книга. Есть несколько путей для решения задачи:
1. Расспросить друзей и знакомых;
2. Пойти в книжный магазин и поискать там;
3. Пойти в библиотеку, порыться в каталогах и карточках;
4. Поискать «что-нибудь» в интернете или интернет-магазинах.
Такие поиски могут занять много часов, а иногда и дней.
Многие задумывались, как можно улучшить процесс поиска:
Библиотеки описывают все свои книги и раскладывают их в архивах;
Книжные магазины раскладывают книги по полкам по какой-то системе;
Интернет «собирает все», но попробуй найди «такую зелёненькую о времени войны с Наполеоном, там ещё про антиквариат …»
Что же делать?
2010-06-24-efronКогда Лев Толстой затруднялся найти ответ на какой-то вопрос, он спрашивал у своего секретаря: «А что говорит по этому поводу Брокгауз и Ефрон?»
Чего мы хотим
Мы, правнуки И.А. Ефрона, решили возродить традиции и создать широкомасштабную информационно-справочную систему для книжной отрасли с использованием современных технологий. Наша мечта – услышать, как люди говорят: «Где найти книгу? Разумеется у Ефрон».
Основной задачей системы Ефрон является оказание помощи Читателю или другому потребителю (Библиотеке, Магазину, Школе и многим др.) найти и другие издания.
Программа минимум:
Создать российские вебкаталоги книг и других типов изданий, начиная с 2000-х годов. Обеспечить пополнение каталога более ранними изданиями, находящимися в продаже;
Создать интеллектуальную систему поиска для профессионалов;
Создать и поддерживать авторитетные справочники отрасли – авторов, писателей, переводчиков, композиторов и т.д., а также Издателей, Библиотек и книжных магазинов;
Подключить к системе участников книжной отрасли для обмена библиографической, а также коммерческой информацией;
Создать открытый информационный портал для читателей с возможностью найти нужную книгу и увидеть, где и по каким ценам её можно купить.
Программа максимум:
Создать вебкаталоги зарубежных изданий, начиная с 2000-х годов и обеспечить пополнение каталога более ранними изданиями, находящимися в продаже;
Подключить к системе зарубежных участников книжной отрасли;
Создать открытый информационный портал для читателей на английском языке с указанием, где и по каким ценам можно купить продукцию.
Что сейчас
В настоящий момент завершается работа над Программой минимум. Каталоги Ефрон расширяются и пополняются новинками в режиме On-line.
Идет работа над подключением книжных магазинов Москвы и Санкт Петербурга к нашей системе для оказания информационной поддержки покупателям и обеспечения возможности заказывать продукцию из дома.
Планируем в ближайшее время подключить зарубежные интернет-магазины, библиотеки, зарубежные каталоги изданий.

______________________________
И, действительно, идёт работа над программой-минимум.
И поиск, надо отметить, идёт грамотно.
Больно, конечно, что классические Ландау (Теоретическая Физика) и Фихтенгольц (Высшая математика) не удалось найти, но это не вина каталога. Это означает, что доступных для покупки печатных версий этих книг нет. И это не вина каталога.

Однако поглядите, насколько интересно описание и данные о “где и почём” для книги, которую удалось-таки найти (щёлкните по изображению, чтобы посмотреть целиком):

2010-06-24-efron-2

Очень профессионально сделано. Если удастся организовать качественное наполнение, то ресурс будет очень удачным “подспорьем” и для читателей и для библиотек


Теги: , , , ,
Рубрика: Новости, Обзоры, Продажи (в т.ч. через Интернет), Рынок чтения, Сопутствующие технологии

Комментарии к записи Efron – ещё один поиск печатной книги отключены

визуальный pdf-поисковик – LocPDF

Опубликовано 27 апреля 2010

Появился визуальный pdf-поисковик – LocPDF. По интерфейсу он немного похож на iBook

Подробности – тут.


Теги: , , , ,
Рубрика: Обзоры, Рынок чтения, Сопутствующие технологии, Цифровой контент, Цифровой контент. е-книги

Комментарии к записи визуальный pdf-поисковик – LocPDF отключены

Мердок придуривается, а журналюги вторят

Опубликовано 8 апреля 2010

Со ссылкой на (Франс Пресс) Компьюлента (Руперт Мёрдок ограничит доступ поисковых систем к газетным сайтам) без комментариев опубликовала очередную порцию благоглупостей от Мердока. Причём сделала это без комментариев, вводя публику в заблуждение.

Перл:
Руперт Мёрдок не ждет, что поисковые системы станут платить за доступ к газетам: «Мы обрадуемся, если они просто опубликуют наш заголовок, или предложение, или два, а за этим будет следовать форма подписки».

Ну Мердок может придуриваться, но пишущие про технику журналисты должны знать, что поисковые машины вообще ничего не публикуют. Они индексируют то, что им разрешают и при ответе на поисковый запрос выдают ссылку на найденное место с указанием контекста в котором нашли искомое.

Мердок, если он хочет, может сделать RSS к свои ресурсам (заголовок и одно-два предложения) и запретить поисковому роботу смотреть остальные тексты на сайте. Выдачи jn поисковых машин пойдут со ссылками не на статью, а на её анонс в ленте. А уж куда будет вести ссылка с анонса – на текст статьи или на форму регистрации/разовой оплаты или на полный текст – это уже забота фирмы.

Чтобы сделать это не требуется ничего требовать от поисковых машин. Мердок (точнее, его персонал) имеет право и возможность сделать сам…

Есть одно но из-за которого идёт придурь.

Понятно, что проиндексировав анонсы поисковая машина выдаст меньше ссылок на анонсы, чем на полный текст (с ним совпадений будет больше). Как следствие, Мердок получит меньше заходов потенциальных пользователей от поисковой машины. И далеко не всякий согласится заплатить. А тот, кто согласится, не захочет терпеть рекламные банеры и т.п. билиберду, приносящую доход Мердоку. Деньги плачу – получаю информацию. Понимает Мердок, что суммарная выручка у него может и упасть и “дёргается”

А журналюги повторяют благоглупости без комментариев.

А тут явные вариации на тему “и хочется и колется”…


Теги: , , , , ,
Рубрика: Авторское право, Новости, Рынок чтения, Сопутствующие технологии, Ценообразование, Цифровой контент, Цифровой контент. е-газеты и е-журналы

Один комментарий

Специализированный поиск е-книг по 200 Интернет-магаинов

Опубликовано 26 марта 2010

Доступен по адресу (http://www.directtextbook.com/)

Поиск возможен по: ISBN, author, title или по keywords

2010-03-26-direct-textbook

Чтобы увидеть скриншот целиком надо щёлкнуть мышкой по его уменьшенному изображению


Теги: , , , , ,
Рубрика: Новости, Обзоры, Продажи (в т.ч. через Интернет), Рынок чтения, Сопутствующие технологии, Цифровой контент. е-книги

Комментарии к записи Специализированный поиск е-книг по 200 Интернет-магаинов отключены

Новости АР вернулись на Google News

Опубликовано 10 февраля 2010

Помнится, AP криком исходило, что запрещает Google индексировать свои сайты и интегрировать свои RSS, т.к. на этом Associated Press теряет посетителей. И вот, не успел пройти месяц врозь, как на CNews появилась одноимённая с заголовком данного поста заметочка, в которой сказано (цитирую целиком):

Новостной контент агентства Associated Press вернулся на сервис Google News.

До этого он отсутствовал на Google News более месяца из-за того, что компании не смогли договориться по поводу лицензионного соглашения.

«У нас есть лицензионное соглашение с Associated Press, которое позволяет нам размещать материалы агентства на сайтах Google, таких как Google News. Лицензионное соглашение сейчас остается предметом продолжающихся обсуждений, поэтому не можем предоставить более подробные комментарии по этому поводу», – заявил представитель Google, пишет Wall Street Journal.

Представители Associated Press сообщили, что им нечего добавить к заявлению Google.
_____________________________________________
Что интересно:
Несмотря на то, что соглашения ещё нет, материал уже вернулся… Значит, похоже, AP “поджимает” вдруг ставшая очевидной мысль, что без Google будет ещё хуже.
Самое интересное: чем дело кончится. Ясно, что AP (чтобы “не потерять лицо”) должна что-то получить от Google? но смогут получить хоть что-то только если разрешат Google публиковать не результаты обработки поисковых запросов и RSS-ленты, а полные тексты…
Хочется верить, что Google “дожмет” их


Теги: , , , ,
Рубрика: Авторское право, Новости, Проекты, Рынок чтения, Цифровой контент

Комментарии к записи Новости АР вернулись на Google News отключены

Поисковые машины для поиска именно е-книг (обзор)

Опубликовано 21 января 2010

Обзор дал сайт Online College (50 Cool Search Engines for Serious Readers). А я (дабы не исчез этот обзор в глубинах Интернет) с благодарностью копирую его целиком БЕЗ перевода (перевожу только подзаголовки разделов):

January 18th, 2010

eBooks

Когда вы захотите читать книги  online, используйте эти поисковые машины для поиска free versions (PDF и  .doс форматы).

  1. Ebook Engine: This engine will connect you to free ebooks and ebook sites like Project Gutenberg, Archive.org, Feedbooks.com and others.
  2. PDF Search Engine: Search for PDF versions of ebooks using this tool, which also features an ebook search toolbar for Firefox.
  3. Ebooksearchengine.com: Search ebooks in various languages in PDF or .doc forms here.
  4. Google Books: Google Books offers an impressive database of searchable titles in non-fiction, fiction, poetry, self help, science, reference and more. Not all books can be accessed for free in full text, but you will at least find shopping information for each book.
  5. PDFse: This is another ebook search for PDF texts, complete with a tag cloud, keyword search box, and alphabetical glossary.
  6. Open Library: This beta open source site claims to have “one web page for every book,” and gives you the choice of searching fully scanned titles only.
  7. eLibrary: eLibrary is a good tool for searching reference books, self-help titles, instructional books and training guides.
  8. Bibliomania: Literature nerds can browse classic works, including poetry, drama, short stories and novels, at Bibliomania.
  9. Project Gutenberg: Project Gutenberg is the original search engine and archive of ebooks, specializing in old and classic texts.
  10. Digital Book Index: You can search plenty of subcategories in umbrella sections like authors, subjects, keywords or publishers from the Digital Book Index, which has over 100,000 titles.
  11. The Online Books Page: The University of Pennsylvania supports book search engine for classics and more modern works that can be read online, downloaded, and saved.
  12. Etext Center: The University of Virginia’s ebook collections contain over 2,100 works, from classics, American history, children’s literature and more.

Books to Swap, Sell and Buy (книги для обмена, продажи и покупки)

Используйте эти поисковые машины когда Вам нужно обменять, продать или купить книгу через Интернет. В списке есть инструменты для старых и “поюзаных” книг, для новых книг, названий отсутствующих в печатном виде и т.п.

  1. BookFinder.com: You can search through 150 million books for sale, including textbooks, rare and out-of-print books, and international titles.
  2. AbeBooks.com: This book and bookseller site has all kinds of options for searching, including most popular subjects, author/title/keyword/ISBN, simple browsing, top reviewed, and more. You can also sell books through AbeBooks.com
  3. AllBookstores.com: Use this site to compare prices on books and textbooks.
  4. BookFinder4U: This simple search engine offers advanced and out-of-print search.
  5. PaperBackSwap.com: Join this community to search and swap all kinds of books, including memoirs, fantasy, fiction, historical, religious books, children’s books, and more.
  6. eBay: eBay’s book page has search options for book type, rare books, textbooks, printing year, book accessories, and more.
  7. Barnes & Noble: This mega retailer has one of the most popular online book search tools, too, including a section just for ebooks.
  8. BookSwap Textbooks: College students can select their school or school system to find textbooks for swap or sale here.
  9. TitleTrader: Book categories here include nonfiction; cooking, food and wine; sports; teens; comics and graphic novels; biographies and memoirs; reference; and others.
  10. ISBN.nu: Compare books and book prices on this site.
  11. AddALL: AddALL is a popular book search engine and price comparison tool for new and used books.

Rare  Books (редкие книги)

Собиратели редких, подписных и отсутствующих в продаже книг могут использовать эти ресурсы (search engines) в качестве помощи по комплектованию их библиотек.

  1. Inprint: Inprint has been finding out-of-print books since 1980 and now operates online, too.
  2. Bibliofind: Bibliofind and Amazon.com offer this book search for rare and out-of-print books, letting you search by category, format, reader age, language, publication date and other qualifications.
  3. Powell’s Books: Powell’s is a legendary independent bookseller that can connect you to signed editions, collectibles and rare books.
  4. Alibris: With Alibris, you can easily locate rare and collectible books by searching publication years, signed or first editions, dust jacket, collectibles, and more.
  5. Rare Book Room: Find digitized rare books from a range of disciplines and authors, like Shakespeare, law, philosophy, natural history, linguistics, botany, and more.
  6. Book Values: Here you can search for and compare prices of rare books.
  7. Bauman Rare Books: Rare book gallery owners David and Natalie Bauman offer a searchable library online too, where you can find books in categories like music, photography, children’s books, Americana, religion, and more.
  8. Biblio.com: Biblio.com’s antiquarian and rare books page covers law, philosophy and reference books, business, cook books, history books, “books on books,” literature, rare art books, and lots more.
  9. Bibliopoly: Bibliopoly is a search engine that pulls rare books from many different languages.

Book Reviews and Community (Обзоры книг и тематические сообщества)

Доступные онлайн книжные клубы и сообщества также предлагают мощные поисковые  машины, которые помогут Вам найти новые книги для “Чтобы почитать”, а такде предложат обзоры и работы исследователей и других “продвинутых” читателей.

  1. Reader’s Robot: Reader’s Robot contains databases filled with over 19,000 books and reviews in categories like popular fiction, romance, historical, travel, mystery, African-American and more. The tool’s “appeal factor” rating system will help you fill up your reading list.
  2. AllReaders.com: AllReaders is a solid resource for locating book reviews and information based on keyword, plot, title, author, setting or character searches.
  3. Book Movement: Book Movement hosts book clubs on its site and also features a very extensive search engine of book reviews that you can browse by top rated, a glossary, or keyword.
  4. Book Crossing: This site incorporates a reading community with title searching. You can look up title, author, ISBN and publishing information, plus reviews, for all types of books.
  5. Whichbook: This clever tool lets you pick keywords on a graph of opposing moods, characters, plots, or settings (like happy vs. sad or no sex vs. sex).
  6. BookReview.com: Choose to search only must read books, or search by review date, author, publisher and/or title.
  7. LibraryThing: On this book club site, you can catalog books, search reviews, swap books, and more. The powerful search engine features search by title/author/ISBN, author, tags, groups, and community members.
  8. GoodReads: This community-driven book search will connect you to book reviews, top book lists, book discussions and giveaways, and more.
  9. Bookwire Reviews: This user-friendly engine offers title, keyword or author search, as well as a category search that can find book reviews going back until 2004.
  10. Sunday Book Review: Search the New York Times’ archives of book reviews here.

Libraries (библиотеки)

Если Вы хотите найти ближайшую библиотеку или уточнить наличие конкретной книги в виртуальной или физической библиотеке, то используйте эти поисковые машины

  1. AwesomeLibrary.org: Powered by Google, this search engine also searches the Internet Public Library, Google Books, Education World, and other reference sites.
  2. Library of Congress Online Catalog: Search books housed at the Library of Congress here.
  3. Internet Public Library: The IPL’s Online Texts section features collections of contemporary fiction, classical literature, drama and plays, poetry, and more.
  4. Classic Reader: On Classic Reader, you can search free books, authors, categories and more.
  5. World Cat: Use World Cat as a one-stop resource that will find books in nearby libraries.
  6. Public Libraries: Search for public, state, Presidential, national, college and law libraries in all 50 states. This site also has a book search and author information center.
  7. Questia: Questia can connect you to the largest online collection of books and journal articles in the world.
  8. Library Spot: Use Library Spot to locate libraries around the world, find book reviews, shop for books, and more.

Теги: , , , , ,
Рубрика: Новости, Обзоры, Рынок чтения, Цифровой контент. е-книги

Комментарии к записи Поисковые машины для поиска именно е-книг (обзор) отключены

еkniga rss

Ежедневник

Апрель 2024
Пн Вт Ср Чт Пт Сб Вс
1234567
891011121314
15161718192021
22232425262728
2930  

Архив

Рубрикатор

free counters
 
 

Рейтинг блогов

Рейтинг блогов