Блог, посвященный е-книгам

Библиотекарь как прибор оценки и отбора контента

Опубликовано 27 апреля 2012

PirateMedia порадовал статьёй с милой всякому любителю цифрового контента заголовком («Интеллектуальная собственность — это абсурд, это оксюморон»). Речь шла о прошедшем в Москве российском форуме Big Tent (организован компанией Google совместно с РИА «Новости») . Процитирую то, что касается культуры и цифрового контента:

В качестве модератора секции была приглашена Екатерина Чуковская, заместитель министра культуры РФ. Секцию она вела высокопрофессионально и с чрезвычайной деликатностью (тем сильнее оказался контраст между её вводным словом и выступлением музыкального критика и журналиста Артемия Троицкого, на котором отдельно остановимся позже).

Помимо уже упомянутых Екатерины Чуковской и Артемия Троицкого, в дискуссии приняли участие профессор Александр Долгин, основатель Imhonet.ru, автор «Экономики символического обмена», Арам Зиннрайх, профессор Школы коммуникации информации университета Рутгерс, автор книги Mashed Up и Марк Сэндс, медиа-директор британской галереи Tate Britain. Секция носила название «Интернет в культуре: инструмент создания или копирования?».

Первым (после Чуковской) выступал именно Долгин, отметивший, что сегодня главной проблемой культуры в интернете является «проблема ухудшающего отбора», при котором низкокачественные продукты «берут числом», вытесняя качественные. Это, в принципе, отнюдь не уникальная проблема интернета, проблема преодоления информационного шума остро стоит в любой сфере. Просто интернет делает тиражирование чрезвычайно простым, а потому и популярным занятием, что открывает невиданные прежде просторы для графоманов и халтурщиков всех мастей.

Довольно своеобразную точку зрения представил автор Mashed-Up Арам Зиннрайх, назвавший мэшапы новым искусством и приравнявший их к самостоятельным формам искусства. Чуковская как бы между делом заметила, что главное, чтобы в интернете оставались и оригинальные произведения, а не только вторичные гибриды.

Марк Сэндс, в свою очередь, заметил, что желание «потреблять культуру» в интернете — огромно, и что не стоит путать сегодняшнее отсутствие отсутствие эффективных моделей монетизации с отсутствием желания платить за контент.

Самым жёстким по содержанию оказалось выступление Артемия Троицкого, начавшего с того, что сегодняшняя ситуация в музыкальной сфере иллюстрирует ситуацию в других областях. «Тиражирование музыки позволило ей стать массовой и создать такое уродливое явление как «музыкальная индустрия», — отметил критик, добавив, что интернет фактически отбрасывает нас в «тёмные времена»: наилучшим способом общения музыкантов со своей потенциальной аудиторией является концертная деятельность. А всем бесконечным посредникам, которые и являют собой «музыкальную индустрию», Троицкий без обиняков предложил отправиться к станку или на панель, мол, от этого музыка не умрёт.

Касаясь животрепещущего вопроса о законодательных инициативах типа SOPA, PIPA и CISPA, Троицкий назвал их «драконовскими актами», которые «уже бессмысленны и абсолютно не соответствуют современному состоянию человеческой цивилизации. Они останавливают цивилизацию». Он также заявил, что само понятие «интеллектуальная собственность» являет собой «абсурд» и «оксюморон», и что интеллектуальная продукция должна быть принадлежать всем.

Послышались громкие аплодисменты.

С копирайтной частью зам. министра, похоже справилась неплохо, а вот вопрос оценки и отбора она или не модерировала или об этом не написал автор обзора:

Из твиттера был задан характерный вопрос: кто и как должен формировать вкусы у пользователей? Общее мнение спикеров исчерпывающим образом выражается одним словом — «никто».

«Общий ответ на этот вопрос звучит несколько категорично — никто и никак не должен на это влиять. Сообщество само найдёт механизмы раздачи каждому кому что нужно», — заявил Александр Долгин, добавив, что не существует «плохих» или «хороших» вкусов и ничего навязывать никому не нужно.

Данная точка зрения заслуживает, безусловно, всяческого уважения. Однако возникает вопрос относительно социального влияния на вкусы: например, если подросток, у которого только-только формируются «собственные» музыкальные вкусы, скорее всего будет испытывать как минимум некоторое влияние со стороны своего окружения (одноклассников). И если в школе царствует какая-нибудьмассовая мода, отказ ей следовать может вызывать последствия. Вдобавок носители, скажем так, не самых замысловатых музыкальных вкусов зачастую ещё менее терпимо относятся к носителям музыкальных пристрастий, отличных от их собственных, нежели самые завзятые снобы. Соответственно, если какой-либовкусовые — ок, не эталоны, но хотя бы более-менее общепризнанные ориентиры качества исчезают, на их месте моментально формируются другие. И тут вспоминается финал фильма «Человек с Бульвара Капуцинов», где очень чётко и внятно показано: стоит ослабеть влиянию мистера Фёрста, и мистер Секонд не заставит себя ждать.

Ну, а с другой стороны, сейчас, возможно, мы наблюдаем медленное (или не очень медленное) отмирание массовой культуры, или, точнее будет сказать, массовости в культуре: вместо каких то гигантских «центров притяжения» возникает колоссальный рой мелких ниш, в которых каждый находит что-то по себе.

Но, опять же, навигация по этим нишам в условиях упомянутого Долгиным «ухудшающего отбора» и постоянно растущего уровня информационного шума — колоссальная проблема, и даже придуманные для Last.FM системы рекомендаций, существующие сегодня, наверное, у каждого уважающего себя музыкального хостинга, пока не выглядят эффективным решением этой проблемы.

Долгина понять можно. Он представляет советующий сервис (эдакий российский пионер web 3.0) и целевого воздействия не ищет. Его сервис обслуживает «советы» пользователей друг-другу и конкуренты сервису не слишком-то и нужны. Неясно почему г-жа Чуковская не отметила, что именно в системе её ведомства существуют такие заведения как библиотеки, в штате которых существуют библиотекари – обученные и аттестованные государством специалисты по оценке и отбору контента (прежде всего, конечно, книжного). А ведь именно современные технологии делают это умение библиотекарей востребованным обществом и создают, на мой взгляд, нишу для их встраивания в информационное общество.

Возможно, конечно, что г-н Ильин (автор цитируемого обзора) об этом не написал или г-жа Чуковская, как надлежит рафинированному интеллигенту, терпеть не может даже мысли о том, что библиотека может и должна осуществлять (о ужас) РУКОВОДСТВО ЧТЕНИЕМ, но, похоже, постоять за честь и достоинство российских библиотек г-жа зам. министра Культуры не смогла или не захотела


Теги: , , , , , , , , , , , , , , , ,
Рубрика: Web.0 (пользовательский контент), Авторское право, Мероприятия, Новости, Обзоры, Публикации, Рынок чтения, Сопутствующие технологии, Цифровой контент, Цифровой контент. Прочее, Цифровой контент. е-книги, е-книга и ридер в библиотеке, сервисы, ссылки на контент

4 комментария

А что, могло быть иначе?

Опубликовано 18 февраля 2012

Если какой-то проект требует многолетней проработки, ноу-хау и колоссальных расходов, то попытка ведомства заказать улучшенную версию «под себя» может оказаться удачной только в том случае, если её поручить фирме, которая уже много лет данные работы ведёт (и ведёт успешно), потратила много денег, наработала ноу-хау…

А вот попытка по дешёвке заказать систему аналог у «левого» разработчика (который может быть прекрасным разработчиком, но не в данном направлении) заведомо  обречена на провал…

Стоит ли удивляться, что именно этим закончилась попытка Роскомнадзора заказать систему мониторинга интернет-СМИ. Результат описан в материале CNews (Власти объяснили, почему не заработала российская система интернет-цензуры). Цензурой там, понятно и не «пахло». Речь шла о выявлении нарушений для предъявления претензий в законном порядке ЧЕРЕЗ СУД. И для поиска использовали поисковые машины. Понятно, что нужна была надстройка для автоматизации работы с поисковиком и ясно было, что лучше всего с этим справится Яндекс (Google – не российский поисковик и доверять ему систему для российского ведомства да ещё в весьма «чувствительной» сфере, на мой взгляд, не стоило)… А тут бюджетная контора… Понятно, что проект выставили на торги (тендер) и победил не тот, кто мог сделать лучше (и понимал сколько это стоит), а тот, кто предложил цену ниже…

Так что вопрос тут не в цензуре, а в системе подбора исполнителей для сложных проектов под бюджетные заказы…


Теги: , , , , ,
Рубрика: Новости, Программное обеспечение, Проекты, Прочее, Сопутствующие технологии, Фильтрация поисковая, сервисы, ссылки на контент

Комментариев нет

Занятие

Опубликовано 21 сентября 2011

Занятие с библиотекарями на тему «Организация рабочего места Интернет-библиографа». Планируется мастер-класс, так что (если удастся) кое-что покажу). Есть слайды, но комментарии, к сожалению я вывести не умею…

Хочу отметить, что аудитория планируется такая, для которой (как минимум для трети слушающих) возможности правой кнопки мышки – «тёмный лес». Поскольку начальство (при всех моих попытках сопротивляться) жаждет довести всё это до публикации методички, то замечания, ссылки на полезные ресурсы для Интернет-библиографа, описания работы с ними, описания принципов сбора, анализа, оценки и отбора данных всячески приветствуются



Я


Теги: , , , , , , , , , , , , , ,
Рубрика: Web.0 (пользовательский контент), Контент хранимый в "облаке", Мероприятия, Новости, Обзоры, Программное обеспечение, Публикации, Сопутствующие технологии, Цифровой контент, Цифровой контент. Прочее, Цифровой контент. е-книги

Один комментарий

Снова о семантике и библиотекаре

Опубликовано 14 июля 2011

В далёком 2009 я сделал пост от 22 апреля (Оценка достоверности сайтов БЕЗ АНАЛИЗА СЕМАНТИКИ). в котором проанализировал попытки автоматического анализа достоверности  на основе формальных приёмов сравнения с некими эталонами. Ккак я рассуждал – смотрите по ссылке, а вывод был такой (цитирую):

Неа, робяты. Без семантики это всё «не пляшет».
А кто сегодня может выполнять функцию семантического анализатора достоверности?
Человек, которого этому учили. Библиотекарь называется
Так что, с ростом «масштабов бедствия» под названием «Информационные ресурсы» роль библиотекарей будет только возрастать именно в этом направлении, а вот их роль в качестве «приставки» при системе выдачи-приеме книг будет (я надеюсь), наоборот снижаться (в т.ч. за счёт работы с е-книгами)…
Представляете, лет эдак через много, специалист по семантическому анализу (бывший библиотекарь) будет звучать не менее гордо, чем сейчас «банкир»… И оплачиваться будет не хуже…
Как это у Некрасова (если не ошибаюсь):
«Жаль только – жить в эту пору прекрасную уж не придется ни мне ни тебе«….

Минуло два года и наткнулся я на свежий материал от 14 июня 2011 (Анатолий Шперх. Как оценить достоверность результатов поиска?) и предшествовавший ему материал (Анатолий Шперх. Поучительная история, как важно действительно уметь пользоваться Google’ом, рассказанная Альбертом Эйнштейном в 1954 году).

Поводом «наткнуться» послужила ссылка на упомянутый материал. То, что его процитировали – приятно, но толковый материал о поиске и оценке семантики попадается нечасто.

В Материале про Эйнштейна на конкретных примерах из эры «до Google» и эры «при Google» рассказывается о том, что должен знать и понимать ищущий в некой «достаточно большой информационной совокупности, в которой заведомо есть противоречащие друг другу, сомнительные и заведомо неверные данные «. Рассказано о том периоде в жизни Эйнштейна, когда он (фактически) выступал в роли библиографа, профессионально просеивающего и оценивающего материалы по теме.

В теоретическом материале даются совершенно правильные рекомендации, которые (на взгляд новичка) выглядят очевидными и которые (точнее, неумение пользоваться которыми) явно проявляются при провальных результатах поиска и отбора.

Очень интересно было (по наводке автора теоретической статьи)  познакомиться с узконаправленной экспертной вопрос-ответной системой по продвижению сайтов и её цитатами:

Важно то, что технология работы экспертной системы базируется на привлечении «асессоров» (специалистов по оценке качества и достоверности ответов). И всё это ещё раз подтверждает моё мнение о том, что при отсутствии умения манипулировать с семантикой никакого другого выхода, кроме использования специально обученного человека (будет он называться асессор или библиограф сути не меняет) НЕТ и ещё долго не будет


Теги: , , , ,
Рубрика: Новости, Обзоры, Публикации, Сопутствующие технологии, Цифровой контент

Комментариев нет

Зачем нужны библиотекари

Опубликовано 3 июля 2011

Где-то прочитал, что объём генерируемой информации растёт экспоненциально и подчиняется закону «типа закона Мура» с периодом удвоения 7-8 лет (память и быстродействие компьютеров удваиваются каждые 2-3 года, что обеспечивает некий запас производительности для манипулирования этой информацией).

И что сие означает с точки зрения «человека с улицы»? А означает сие, что потребность в специалистах по поиску, анализу, оценке и отбору информации как минимум не убывает. И вопрос состоит в том, станут ли этими специалистами библиотекари (которых именно этому учили «надлежащим образом») или ими станут коммерсанты, которые ничего толком не умеют,  кроме того, что умеют «подать себя» (это, как раз, то, чего библиотекари не умеют)?

_________________________

А «до кучи» материал от CyberSecurity (В 2011 году общество произведет 1,8 зеттабайт цифровой информации 18:34 28.06.2011), который (как мне кажется) подтверждает моё мнение (цитирую целиком):

Согласно данным совместного исследования компаний IDC и EMC, в 2011 году будет произведено и сохранено более 1,8 зеттабайт информации по всему миру. 1,8 зеттабайт – это 1,8 трлн гигабайт данных. Полученный гигантский массив информации компании именуют «цифровой вселенной» и по их данным этот массив в 2011 году вырастет по всем основным направлениям – бизнес-данные, мультимедиа, пользовательские данные и прочая информация.

В отчете компаний говорится, что современное общество с каждым годом генерирует все больше информации, но с другой стороны производимая информация открывает возможности по уникальной детализации.

«В течение следующей декады количество работающих серверов по всему миру возрастет десятикратно. Количество управляемой информации, размещаемой в датацентрах по всему миру – 50-кратно, количество индивидуальных файлов на серверах и компьютерах возрастет по меньшей мере в 75 раз. В то же время, количество ИТ-профессионалов, управляющих данными информационными потоками, увеличится лишь в 1,5 раза», говорят в IDC.

Аналитики говорят, что на фоне растущих информационных потребностей продолжит увеличиваться и количество датацентров, специализирующихся на создании виртуализованных и облачных сред.

Одним из трендов 2011 года аналитики называют появление «больших данных» – информационных массивов, работающих в интересах одного клиента, но измеряющихся десятками или сотнями терабайт.

______________________

Под ДЕКАДОЙ, насколько я понял, понимается десятилетие


Теги: , , , , , , , ,
Рубрика: Новости, Программное обеспечение, Публикации, Рынок чтения, Сопутствующие технологии

Комментариев нет

Sony PRS-950 как шаг к идеалу

Опубликовано 24 января 2011

Gopal (Sony Reader PRS-950, или Поиск идеального ридера продолжается) попытался не столько дать обзор этого устройства, сколько попытался сравнить его с  предыдущей моделью (Sony PRS-900) ридера с нестандартным экраном (7″ диагональ, вытянутого экрана, рассчитанного на чтение двух страниц одновременно в ландшафтной ориентации) и с классической Kindle III.

Интересен, прежде всего, набор критериев для сравнения. У каждого, конечно, набор свой и соответствует он своим потребностям, но мне был интересен и этот набор критериев и оценки на его основе


Теги: , , , , , ,
Рубрика: Исследования рынка, Новости, Обзоры, Специализированные устройства для чтения е-книг

Комментариев нет

Метрика («мера крутизны») для текста

Опубликовано 4 января 2011

Возможность «измерить» некую метрику (по которой затем можно было бы ОБЪЕКТИВНО сравнивать тексты) – это голубая мечта библиотекарей, для которых объективность оценки и отбора текстов для помещения в фонд – профессиональная необходимость. То же самое касается специалистов по НТИ. А уж как бы сие помогло при составлении рейтингов сетевых ресурсов (в т.ч. соц. сетей, блогов и.п. «дванольной» самодеятельности)…

Все известные мне метрики научных текстов (художественные явно не годятся для применения метрики и эта непригодность может рассматриваться как «родовой признак» худ. лита) базируются на идее старого доброго Science citation index (индекс цитирования: рейтинг тех, кто на тебя ссылается пересчитывается в твой рейтинг).

Все остальные метрики – не более, чем экспертные оценки, которые (при всей интересности мнения экспертов) страдают и от произвола при выборе (формировании) команды экспертов и от центропупкизма оценок экспертов и от специфических технологий интеграции мнений экспертов.

LifeHacker (КИП и ОПИ — субъективная оценка книг) предложил один из таких субъективных критериев (цитирую целиком):

В продолжение статей о книгах и чтении я хотел бы поделиться способом измерения полезности книг. Я постараюсь рассказать о том, как можно определять для себя насколько та или иная прочитанная книга была хороша.

Разумеется, у каждого есть свои критерии определения «крутости» книг. Кому-то нравится слог, некоторые без ума от картинок и иллюстраций (такие люди любят чтобы их было побольше), другие оценивают книгу так называемым «послевкусием». Однако все это достаточно субъективно и мало подходит к оценке полезных книг (к коим я отношу психологические, философские издания и книги о саморазвитии).

Такие книги удобно оценивать количество полезных идей и их относительной плотностью на страницу.

Количество полезных идей подсчитать очень просто. Когда, читая книгу, вы вдруг расплываетесь в невидимой (или видимой) улыбке, понимаете что вас впечатлила фраза или идея, высказанная автором, вы можете смело ставить книжке «+1». Ставить плюсадин можно прямо на полях книги (некоторые загибают при этом уголок странички). Суммировать можно не только идеи, но вообще все места, события, примеры и все-все, что вызвало у вас интерес. Если вы захотели запомнить или процитировать то-то из книги — это явный «+1».

После того, как вы прочтете всю книгу — подсчитайте плюсики. Их сумма и будет количеством полезных идей (назовем этот параметр КПИ).

Относительная плотность идей — это отношение количества полезных идей (КПИ) к количеству страничек в книге. Этот параметр показывает концентрацию идей. Другими словами, если в одной книге на 300 страниц всего 30 полезных идей (по одной идее на кажде 10 страниц), а во второй — 70 идей на 100 страничек (почти по одной идее на страничке), то понятно, какая книжка круче и полезнее.

Попробуйте определять полезность книжки таким способом, и вы быстро поймете, что все книги разные, и вы можете чувствовать эту разницу. Между прочим, эти же параметры можно применять, например, к выступлениям на конференциях (количество идей в минуту), блогах (количество крутых идей на 100 постов) и так далее.
_____________________________

Рекомендую упомянутые автором статьи:

______________________________
При всей интересности данного подхода он, конечно, насквозь субъективен. Конечно, современные ридеры (и их программные аналоги) позволяют к каждой книге собрать подборку цитат с комментариями, которая может служить базой для определения метрики.

Однако, отбор цитат субъективен. Включать ли в ментрику все цитаты или только цитаты «по делу» (отбрасывая, например, элегантные анекдоты, исторические и культурные реминисценции и т.п. — неясно, правда, как отделить одно от другого). Неясно также как учесть ценность ОПИ. Известный библиотечный парадокс – студенты просят СТАРЫЕ издания учебников, в которых ОПИ ниже, а подробного «разжёвывания» и примеров больше. Важно и то, в каком порядке читались книги. Если сначала прочитать «занимательную математику» Перельмана (раздел по «пирамидальным» задачам), то книга по «раскрытию сути» пирамидальных схем бизнеса и мошенничества полезных идей не даст или даст минимально…

Т.о. важной составляющей «объективности» (главным образом – сравнимости) результатов является применение одного единственного «измерителя»  (единственного библиографа или группы библиографов с единым обучением и контролем/коррекцией результатов).

Главное, что здесь важно (и интересно для меня) – применение ридеров для сбора цитат с комментариями. Ясно, что эти цитаты и эти комментарии не должны пропадать втуне, а должны становиться основой для создания вторичных библиографических продуктов (обзоров, рекомендательных списков и т.п.


Теги: , , , , , , , , ,
Рубрика: Web.0 (пользовательский контент), Контент хранимый в "облаке", Новости, Публикации, Цифровой контент, Цифровой контент. Прочее, Цифровой контент. е-газеты и е-журналы, Цифровой контент. е-книги

Комментариев нет

Попытка классификации ридеров

Опубликовано 8 августа 2010

Вопрос классификации устройств – это всегда вопрос выбора. Поэтому, на мой взгляд, интересна предложенная the-ebook (Средний класс) система классификации. Здесь интересен и авторский подход и, как всегда, комментарии. Я бы (с учётом опыта ответов на вопрос «какой ридер посоветуешь купить для…) предпочёл бы классификацию «от пользователя». Делим пользователей на несколько (хотел бы я знать какие) сравнительно однородных групп существующих и потенциальных пользователей, смотрим требования каждой группы к конкретному свойству (возможности, функции, цене, наличию и уровню сервиса и тех. поддержки). У каждой группы – свой набор приоритетов и для покупателя последовательность выбора должна сводиться к отождествлению себя с конкретной группой, выявлению требований, рассмотрение которых обязательно и крайне желательно и анализу списка предложения по важным критериям…
Понятно, что это – идея, которая требует глубокой маркетинговой проработки

И, возможно, главное. К сожалению, попытка дать некий единый рейтинг (обычно это набор числовых показателей и весовых коэффициентов) заранее обречён. К сожалению, такой рейтинг бесполезен даже при идеально честной оценке рейтингообразующих показателей (у каждой группы пользователей свои критерии и свои «веса»). Опыт рейтингов показывает, что за любым рейтингом стоят конкретные интересы по продвижению конкретных устройств. Понятно, что именно под эти цели «подгоняются» и сами критерии и их весовые коэффициенты


Теги: , , , , ,
Рубрика: Исследования рынка, Новости, Обзоры, Специализированные устройства для чтения е-книг

Один комментарий

Соберите PDF книгу из нужных вам материалов Wikipedia

Опубликовано 21 апреля 2010

Если вы часто читаете Wikipedia и любите собирать из нее материалы для дальнейшего прочтения или распечатки, то есть способ из собранных статей собрать замечательную PDF книгу (Рецепт от LifeHacker)


Теги: , , ,
Рубрика: Web.0 (пользовательский контент), Новости, Публикации, Рынок чтения, Форматы и их конверсия, Цифровой контент

Комментариев нет

еkniga rss

Ежедневник

Июль 2020
Пн Вт Ср Чт Пт Сб Вс
« Фев    
 12345
6789101112
13141516171819
20212223242526
2728293031  

Архив

Рубрикатор

free counters
 
 

Рейтинг блогов

Рейтинг блогов