Рейтинги по сдвинутым выборкам
Опубликовано 24 декабря 2013
Существует уйма критериев, которые нельзя использовать при принятии решений, несмотря на их вычислимость и объективность.
Классический пример – ЕГЭ – некий набор балов (и вычислим и объективен), который ничего не говорит о знаниях выпускника, а лишь об умении сдавать экзамен по ЕГЭ. И если принимать в ВУЗы будем по ЕГЭ, то получим не профессионалов, а ЕГЭкнутых придурков, не способных ДУМАТЬ самостоятельно, но способных правильно отвечать на конечный список заранее известных вопросов. Хотя, конечно, какую-то «информацию к размышлению» мы получаем и от сдачи ЕГЭ. Например, информация о неожиданно высоком уровне сдачи ЕГЭ в отдельно взятом регионе позволяет предположить технический взлом и/или коррупцию…
К той же категории относятся псевдосоциологические рейтинги по сдвинутым выборкам. Понятно, что ответы посетителей определённого сайта на конкретные вопросы и объективны и проценты ответов вычислимы без ошибок, но меряют эти ответы только мнение посетителей конкретного сайта (да ещё очень часто не всех посетителей, а только тех, кто захотел принять участие в опросе). Понятно, что относительно генеральной совокупности такая выборка сильно сдвинута и переносить результаты с выборки на генеральную совокупность нельзя. Хотя, конечно, какую-то «информацию к размышлению» мы получаем. Результаты по сдвинутым выборкам позволяют лучше формулировать гипотезы для проверки их при исследовании по правильным выборкам
Вот пример. «Биржевый лидер» сообщил, что (Определены самые популярные бренды электронных книг). При этом под электронной книге понимается (в основном) устройство для чтения е-книг. В трёх случаях происходит подмена. Amazon и B&N – это отнюдь не поставщики ридеров, а поставщики (в первую очередь) контента (ридеры тоже поставляются, но не это основной бизнес). Аналогично, PocketBook – это поставщик не только ридеров (хотя это их основной бизнес), но и контента. А уж говорить о Sony как о поставщике ридеров… Ридеры для них хорошо если 1% выручки, хотя, конечно, фирма является одним из пионеров и этого сегмента рынка.
Посмотрим на рейтинги поближе:
Для определения популярности производителей электронных книг аналитики «Биржевого лидера» составили список групп, которые посвящены одному конкретному производителю, и отсортировали его по количеству участников в группах.
Понятно, что мнение участников соц. сетей сдвинуто относительно мнения всех граждан. Ясно и то, что мнение публики в сети «Однокласники» отнюдь не соответствует мнению даже всех участников всех соц. сетей. Ясно и то, что количество участников в ОДНОЙ группе никак не говорит о мнении даже конкретной сети.
Но уж совсем весело – как отбирали группы. Посмотрите скриншоты: по PocketBook и Prestigio речь идёт о группах ФИРМ, а по Sony речь идёт о группе ПРОДУКТА и не ридера, а фотоаппаарата:
Процитирую информацию про специализацию:
Согласно данной таблицы, самым популярным производителей электронных книг в «Одноклассники.ру» стала фирма «PocketBook», в группе которой насчитывается 13363 участника. Фирма производит как классические электронные книги со специальными чернилами E-ink, так и мультимедийные электронные книги с дисплеями TFT.
На втором месте по популярности оказалась компания «Sony» (8368 участников). Фирма занимается производством не только электронных книг, но и фотоаппаратов, бытовой техники, компьютеров и всех современных девайсов, которые помогают сделать жизнь лучше.
Тройку лидеров по популярности среди производителей электронных книг в соцсети «Одноклассники» занимает фирма «Prestigio», в группе которой насчитывается 2752 участника. Это бренд цифровой техники, занимающейся разработкой и продажей навигационных систем, автомобильных регистраторов и планшетных компьютеров, а так же электронных книг и множества компьютерных аксессуаров.
Попытка сравнивать фирму с узкой специализацией (PocketBook) с фирмой с расширенной специализацией (Prestigio) с одним из продуктов (фотоаппарат, а не ридер Sony) диверсифицированной фирмы должна быть признанной заведомо неприемлемой. К тому же, сильно сомневаюсь я, что у каждой из фирм в соц. сети «Однокласники» существыует только одна группа… Поэтому, на мой взгляд, данный рейтинг непригоден даже для того, чтобы определить насколько успешно работают в конкретной соц. сети представители конкретных фирм, а уж пытаться с его помощью оценивать популярность ридеров и вовсе неразумно.
Второй рейтинг просто смехотворен. Взяли запросы к Яндекс по наименованиям фирм и получили явное доминирование Sony просто потому, что у фирмы популярнее бренд и на порядки больше спектр производимых устройств:
Понятно, что у Prestigio (у которого спектр продукции куда шире, чем у PocketBook) запросов к Яндексу больше, чем у Pocketbook. Ещё раз повторюсь, что поиск на Amazon или на Barnes&Noble свидетельствуют (в первую очередь) о популярности фирм как поставщиков контента, а не как поставщиков устройств…
Третий критерий (популярность запроса «электронная книга» среди россиян в поисковой системе Яндекс) показывает скорее путаницу в понятии «электронная книга» и популярность халявного контента, чем популярность ридеров:
Смешно выглядит попытка отследить динамику запросов «электронная книга» к Яндекс во времени. Понятно, что частота запросов колеблется, но, без сопутствующих временных рядов тех событий которые могли бы стать причиной изменений, это не более чем подтверждение умения автора статьи получать подобные данные от Яндекс…
Четвертый критерий: жители каких стран СНГ наиболее часто вводят запрос «электронная книга» в поисковой системе Яндекс также вызывает вопросы. Понятно, что в СНГ не входит вышедшая из него Грузия, но туда никак не может входить не вступавшая в СНГ Абхазия. Да и сильно я, честно говоря, сомневаюсь в наличие у Абхазии собственных iP-адресов. Хорошо хоть хватило ума разделить количество запросов на население и получить частоту запросов на тысячу жителей:
Трудно сказать как такое оценивать. Если У России в целом частотность запросов раз в пять выше, чем у Москвы и Области (где она, примерно, как в Абхазии), то свидетельствует ли это о слабом проникновении Интернет в Абхазию (может быть из-за этого количество запросов ниже?). Плохо верится и в то, что интерес к чтению и электронной книге в Москве и Области в разы ниже, чем в целом по России…
И последний критерий – критерий, который якобы меряет эффективность PR:
Для определения эффективности пиара производителей электронных книг в сети Интернет аналитики «Биржевого лидера» просчитали соотношение количества участников в группе соцсети «Одноклассники», которые посвящены конкретным маркам, и количества запросов по ним в поисковой системе Яндекс за последний месяц.
В данном рейтинге не будут принимать участие те производители, количество запросов по которым в поисковой системе Яндекс не превысило одной тысячи.
Взяли два независимых параметра (понятно, что участие в группе «Однокласники» делает ненужным поиск в Яндексе нужная информация есть в группе) и поделили один на другой:
Даже если предположить, что количество запросов является следствием наличия участников в одной из групп в одной из соц. сетей, то в качестве критерия следует брать обратную величину. И фирма Wexler, у которой наличие в группе всего 18 человек дало св. 100 тысяч поисков товара в Яндекс, становится лидером. Хотя, повторюсь, данные цифры никак не связаны…
Глядя на эти экзерсисы людей, которые считают себя БИРЖЕВЫМИ ЭКСПЕРТАМИ, понимаешь, что верить биржевым прогнозам (этих «экспертов» или всех «экспертов», которые публикуются на данном ресурсе) невозможно
Ссылаться нужно на первоисточник
Опубликовано 20 июня 2012
И это вопрос не только этики. Речь идёт и о точности. Если первоисточник – один, то речь идёт об одном мнении (если первоисточник уважаемый и проверенный, то о надёжном мнении), а если первоисточников много, то надо разбираться какой полнее и точнее и на какой источник можно положиться. И очень неприятно, когда анализ показывает, что «альтернативный» источник – это пересказ уже обработанного источника. И вся работа по анализу и сравнению пойдёт «псу под хвост». Вот пример:
SmartMarketing в апреле 2012 опубликовал отчёт за 2011 год (Объем российского рынка электронных книг (EBR) в 2011 г.). На его основе я сделал перепост в мае 2012 (Рынок устройств чтения е-книг в 2011 году) с явной ссылкой на первоисточник. И вдруг в середине июня 2012 обнаруживаю материал (Рынок электронных ридеров России). Данные знакомы и похожи на правду, а ЯВНОЙ ссылки на первоисточник нет. Чуть не опубликовал материал о СВЕЖИХ данных за 2011 год, но вовремя увидел фразу «данные аналитической группы SmartMarketing» и всё стало на своё место. автор забыл дать ЯВНУЮ ссылку и не более того.
И есть, на мой взгляд, ещё одна причина давать явную ссылку. Первоисточник тратит уйму времени на подготовку материала, а те, кто пользуются материалом, время и силы экономят. Хочется хоть как-то «отплатить» первоисточнику. И вот тут-то и пригодится ссылка на первоисточник. Каждая ссылка повышает «индекс цитирования» источника. Именно поэтому ссылку надо давать на первоисточник, а не на перепост (можно дополнительно дать ссылку на ресурс, где вы узнали про наличие данных и их первоисточник, но ссылку на первоисточник надо давать обязательно)
Пострелиз с электронной буквы
Опубликовано 9 февраля 2012
В дополнение к моему посту от 08 февраля 2012 (Электронная Буква СЛУЧИЛАСЬ!) о том, что премию вручили, но (из-за сбоя) сайт показывает результаты предыдущего года.
Появился пострелиз с вручения премии, который с благодарностью публикую:
Полноты ради покажу фотографию с презентации фирменного ридера «Litres-Touch».
Всё ещё надеюсь, что и презентация результатов премии (её показывали в ходе мероприятия) и презентация ридера станут доступны после восстановления сайта премии
Есть (репортаж Литрес)
Электронная Буква СЛУЧИЛАСЬ!
Опубликовано 8 февраля 2012
В дополнение к моему посту от 06 февраля 2012 («Электронная буква» за 2011 «висит») о том, что вручение премии состоится, а сайт премии «висит»
Вчера в 20-00 прошла церемония вручения премии «Электронная буква». Стало ясно, что «висел» сайт из-за того, что там меняли контент. Теперь на сайте «Электронная буква» ДОЛЖНЫ БЫТЬ показаны результаты премии за 2011 год.
Но «должны» не означают «показаны».
По ссылке «Номинации» показаны Номинации прошлой премии (за 2010 год). Их явно меньше, чем номинаций в премии за 2011 год. В частности номинации «Самое объективное СМИ, пишущее про е-книги» вообще нет, а в номинации «Лучший ридер» нет ридеров 2011 года (в т.ч. нет победителя – PocketBook 611).
Интересно, что на головной странице премии показаны новые номинации:
Но результаты, как-то «не того»… В номинации СМИ нет всех номинантов 2011 года. Первым идёт прошлогодний победитель, а победитель 2011 (слава богу, хоть есть) Pro-books скромно «стоит» где-то в середине. В «Аудио-книге» нет победителя-2011 (Там что-то вроде «Как поставить его на место» победило). Среди ридеров тоже нет победителя в номинации 2011 (PocketBook 611).
На сайте (Литрес) на 16-30 я отчёта по премии тоже не нашёл… А удивительно. И премия их и публикация номинантов и победителей должна продажи подстегнуть…
________________
Победитель в номинации «СМИ, пишущие про е-книги» стал Pro-books. Он и опубликовал отчёт о церемонии и список победителей. Есть перечень номинаций, но полный список номинантов предлагается искать на сайте премии…
________________
Из Комментов. От представителя Литрес:
К сожалению, из-за технического сбоя на сервере вся недавно обновленная информация исчезла. Вы видите информацию за 2010 год. Сейчас сотрудники ЛитРес обновляют сайт актуальной информацией о церемонии вручения премии «Электронная буква 2011″. В скором времени обновленный сайт будет действовать в полноценном режиме.
Та-что ждём-с…
Выбор редактора The-ebook за 2011
Опубликовано 3 января 2012
В дополнение к моему посту от 25 декабря 2011 (Новый рейтинг от The-ebook) про рейтинг посетителей The-ebook.org
Рекомендую еще один рейтинг из того же источника (Выбор редактора The-ebook: «Лучшее в 2011 году»). Не скажу, что целиком согласен с автором, но устройства отобраны действительно интересные
_____________________
Я не хотел. Оно ТАК само в комментах получилось (цитирую):
2 комментария:
audioknigi: 3 января 2012,
Добрый день!
а я обычно не пользуюсь редакторами.
Предпочитаю книги в пдф вормате. Очень удобно.
Или аудиокниги скачиваю. Пользуюсь в основном вот этим сайтом http://Опущено.at.ua
ekniga: 3 января 2012
Я тоже обычно не пользуюсь редакторами для чтения е-книг…
Но здесь речь идет о человеке. О редакторе сайта the-ebook.org и о том какие устройства (приспособленные для чтения е-книг) он выберет на свой вкус.
Вы меня извините, но я совсем не собирался создавать шедевр для BASH… Сразу отмечу, что речь идет не о «корзине для мусора» на кухне, а о сетевом ресурьсе околокомпьютерного юмора Bash.org.ru
Надеюсь сие не есть пример удачного таргетинга для спам-рекламы
Новый рейтинг от The-ebook
Опубликовано 25 декабря 2011
В дополнение к моему посту от 19 декабря 2011 про (Новый способ формирования рейтинга от The-ebook) в формате «чемпионата». Теперь The-ebook подвёл (Итоги «Чемпионата The-eBook 2011»):
В номинации ридеры:
- B&N Nook Touch
- Sony Reader Touch PRS-T1
- PocketBook Basic 611
В номинации медиаридеры:
- B&N Nook Color
- Explay HD Book II
- Qumo Fresh
В номинации планшеты:
- PocketBook A10
- Archos 10.1 Internet tablet
- Archos
Новый способ формирования рейтинга от The-ebook
Опубликовано 19 декабря 2011
Рейтинг ведётся с «прошлого тысячелетия» по откликам посетителей сайта. Процедура подготовки нового рейтинга через «парные» противостояния» на мой взгляд спорна, но интересна и применимость процедуры и результат применения.
Процедура описана (http://www.the-ebook.org/?p=10723)
О результатах сообщу обязательно
Метрика («мера крутизны») для текста
Опубликовано 4 января 2011
Возможность «измерить» некую метрику (по которой затем можно было бы ОБЪЕКТИВНО сравнивать тексты) – это голубая мечта библиотекарей, для которых объективность оценки и отбора текстов для помещения в фонд – профессиональная необходимость. То же самое касается специалистов по НТИ. А уж как бы сие помогло при составлении рейтингов сетевых ресурсов (в т.ч. соц. сетей, блогов и.п. «дванольной» самодеятельности)…
Все известные мне метрики научных текстов (художественные явно не годятся для применения метрики и эта непригодность может рассматриваться как «родовой признак» худ. лита) базируются на идее старого доброго Science citation index (индекс цитирования: рейтинг тех, кто на тебя ссылается пересчитывается в твой рейтинг).
Все остальные метрики – не более, чем экспертные оценки, которые (при всей интересности мнения экспертов) страдают и от произвола при выборе (формировании) команды экспертов и от центропупкизма оценок экспертов и от специфических технологий интеграции мнений экспертов.
LifeHacker (КИП и ОПИ — субъективная оценка книг) предложил один из таких субъективных критериев (цитирую целиком):
В продолжение статей о книгах и чтении я хотел бы поделиться способом измерения полезности книг. Я постараюсь рассказать о том, как можно определять для себя насколько та или иная прочитанная книга была хороша.
Разумеется, у каждого есть свои критерии определения «крутости» книг. Кому-то нравится слог, некоторые без ума от картинок и иллюстраций (такие люди любят чтобы их было побольше), другие оценивают книгу так называемым «послевкусием». Однако все это достаточно субъективно и мало подходит к оценке полезных книг (к коим я отношу психологические, философские издания и книги о саморазвитии).
Такие книги удобно оценивать количество полезных идей и их относительной плотностью на страницу.
Количество полезных идей подсчитать очень просто. Когда, читая книгу, вы вдруг расплываетесь в невидимой (или видимой) улыбке, понимаете что вас впечатлила фраза или идея, высказанная автором, вы можете смело ставить книжке «+1». Ставить плюсадин можно прямо на полях книги (некоторые загибают при этом уголок странички). Суммировать можно не только идеи, но вообще все места, события, примеры и все-все, что вызвало у вас интерес. Если вы захотели запомнить или процитировать то-то из книги — это явный «+1».
После того, как вы прочтете всю книгу — подсчитайте плюсики. Их сумма и будет количеством полезных идей (назовем этот параметр КПИ).
Относительная плотность идей — это отношение количества полезных идей (КПИ) к количеству страничек в книге. Этот параметр показывает концентрацию идей. Другими словами, если в одной книге на 300 страниц всего 30 полезных идей (по одной идее на кажде 10 страниц), а во второй — 70 идей на 100 страничек (почти по одной идее на страничке), то понятно, какая книжка круче и полезнее.
Попробуйте определять полезность книжки таким способом, и вы быстро поймете, что все книги разные, и вы можете чувствовать эту разницу. Между прочим, эти же параметры можно применять, например, к выступлениям на конференциях (количество идей в минуту), блогах (количество крутых идей на 100 постов) и так далее.
_____________________________
Рекомендую упомянутые автором статьи:
- Читаем правильно – 7 советов – из LifeHacker
- Как правильно покупать книжки – из LifeHacker
______________________________
При всей интересности данного подхода он, конечно, насквозь субъективен. Конечно, современные ридеры (и их программные аналоги) позволяют к каждой книге собрать подборку цитат с комментариями, которая может служить базой для определения метрики.
Однако, отбор цитат субъективен. Включать ли в ментрику все цитаты или только цитаты «по делу» (отбрасывая, например, элегантные анекдоты, исторические и культурные реминисценции и т.п. — неясно, правда, как отделить одно от другого). Неясно также как учесть ценность ОПИ. Известный библиотечный парадокс – студенты просят СТАРЫЕ издания учебников, в которых ОПИ ниже, а подробного «разжёвывания» и примеров больше. Важно и то, в каком порядке читались книги. Если сначала прочитать «занимательную математику» Перельмана (раздел по «пирамидальным» задачам), то книга по «раскрытию сути» пирамидальных схем бизнеса и мошенничества полезных идей не даст или даст минимально…
Т.о. важной составляющей «объективности» (главным образом – сравнимости) результатов является применение одного единственного «измерителя» (единственного библиографа или группы библиографов с единым обучением и контролем/коррекцией результатов).
Главное, что здесь важно (и интересно для меня) – применение ридеров для сбора цитат с комментариями. Ясно, что эти цитаты и эти комментарии не должны пропадать втуне, а должны становиться основой для создания вторичных библиографических продуктов (обзоров, рекомендательных списков и т.п.
3 из 11 это «кое что»
Опубликовано 4 января 2011
DeepApple (Десятка лучших отечественных приложений для iPhone образца 2010 года) опубликовала «десятку» из ОДИННАДЦАТИ ЛУЧШИХ приложений для iPhone.
Всё «по чесноку». Десять приложений есть в App Store, а одно доступно только после Джелбрейка и, строго говоря, тем, что Apple признаёт приложением, не является.
Радует, что 3 из 11 – это е-книги с улучшенной функциональностью (text 2.0, enchanced e-books. е-книги-приложения, улучшенные е-книги, интерактивные е-книги и т.п. определения)
___________________________
Если добавить приложение 3-мернаой энциклопедии, то результат и вовсе 4 из 11…
С новым 2011 годом
Опубликовано 1 января 2011
Ну вот…
И ещё один год прошёл .
На картинке итоги. Поскольку RU=75% от общего количества посещений, то общее количество посещений составило около 400 000. Через год посмотрим сколько добавилось
Спасибо, всем, кто пользуется этим блогом. Жду Вас здесь и в следующем году