Блог, посвященный е-книгам

  •  
  • Главная
  • Оценка достоверности сайтов БЕЗ АНАЛИЗА СЕМАНТИКИ

Оценка достоверности сайтов БЕЗ АНАЛИЗА СЕМАНТИКИ

Опубликовано 22 апреля 2009

Я, по наивности, всегда считал, что без семантики (понимания того, что написано) оценить достоверность источника нельзя.

Австрийские исследователи считают, что не только можно, но и нужно. Во всяком случае в статье (компьюлента) Разрабатываются алгоритмы оценки достоверности интернет-сайтов об этом пишут, похоже всерьёз. Алгоритм, якобы, базируется на сравнении материало текстуально с некими эталонными и о делании выводов по результатам…

Во первых, неясно кто и по какой процедуре будет отбирать эталонные тексты и чью точку зрения они будут отражать? Эдак в Иране эталонными возьмут тексты Ахмадинежада и всякие-там "статистически несогласные" с президентом будут выявлены и вычищены…

А во вторых, кто и как без семантики будет решать с каким именно эталонным текстом надо соотносить.
Например как "статистический анализатор" поймет, что материал "Немцов подкрался незаметно" – это про выборы в Сочи? А если материал касается Иванова (у нас их только в верхних эшелонах публичных политики несколько), то как без семантики определить с текстом про какого именно Иванова надо сравнивать. И как быть с абсолютно достоверным милицейским протоколом про "Гражданин Иванов нарушал на тумбу. После многочисленных увещеваний с моей стороны прекратил, но не потому, что осознал, а потуму, что иссяк"? Отсеять как марающее светлый облик?…

И, наконец, в третих. Опыт подгонки сайтов и документов под критерии рейтинговой статистической оценки поисковых машин показывает, что "в топ" попадают отнюдь не самые релевантные и не самые лучщие материалы… Что, авторы публикуемых материалов не сумеют оформить "подгонку" под требования анализатора? Подгонят….

Неа, робяты. Без семантики это всё "не пляшет".
А кто сегодня может выполнять функцию семантического анализатора достоверности?
Человек, которого этому учили. Библиотекарь называется
Так что, с ростом "масштабов бедствия" под названием "Информационные ресурсы" роль библиотекарей будет только возрастать именно в этом направлении, а вот их роль в качестве "приставки" при системе выдачи-приеме книг будет (я надеюсь), наоборот снижаться (в т.ч. за счёт работы с е-книгами)…
Представляете, лет эдак через много, специалист по семантическому анализу (бывший библиотекарь) будет звучать не менее гордо, чем сейчас "банкир"… И оплачиваться будет не хуже…
Как это у Некрасова (если не ошибаюсь):
"Жаль только – жить в эту пору прекрасную уж не придется ни мне ни тебе"….

Рубрика: Новости



3 комментария:

  1. Как оценить достоверность результатов поиска? « Не волнуйтесь, я сейчас все объясню!:
    14 июля 2011, 10:24

    [...] [...]


  2. Планета е-книг » Blog Archive » Снова о семантике и библиотекаре:
    14 июля 2011, 16:32

    [...] далёком 2009 я сделал пост от 22 апреля (Оценка достоверности сайтов БЕЗ АНАЛИЗА СЕМАНТИКИ). в котором проанализировал попытки автоматического [...]


  3. Как оценить достоверность результатов поиска? | Британские ученые доказали…:
    20 октября 2012, 22:51

    [...] [...]


Оставить свой комментарий

еkniga rss

Ежедневник

Апрель 2009
Пн Вт Ср Чт Пт Сб Вс
« Мар   Май »
 12345
6789101112
13141516171819
20212223242526
27282930  

Архив

Рубрикатор

free counters
 
 

Рейтинг блогов

Рейтинг блогов