Блог, посвященный е-книгам

Сильно «искусанный» интеллект

Опубликовано 15 апреля 2015

Полный перепост материала  РИАН:

Российская система интеллектуального анализа текстов выходит на рынок
13:2215.04.2015 (обновлено: 13:23 15.04.2015)683110

В Объединенной приборостроительной корпорации сообщили, среди задач, которые способен решать лингвистический процессор Ontosminer – поиск необходимых сведений, мониторинг СМИ, анализ больших массивов данных, систематизация документооборота и информации.

МОСКВА, 15 апр — РИА Новости. Первую российскую систему интеллектуального анализа текстов и данных выводят на рынок, сообщили РИА Новости в Объединенной приборостроительной корпорации («ОПК», входит в Ростех).

Как пояснили в «ОПК», сфера возможного применения лингвистического процессора Ontosminer, совместной разработки с российской компанией «Авикомп Сервисез», очень широка. Среди задач, которые он способен решать — поиск необходимых сведений, мониторинг СМИ, анализ больших массивов данных, систематизация документооборота и информации (статистической, научно-технической, правовой, медицинской и т.д.).

«Это еще одна ступень на пути к созданию искусственного интеллекта. Мы научили машину понимать и анализировать письменную речь, извлекать из нее необходимые факты и смыслы», — отметил директор департамента инновационного развития «Объединенной приборостроительной корпорации» Александр Калинин.

Система позволяет компьютеру «чувствовать» морфологию, синтаксис языка, «понимать» семантику отдельных слов и текста в целом. В качестве эксперимента с сегодняшнего дня тестовая версия программы открыта для вузов и научно-исследовательских учреждений в бесплатном режиме. Заказчиками системы также выступает ряд государственных ведомств.

«В отличие от традиционных поисковых систем в качестве запроса здесь выступает не отдельное слово, а целый документ (отрывок текста, статья и т.д.), после загрузки которого система выдает все, что есть на заданную тему в информационном пространстве», — пояснили в «ОПК».

В настоящий момент, отмечают в корпорации, в «голове» у лингвистического процессора — десятки миллионов документов. Планируется довести их число до нескольких сотен миллионов

Если быть честным то не ясно даже идёт ли речь о чём-то вроде Базы данных, куда вносятся тексты с семантической разметкой (которую проводит неведомо кто и неведомо как) или речь идёт о ПО, которое позволяет владельцу (если ПО станут продавать)  самостоятельно собирать большие массивы данных с самостоятельным извлечением из них семантики силами ПО без персонала владельца базы


Теги: , , , , , , ,
Рубрика: Data Mining, Агрегация и реферирование материалов, Контент хранимый в "облаке", Новости, Проекты, Сопутствующие технологии, Цифровой контент, Цифровой контент. Прочее, сервисы

Один комментарий

еkniga rss

Ежедневник

Апрель 2019
Пн Вт Ср Чт Пт Сб Вс
« Окт    
1234567
891011121314
15161718192021
22232425262728
2930  

Архив

Рубрикатор

free counters
 
 

Рейтинг блогов

Рейтинг блогов