Не ограничиваются рассмотренным примером. Это современная, перспективная, динамично развивающаяся от версии к версии система. В ней реализовано много оригинальных идей, благодаря чему поисковая работа ведется более эффективно. Один из примеров нового подхода - возможность получения информационного портрета.
Система «Галактика-ZOOM» в режиме реального времени представляет количественные характеристики имеющейся в базах данных информации по интересующему исследователя запросу. Система формирует своеобразный количественный «срез», который разработчики называют «информационным портретом». Во многом этот подход пересекается с традиционным контент-анализом и с бурно развивающимися в настоящее время научными направлениями text-mining и data-maning, позволяющими получать знания путем анализа количественных характеристик баз данных. Используя толь ко «информационный портрет объекта», можно сразу понять его основные параметры и связанные с ним главные темы, характеристики, особенности, связи и ключевые действующие лица.
Важный элемент системы - фильтры главных тем и возможности группировки главных тем Фильтры задаются специальным списком и ограничивают набор выводимых для анализа слов и словосочетаний при построении информационного портрета, позволяя отсечь все лишнее, относящееся к информационному «шуму». Группировки выполняют задачу объединителей нескольких родственных понятий присваивая им новое имя, которое и фигурирует в дальнейших исследованиях и построениях. Система «Галактика-ZOOM» развивается и постоянно модифицируется. Из последних модернизаций системы интересно рассмотреть возможность проведения кластеризации. В результате этого процесса найденные документы объединяются по определенному принципу в некоторые группы (кластеры). В действующей ныне версии кластеризация производится по общему смысловому критерию. Рассмотрим процесс кластеризации документов, полученных по запросу магнум.
Послушать
отчеты о рыбалке в хорошем качестве.