7. Атрибуция сообщений

We use cookies. Read the Privacy and Cookie Policy

Задача анализа сообщений на семантическом уровне является сложной даже при работе с данными первичных источников информации (данными, полученными из каналов внутрисистемных взаимодействий). Однако сохраняющаяся в последние годы тенденция к сокращению числа сообщений первичных источников привела к необходимости развития и совершенствования методологии их анализа.

При работе с данными вторичных источников информации особую актуальность приобретает комплекс мероприятий, направленных на установление контекста информационного взаимодействия, его характеристик его участников, их ценностной ориентации и вероятных целей, преследуемых ими при генерации ими тех или иных сообщений. Для решения этой задачи аналитик должен располагать значительно большим объемом сведений об условиях получения информации, обеспечивающим возможность восстановления ситуативного контекста акта коммуникации (информационного взаимодействия). Сообщение, как таковое, или массив сообщений перестает быть тем единственным объектом, на котором концентрируется внимание аналитика: самой технологией их сбора, предварительной обработки и накопления должна быть предусмотрена возможность восстановления на этапе анализа ситуативного контекста генерации данного сообщения и контекста информационного взаимодействия.

Очевидно, что без дополнительных данных («данных о данных») контекст восстановить крайне сложно и возможно лишь в экстремальных случаях. Чтобы убедить вас в справедливости этого замечания, приведем фрагмент модельного сообщения, для которого задача восстановления контекста без привлечения дополнительной информации действительно имеет решение: «Сегодня, 18 мая 2002 года, сидя в московском офисе газеты «Агентство ОБС», я, корреспондент Холмс И.И., по заказу генерального директора ООО «Наветы» Клевещенко Г.П. сочиняю эту статью-расследование. Название статьи«Не могу молчать!»неслучайное: вот уж три года, как…». Согласитесь: своеобразный стиль, а уж откровенность… тянет на еловый венок — подобное сообщение едва ли встретишь в СМИ.

Еще одним аргументом в пользу необходимости атрибуции поступающих сообщений является то, что реальная ценность сообщения при ведении ИАР не всегда может быть оценена при первом прочтении. Очень часто случается так, что на момент получения сообщение не может быть отнесено к классу релевантных тематике исследований. Причин тому масса: начиная с того, что сообщение может быть действительно нерелевантно текущей тематике исследований, и, заканчивая тем, что связь данного сообщения с тематикой исследований не может быть установлена в силу неполноты или неадекватности модели исследуемой системы (что часто случается на начальном этапе исследований). Но ведь сообщение, тем не менее, прочитано (и проанализировано)… на его интерпретацию затрачены усилия, а относительно его содержания сформулированы некие выводы. Проблема состоит в том, что задача протоколирования этих выводов не имеет технологического покрытия — автоматизации этого процесса не уделяется должного внимания. Считается, что эти трудозатраты неизбежны. Как следствие, при необходимости вовлечения этого сообщения в процесс анализа вся работа проделывается вновь, да и привлечь его к процессу анализа может не всякий аналитик — для этого он должен помнить о самом факте существования такого сообщения.

Естественным выходом из такой ситуации является создание инструментальных средств, обеспечивающих режим автоматизированного протоколирования выводов аналитика при первом прочтении сообщения. Создание таких средств возможно при условии, что автоматизированная система рассматривается в качестве инструмента предобработки сообщений, предлагающей аналитику некий набор версий, подлежащих оцениванию и утверждению им по прочтении некоторого сообщения. Теоретически создание подобных систем не является чем-то невозможным, более того, технологическая база на сегодня способна обеспечить необходимое быстродействие, если задаться реалистичными целями (то есть, не требовать от компьютерной системы стопроцентной достоверности выводов).

Чего же тогда можно требовать от такой системы? Какой ценностью обладает система, которая предоставляет не абсолютно достоверные выводы?

— Польза от такой системы однозначно есть. Для того, чтобы она была полезна, достаточно, чтобы она обеспечивала генерацию ограниченного числа максимально правдоподобных гипотез о значении некоторого комплекса атрибутов на основе проведения анализа формально-логических отношений, выраженных в тексте. Уже в этом случае аналитик получает возможность отбирать те из них, которые наилучшим образом описывают его выводы, полученные экспертным путем. Это не только экономия времени на протоколирование, но и возможность формально логической экспертизы утверждений, выраженных в тексте.

Таким образом, окончательно убеждаемся в необходимости учета ряда специфических атрибутов сообщения, содержащих дополнительную информацию о контексте информационного взаимодействия и результатах его анализа. Остается определить, какие именно атрибуты целесообразно включить в протокол анализа сообщения. Вероятно, было бы лучше вывести перечень атрибутов на основе исчерпывающего рассмотрения универсального алгоритма обработки сообщения (это можно сделать, но тогда аргументация выбора отнимет много страниц, а это нарушит замысел книги). Поэтому здесь мы ограничимся максимально компактным перечнем, а пример разбора поместим в приложении 3.

Прежде, чем перейти к рассмотрению этого перечня, заметим лишь, что ситуативный контекст сообщения, как правило, уникален, и поэтому значения атрибутов содержатся на разных уровнях семантической иерархии сообщения и присутствуют в различных комбинациях. В ходе анализа сообщения его потребитель (аналитик) неосознанно проходит несколько циклов «погружения» в семантическую иерархию сообщения, в результате чего значение одного и того же атрибута могут извлекаться на разных этапах анализа.

Описание основного содержания этапов обработки и анализа сообщений и их условные обозначения (столбец «Идентификатор этапа» — Э-ID) представлены в табл. 4.3, позже эти данные будут использованы при описании распределения атрибутов сообщения по этапам и семантическим классам.

Таблица 4.3 — Содержание этапов обработки и анализа сообщений. Содержание этапа Э-ID Получение физического доступа к среде распространения данных 00 Получение материальной копии массива данных 01 Разбиение массива данных на сообщения по структурным признакам 02 Анализ и согласование форматов представления данных 03 Экспресс-анализ и отбор сообщений (язык, ключевые слова, структурные признаки и идентификационные данные) 04 Структурный анализ сообщения (выделение элементов структурной организации текста) 05 Выделение, категорирование и маркировка метаязыковых конструкций 06 Анализ и восстановление ссылочных отношений 07 Анализ и восстановление временных отношений 08 Анализ и восстановление пространственных отношений 09 Анализ и восстановление функциональных отношений (субъект-объектных, инструментальных и иных) 10 Идентификация ситуационной модели или фрейма, описывающего ситуационный и коммуникативный контекст 11 Анализ и восстановление рефлексийных отношений 12 Анализ эмоциональной компоненты сообщения и соотнесение оценочных суждений с субъектами рефлексии 13 Анализ акцентов внимания субъектов рефлексии 14 Анализ и восстановление логических (причинно-следственных) отношений 15 Выделение и связывание повествовательных стратегий (сюжетных линий), их пространственная и временная синхронизация 16 Выделение релевантных сведений 17 Выявление противоречий 18 Обобщение информации 19

Ниже, в табл. 4.4, приведено основное содержание и обозначения семантических классов атрибутов сообщений (колонка «Идентификатор семантического класса» — С-ID).

Таблица 4.4 — Содержание семантических классов атрибутовсообщений. Семантическая группа С-ID Технология АК: параметры канала информационного взаимодействия 00 Технология АК: параметры инструментария обработки данных 01 Технология АК: адресная и маршрутная информация 02 Технология АК: лексико-синтаксические параметры 03 Системно-реляционные параметры: время 04 Системно-реляционные параметры: пространство 05 Системно-реляционные параметры: морфология 06 Системно-реляционные параметры: информационный обмен 07 Системно-реляционные параметры: процессы 08 Системно-реляционные параметры: энергия 09

Теперь мы можем перейти к рассмотрению атрибутов, вынесение которых на верхний уровень описания сообщения позволит упростить многие задачи, связанные с повторным вовлечением сообщений в цикл ИАР за счет применения средств автоматизации. В приводимой ниже таблице в соответствие атрибутам приведены их семантические классы и этапы обработки сообщения (имеющий желание, да изучит).

Таблица 4.4 — Соответствие атрибутов семантическим классам и этапам аналитической обработки сообщения. Атрибуты С-ID Э-ID Физические параметры носителя 00 00 Идентификационные данные канала или носителя данных 00 00, 01 Интенсивность потока сообщений 00 00 Стоимостные характеристики носителя или стоимость эксплуатации канала 00 00, 01 Способ первичного представления данных 01 03 Правила формализации 01 03, 05 Адресные и идентификационные данные участников АК 02,05 02, 04, 11, 12 Язык представления 03 03 Специфика синтаксических предписаний, используемых в сообщении 03 03, 05, 06 Специфика словаря сообщения 03 04, 05, 06 Время получения данных аналитиком 04 02 Время получения данных источником 04 08 Время события, инициировавшего появление сообщения (ставшего центральной темой) — внутреннее время сообщения 04 06, 08, 12, 14 Пространственная локализация события (физическое, организационное, целевое и иные виды пространства) 05 09, 10, 14 Перечень объектов сообщения 06 10, 12 Перечень неявных объектов сообщения (тех, чье участие подразумевается, но не декларируется) 06 10, 11, 12 Цепочка распространения информации 07 11, 12 Заинтересованные и потенциально заинтересованные потребители 07 00, 1114, 10 Временная и событийная иерархия сообщения (с привязкой к объектам) 04 08, 10, 11, 16 Динамические характеристики процессов, в том числе — процесса распространения информации 04,08,09 08, 10, 11, 16 Координатная и траекторная информация (с привязкой к объектам) 04-09 09-11, 15, 16 Атрибуты С-ID Э-ID Полнота АК и/или сообщения 03 02, 07 Достаточность для интерпретации 03,04-09 07, 15 Локальный коммуникативный контекст сообщения в рамках информационного взаимодействия тех же участников АК 02,06 02, 04, 11 Тематический контекст сообщения в рамках информационного взаимодействия произвольных участников АК (предшествующие и последующие сообщения в рамках данной тематики) 06 02, 04, 11, 14 Ситуационный контекст сообщения 11 Класс источника (первичный или вторичный) 07 11, 12 Класс сообщения (контактное, внутрисистемное, транзитное, межсистемное) 00-09 11, 12 Вид фильтрации сообщения (пассивная или активная) 00-09 12-15 Ценностная ориентация субъекта и объекта 04-09 01, 04, 11-15 Устойчивость системы ценностей 04-09 01, 04, 11-15 Целевая ориентация субъекта/объекта 04-09 01, 04, 11-15 Функциональная группа сообщения (информативная, подкрепительная, нормативно-директивная, запрос, общекоммуникативная, преобразования сознания, эмоционального воздействия) 04-09 01, 04, 11-15 Идентификационные данные и характеристики систем, к которым принадлежат объекты сообщения 04-09 01, 04, 08-15 Характеристика оснований для наличия отношений доверия (в том числе — принадлежность участников АК к единой иерархической системе) 04-09 01, 04, 08-15 Отношения потребления ресурсов в системах участников АК или объектов сообщения 04-09 01, 04, 08-15 Экспертная оценка достоверности сообщений участников АК 04-09 01, 04 Вероятные причины и последствия события 04-09 01, 04, 08-15 Достаточность или необходимость дополнительных условий 04-09 01, 04, 08-15 Возможность или необходимость протекания событий 06,07 01, 04, 08-15 Атрибуты С-ID Э-ID Ожидаемость и расчетное время получения сообщения или свершения события 04-09 01, 04, 08-16 Наличие оттенка модальности в сообщении 03-09 08-15

В приведенном перечне дана лишь базовая совокупность атрибутов, позволяющая осуществлять различные виды автоматизированного связывания сообщений как по «внешним» атрибутам, доступным на этапе получения сообщения, так и по «внутренним» атрибутам, получаемым на этапе семантического анализа. Для специфических же задач анализа и различных организационно-технических систем перечень атрибутов может варьироваться.