Онлайн система количественной оценки толерантности текстов
Санкт-Петербург, ул Миллионная д. 5, СЗТУ, кафедра ВМКСиС
Предложения по вопросам сотрудничества: michael@okavod.ru


Внимание! Система работает в мемориальном режиме. Последняя разработка версии системы находится по адресу: wisca.ru
| | |
О системе

Автор: Марунин В.Н.
2008 год

По оценкам авторитетных международных источников количество информации в Мире удваивается за семь лет. Возрастающая динамика роста информационных объемов, ставит актуальные вопросы по разработке специализированных методик по автоматизации ее оценочных показателей (качество изложения текста, научная объективность, толерантность, безопасность и др.).
Трудности точного отображения данных показателей в языке общеизвестны и сложно вербализуются. Оценка представляет собой вербальное, словесное определение свойств и качеств предметов и явлений, выраженное словом или словосочетанием. Высказывание оценки является высвобождением определенного психосоциального напряжения (энергии, устремления, мотива) оценки, возникающего у человека в ответ на собственную потребность или внешний стимул высказать ее в процессе общения.
Проблема, точнее, связка двух проблем - чувств и оценок, - чрезвычайно противоречива и не достаточно исследована. Работы Е.Вольфа, где рассматривается (истинность/неистинность, важность/неважность и т.п.) и З.Эртеля аналично - "жесткие" (всегда, никогда, все, никто и т.п.) и "мягкие" (не всегда, иногда, не все, некоторые и т.п.) и им аналогичные можно рассматривать, как Линейные (одномерные, вырожденные) или Переходные (гегелевские).
В общем виде от зависимости вида связей различаются следующие типы триад:
1. Линейные (одномерные, вырожденные), когда все три элемента расположены на одной оси в смысловом пространстве. Например, 1―10―100 или левые―центр―правые. Структурно они не богаче, чем диады.
2. Переходные (гегелевские), характеризуемые известной формулой тезис®антитезис®синтез. Они провозглашают снятие противоречия, не раскрывая его движущей структуры.
3. Системные (целостные), состоящие из трёх равноправных элементов одного уровня общности. В них каждый элемент может служить мерой совмещения двух других. Все системные триады обладают единой смысловой структурой, обусловленной способностью человека мыслить одновременно и понятиями, и образами, и символами. В семантической формуле рацио-эмоцио-интуицио проявляется как тринитарный архетип. Смысловое сходство системных триады можно рассматривать как гомологический закон, управляющий структурной динамикой целостных образований.
Примеры линейной типологизации детально проанализированы в работах В.В. Максимова, в которых рассмотрены вопросы оценки текста не предмет безопасности. Существенным недостатком предложений автора является отсутствие учета фразеологических единиц (ФЕ) русского языка, которые при анализе текста в ряде случаев дают противоположные результаты. К примеру, слово "Убить" и ФЕ русского языка "Убить время" имеют различное смысловое значение. Однако, его идеи о психо-эмоциональном цикле (рис. 1) являются важным вкладом и незаменимым средством для решения широкого спектра задач контент-анализа.
Целью данной работы является разработка методологии по оценке толерантности текстов, которая учитывает не только линейные оценки (опасность, паника, отчуждения и др.), но и системные, которые формируются на основе анализа ФЕ русского языка (убить время, убрать конкурента, стреляный воробей и т.д.). Итоговые показатели дают семантически более точные смысловые результаты для включения (идентификации) или не включения в смысловую группу.
В результате исследований составлен словарь, который систематизирует слабо формализуемую лексику русского языка, обозначающих более 18 тысяч оттенков социальных чувств и оценок (интеллектуальных эмоций и чувств).
Словарь состоит из трех частей: Классификатор основных типов и модальностей чувств и оценок (табл. 1), Алфавитный словник с индексами терминов и ФЕ русского языка, Синонимический словарь, состоящий из 140 списков слов-синонимов и ФЕ-синонимов для поиска значений.
Классификатор состоит из 35 основных типов чувств и оценок по 4 основных модальности в каждом типе: по две нормальных – положительная и отрицательная, и по две аномальных (положительная и отрицательная; девианторы и стрессоры). В основу типологии выражений чувств и оценок положено представление о психо-эмоциональном цикле (рис. 1).
С помощью классификатора каждому слову и ФЕ в Алфавитном словнике заданы буквенно-цифровые индексы, указывающие места его синонимов в Синонимической части Словаря. Поиск содержания искомого слова и ФЕ осуществляется по индексам в Синонимическом словаре, с помощью которых выбираются группы синонимов, отражающих номинальный состав слово-смыслов и ФЕ-смыслов искомого значения.
Словарь построен в виде алфавитного списка одиночных оценочных слов (без словосочетаний) и ФЕ русского языка. Каждому слову и ФЕ русского языка соотнесены один или более буквенно-цифровых индексов по схеме "цифра―буква―цифра".

Фрагмент алфавитного словаря

Термины и фразеологические единицыИндексы
Аморальн - (ый, ая, ое, ого, ые, ых, ым, ыми, о)14А2
Блудн - (ым,ого .... .) сын(ом, а, .....)1А1;2,9,12,20,25Н2
Авось1A1; 4H1; 19H2; 33A2
Бочк-(у,у, ....) кат-(ишь,ить, ....)17Н2;23А2
В три погибели27А2

Первая цифра (от 1 до 35) обозначает тип чувства―оценки, буквы (или Н или А) ― нормальную или аномальную модальность, уточняемую второй цифрой (1 или 2). Наличие нескольких индексов у одного слова, разделенных точкой с запятой, обозначает разные его значения, которые оно может принимать в зависимости от контекста его использования.
Слова в алфавитном словаре, как правило, разделены знаком тире на "корневую" часть и окончание. Сделано это из "компьютерных" соображений и адаптации словаря к машинному варианту с целью автоматизации оценочного контент-анализа.

Табл. 1. Классификатор социальных чувств и оценок


типа
Аномальные
положительные
модальности
(девиантные)
Нормальные модальности
Аномальные
отрицательные
модальности
(стрессоры)
Положительные
(императивные)
Отрицательные
(нормативные)
  А1 H1 H2 A2
1БеспечностиБЕЗОПАСНОСТИОпасностиПаники
2БлагодушияБЛАГОПОЛУЧИЯНеблагополучияНесчастья
3НавязчивостиВНИМАНИЯНевниманияБездушия
4ФанатизмаВЕРЫСомненияНеверия
5АмбицииГОРДОСТИНеудачиБезуспешности
6ПротекционизмаДРУЖБЫНедружелюбияВражды
7СамодовольстваСИЛЫСлабостиБолезни
8АжиотажаИНТЕРЕСАБезучастностиОтчуждения
9КосмополитизмаПАТРИОТИЗМАНационализмаШовинизма
10ВсеведенияКОМПЕТЕНТНОСТИЗаблужденияНезнания
11ГрупповщиныКОЛЛЕКТИВИЗМАПотерянностиИндивидуализма
12РевностиЛЮБВИРавнодушияНенависти
13УпрощенияЛЕГКОСТИСложностиНепосильности
14ХанжестваНРАВСТВЕННОСТИФальшиАморальности
15БодрячестваОПТИМИЗМАПассивностиОтчаяния
16БездумностиПОНИМАНИЯНеясностиАбсурда
17БюрократизмаПОРЯДКАБеспорядкаХаоса
18ДемагогииПРАВДЫНеправильностиБеззакония
19АлчностиПОТРЕБНОСТИВозможностиНедопустимости
20УравниловкиРАВЕНСТВАНеравенстваДискриминации
21МахинаторстваРЕШЕНИЯПроблемыБезвыходности
22ВседозволенностиСВОБОДЫЗависимостиУгнетения
23АвантюризмаСМЕЛОСТИБоязниСтраха
24КорыстолюбияСОБСТВЕННОСТИДефицитаУтраты
25ЧванстваСОВЕСТИСтыда, виныОбиды
26ПокорностиСОГЛАСИЯВозраженияПротеста
27КультаУВАЖЕНИЯНеуваженияГлумления
28АскетизмаУДОВЛЕТВОРЕНИЯУхудшенияВозмущения
29ПопустительстваХОЗЯИНАНерадивостиРазвала
30ПрожектерстваНОВОГООбыденностиКосности
31ЭкстремизмаЦЕЛИКонформизмаСмирения
32Мании величияЯ, СЕБЯ, СВОЕГОСкромностиЧужого
33ПреувеличенияВАЖНОСТИНесущественностиПренебрежения
34Время-плюсМЕРА ВРЕМЕНИНулевое времяВремя-минус
35Величина-плюсВЕЛИЧИНА-МЕРАНуль-величинаВеличина-минус

В основу типологизации и группировки выражений чувств и оценок было положено модельное представление о психо-эмоциональном цикле (рис.1), отображающем циклический (и синусоидальный, волновой) характер переживания человеком имеющегося у него спектра чувств данного типа, непрерывно и периодически сканируемых его психикой по круговой шкале интенсивности. Основные модальности (Н1―А1―А2―Н2) выступают в круговой модели цикла как 4 фазы развертывания чувств-оценок каждого типа.

Интенсивность (сила) чувства

Круговая модель шкалирования модальностей
Рис.1. "Круговая" модель шкалирования модальностей

Обозначения:
I - вертикальная координата ИНТЕНСИВНОСТИ (силы) чувства-оценки
Н1―Н2 - зона нормальных модальностей (положительных и отрицательных);
А1―А2 - зона аномальных модальностей (положительных и отрицательных);
М - зона "молчания" чувств данного типа;
П - зона "переключения" полярных модальностей;.
п(+), п(-) ― психо-эмоциональные пороги высказывания оценок данной модальности (по уровню их интенсивности).
Состав словаря и классификатор чувств отражают эмоционально-нравственную структуру общественной психологии народа, нации, профессиональной общности, конкретного исторического периода. Она может быть зафиксирована по текстам (например, по письмам, по литературе, газетам и т.д.).
Отбор терминов в словарь, классификационный анализ слов и словника в целом, разработка типов чувств-оценок и образующих их модальностей проводились параллельно и одновременно, исходя из следующих принципов:
1. Принцип ПОЛЯРИЗАЦИИ ОЦЕНОК (чувств) на положительные и отрицательные;
2. Принцип ВЕРБАЛЬНОЙ ОПРЕДЕЛЕННОСТИ утверждающий, что каждому ТИПУ чувств соответствует свой список оценочных синонимов;
3. Принцип ПАРАБОЛИЧЕСКОГО ШКАЛИРОВАНИЯ чувств и выражающих их оценок; согласно ему список синонимов данного ТИПА чувств-оценок может быть упорядочен в виде шкалы интенсивности их выражений - от максимума положительного значения до максимума отрицательного значения со средней точкой "нулевой" интенсивности;
4. Принцип СОЦИАЛЬНОЙ РЕФЛЕКСИВНОСТИ чувств и оценок, утверждающий разделение каждой ветви параболической шкалы каждого типа чувств на две части (рис.1): нормальных и аномальных модальностей, каждая из которых включала положительную и отрицательную модальности.
В результате автоматизированной обработки текста выводится матрица показателей (35х4), которые преобразуются в графическое изображение ― Геномограмму. Геном подразумевает в данном контексте уникальность эмоциональной структуры текста.
Геномограмма дает визуальное представление о данных показателях для специалистов из различных областей знаний. Сравнение двух или нескольких геномограмм дает возможность не только анализа, но и прогнозирования увеличения (уменьшения) отрицательных (положительных) оценочных показателей текста (автора текста).
Интеллектуально-познавательный потенциал методологии рассматривается, как особая человеко-машинная технология социального познания процессов, происходящих в обществе, по массивам текстов, продуцируемых в нем (по письмам, книгам, газетам, законам, постановлениям).

Автор: Марунин В.Н.

Предназначена для использования в качестве методологического инструмента в издательствах, центрах изучения общественного мнения, государственных структурах, анализирующих работу СМИ и спецподразделениях, в задачу которых входит автоматизация и анализ электронных текстов по степени "проблемности".

Фрагменты исследований текстов приведены в опубликованных работах.

Тетраоценочный анализ рассказа А. П. Чехова "Дама с собачкой".
http://www.russika.ru/sa.php?s=308

Геномограмма речи Д. Медведева на церемонии вступления в должность Президента России
http://www.russika.ru/sa.php?s=304

Геномограмма речи В. Жириновского перед принятием бюджета 2004 г.
http://www.russika.ru/sa.php?s=306

Литература:
1. Ertel S. Content-Analysis: An alternative approach to open and closedminds//High School Journ. Univer. North Carolina, 1985. P.54-61. Его же: 23. Ertel S. Nazi leaders' intolerance of entropy//Politische Psychol. 1981. Sonderheft 12. S.326-335;
2. Баранцев Р.Г. Системная триада - структурная ячейка синтеза // Системные исследования. Методологические исследования. Ежегодник 1988. М.: Наука, 1989. С. 193-209.

 

наверх

 

Рейтинг@Mail.ru Rambler's Top100 Validated by HTML Validator (based on Tidy)