А.В. Морозов ЧАСТОТНЫЙ АНАЛИЗ РАСПРЕДЕЛЕНИЯ ЛЕММ В МАССИВАХ ВЫСКАЗЫВАНИЙ

Активные исследования опосредованного общения, которые проводятся при исследовании интернет-сферы (B.JI. Волохонский), работы распределенных команд (JI.B. Марарица), воздействия информационных сообщений (А.В. Морозов) требуют разработки методов анализа коротких текстов. Это необходимо для подготовки сти- мульного материала, чтобы обеспечить однородность стимулов или контролируемость его параметров. С другой стороны, удобная и надежная методика откроет новые возможности в изучении отдельных авторов или групп авторов. Перспективное направление разработки методик обработки высказываний — это процедуры анализа частот вхождения заданных слов (лемм) в наборы высказываний.

Разработанные в лингвистике процедуры оценки частот (М.В. Арапов, A.M. Елизаров, Ю.Е. Хохлов) ориентированы на огромные (десятки тысяч слов) массивы текстов, что делает их малопригодными для психологических исследований, где изучаются относительно короткие массивы: личные дневники, служебная переписка, комментарии к сообщениям. Кроме того, результаты лингвистических процедур носят структурный характер и их трудно соотнести с содержательной стороной текстов. Сочетание методов частотного и содержательного анализа открывает новые перспективы именно для психологических исследований. Корректные распределения могут вычисляться и на небольших массивах, а сопоставление нескольких таких массивов между собой позволяет сделать достоверные выводы о системных изменениях текстов (Г.Я. Мартыненко).

Разработанный по техническому заданию Ю.Ю. Милешкиной набор программ позволяет удалить «стоп-слова», привести остальные к нормальному виду, подсчитать частоты встречаемости каждой леммы и построить график их распределения.

В серии исследований программа обрабатывала группы заранее отобранных высказываний, имеющих специфическую тематику. Результаты обработки показали высокую степень соответствия заложенных и выявленных особенностей текстов. Обработка нескольких массивов высказываний (например, с тематических форумов) позволяет выявить особенности концентрации и рассеивания слов, которые имеют содержательную интерпретацию. Ниже приведен фрагмент такого анализа, где после знака «/» указан процент вхождения слова в набор соответствующей тематики. Лемма / курение / игровая зависимость / интернет / алкоголь / Алкоголь 0,2 / 0,1 / 0,3 / 10,2 алкоголизм 0,1 / 0,3 / 0,4 / 9,8 мочь 7,0/7,7/ 6,2/6,2 употребление 0,4/0,0/0,4/5,7 человек 5,1/12,3/ 5,7 / 5,6 спиртной 0,1 / 0,1 / 0,0 / 4,9 зависимость 13,6 / 19,0/ 18,5 / 4,8.

По результатам видно, что ключевые слова темы оказываются самыми частыми, но при этом в высказываниях об алкоголизме вместо леммы «Зависимость» используется лемма «Употребление». Валидность интерпретации обеспечивается тем, что проводится преобразование данных из шкалы отношений в ранговую, а затем в номинальную шкалы. Вычисленная частота вхождения является основанием для ранжирования слов по частоте, и динамика изменений частоты позволяет разбить ранговые ряды на три части: тематические примитивы, тематические ключевые слова, особые ключевые слова, выразительные слова. Такое деление основано на идеях, предложенных А. Вежбицкой, развитых в работах С.А. Миничева, А.В. Морозова.

Проведенная апробация методики частотного распределения лемм в массивах высказываний подтверждает перспективность этого направления исследований.

Январь 24, 2019 Общая психология, психология личности, история психологии
Еще по теме
А. В. Морозов СРАВНИТЕЛЬНЫЙ ЧАСТОТНО-СОДЕРЖАТЕЛЬНЫЙ АНАЛИЗ РАСПРЕДЕЛЕНИЙ ЛЕММ В ТЕКСТАХ
ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ
ЧАСТОТНОСТЬ СЛОВА (WORD FREQUENCY)
ОПРЕДЕЛЕНИЕ ПРОДУКТИВНОЙ ЧАСТОТНОСТИ
СТЕПЕНЬ ЗНАКОМСТВА СО СЛОВАМИ И РАЗЛИЧНЫЕ ПОКАЗАТЕЛИ ИХ ЧАСТОТНОСТИ
ЧАСТОТНЫЙ ИНТЕРВАЛ РЕЧЕВЫХ ЗВУКОВ
ГЛАВА 3. ВЫСКАЗЫВАНИЕ И МЫСЛЬ
ОПРОСНИК «САМООЦЕНКА» (В.В, ШПАЛИНСКИЙ, Л.В. МОРОЗОВ)
Мороз О.М., Курбатова КОГНИТИВНЫЙ СТИЛЬ И АДАПТИРОВАННОСТЬ
ПАТОЛОГИЯ РЕЧЕВОГО ВЫСКАЗЫВАНИЯ
СИНТАКСИЧЕСКИЕ СРЕДСТВА ВЫСКАЗЫВАНИЯ
ОСНОВНЫЕ ВИДЫ ВЫСКАЗЫВАНИЙ
ПРОЦЕСС ДЕКОДИРОВАНИЯ РЕЧЕВОГО ВЫСКАЗЫВАНИЯ
Бойкова И.Ю., Морозов А.В. ПРЕДСТАВЛЕНИЯ О СОДЕРЖАНИИ ПОНЯТИЯ «ЗНАНИЕ» В ОБЫДЕННОМ СОЗНАНИИ
ВИДЫ РЕЧЕВОГО ВЫСКАЗЫВАНИЯ И ИХ СТРУКТУРА
СРЕДНЯЯ ДЛИНА ВЫСКАЗЫВАНИЯ
Добавить комментарий