Процедуры современного контент-анализа — КиберПедия 

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Процедуры современного контент-анализа

2020-08-21 93
Процедуры современного контент-анализа 0.00 из 5.00 0 оценок
Заказать работу

Рассмотрим этапы контент-анализа при использовании того программного обеспечения (семантических и лингвистических процессоров), которое в настоящее время присутствует на рынке. Перечисленные процедуры показывают место человека в современном, ориентированном на использование компьютеров, контент-анализе.

  • Кодирование (или разметка текста) представляет собой основной по затратам этап контент-анализа. Существуют разные системы разметки текстов, основная часть их предполагает полуавтоматическую разметку. То есть нет ни одной системы, которая бы распознавала структуру текста без участия человека. Но существуют хорошие программные пакеты поддержки разметки, которые на порядок повышают производительность труда разметчика.
  • Категоризация представляет собой следующий уровень контент-анализа. На этом этапе из размеченных единиц анализа формируются немногочисленные категории типа тех, какие упоминались выше.
  • Классификация подразумевает стыковку единиц анализа и категорий. Хотя в этой процедуре встреченные в тексте слова не всегда могут быть легко и однозначно отнесены к какой-либо из категорий, эта процедура считается автоматизированной в наибольшей степени. Человек даже не в самых современных программных пакетах «подбирает» за компьютером не более 10% слов, которые не могут быть разнесены по категориям автоматически.
  • Подсчет и сравнение — следующий уровень, на который поднимается исследователь в ходе человеко -машинного контент-анализа. Подсчитываются и сравниваются количества фактов в разных категориях, по разным классам документов и в динамике. Некоторые сравнения делаются по каким-то временным вехам. Пример приведен выше, в связи с российской поэзией.
  • Получение выводов, как и в любом исследовании, представляет собой наиболее важный и сложный этап анализа. Основную роль в данной процедуре играет человек. Компьютер сделал свое дело на предыдущих этапах, в предшествовавших процедурах. Выводы отличаются от проведенных ранее сравнений и подсчетов тем, что они содержат скрытые (латентные) или явные рекомендации — что делать.

* * *

Теперь мы можем вернуться к упомянутой выше программе General Inquirer, которой насчитывается уже пятый десяток лет. Эта программа использует в настоящее время 182 семантических категории и пользуется словарем в сотни тысяч слов, которые поставлены в соответствие этим категориям. Только категория «отрицание» имеет соответствия с 2291 термином. При этом исследуются все смысловые оттенки каждого термина. Этот набор категорий складывался постепенно и продолжает совершенствоваться. Службам конкурентной разведки нужно начинать с какого-либо стандартного набора категорий, а затем постепенно притирать их к существу решаемых задач.

[1] Десятая статья из серии статей о конкурентной разведке. Предыдущие статьи см.: ЭКО. № 10—12. 2004 г.; № 2, 3, 5—7, 9. 2005 г.

[2] Подробнее см.: Воронов Ю. П. Из истории анализа содержания личных документов // Методологические и методические проблемы контент-анализа. М.-Л., 1973. Вып. 2. С. 120—121; Владыкин В. А., Воронов Ю. П. Контент -анализ и рецензирование научной литературы // Там же. С. 71—76. Последняя статья предваряет наши работы с социологом В. А. Владыкиным по анализу объявлений о приеме на работу, проводившихся в г. Рубцовске Алтайского края.

[3] Подробнее с этими рассуждениями можно ознакомиться в книге: Воронов Ю. П. Методы сбора информации в социологическом исследовании. М.: Финансы и статистика, 1973.

[4] Ядов В. А. Социологическое исследование: методология, программа, методы. М.: Наука, 1987; Ядов В. А. Стратегия социологического исследования Описание, объяснение, понимание социальной реальности. М.: «Добросвет», 2001; Степанова Л. А. Изучение экономического сознания методом семантического дифференциала // Социологические исследования. 1992. № 8.

[5] Авторство таблицы принадлежит американским психологам Адамсу и Осгуду, цитируется по: Яньшин П. В. Эмоциональный цвет. Эмоциональный компонент в психологической структуре цвета. Самара: СамГПУ, 1996. Это — некоторый элемент метода семантического дифференциала, о котором речь идет далее.

[6] Петренко В. Ф. Психосемантика сознания. М.: Изд-во МГУ, 1988.

[7] Эти сведения более надежны, чем информация о том, на каком автомобиле ездит руководитель компании конкурента. Еще пять-шесть лет все было наоборот.

[8] На русском языке метод семантического дифференциала обычно изучали по статье: Осгуд Ч., Суси Дж., Танненбаум П. Приложение методики семантического дифференциала к исследованиям по эстетике и смежным проблемам // Семиотика и искусствометрия. М.: Мир, 1972. Сейчас лучшее изложение есть в главе 8 книги: Толстова Ю. Н. Измерение в социологии: Курс лекций. М.: ИНФРА-М, 1998.

[9] Bales R. F. Interaction Process Analysis: A Method for the Study of small groups. AddisonWesley, Reading. Mass. 1950.

[10] См.: Леонтьева Н. Н., Семенова С. Ю. Семантический словарь РУСЛАН как инструмент компьютерного понимания // Понимание в коммуникации. Материалы научно-практической конференции 5—6 марта 2003 г. М.: МГГИИ, 2003. С. 41—46.

[11] Хекхаузен Х. Мотивация и деятельность. Цитируется по: Шалак В. И. Современный контент-анализ. М. Омега-Л, 2004. С. 50.

[12] Шалак В. И. Современный контент-анализ. С. 51. В книге есть также динамика контента поэтических произведений по таким категориям, как «власть», «жизнь», «смерть», «достижение», «фрустрация» и другие. Анализ приводимого далее графика сделан независимо от автора исследования. Линейный тренд заменен на полиномиальный, да и выводы несколько иные.

[13] В описании контент-анализа миссии компании использованы материалы второй главы книги: Воронов Ю. П., Добров А. П. Латентность стратегических решений и новые инструментальные средства. Новосибирск: изд-во ИЭиОПП СО РАН, 2005. С. 46—63. Рецензия на книгу опубликована в «ЭКО». 2005. № 9.

[14] Шалак В. Компьютерный контент-анализ текстов как метод экономической разведки // www.it2b.ru (дата опубликования —19.02.2004).

[15] Шалак В. И. Современный контент-анализ. В исследовании используются еще восемь различных количественных соотношений.

[16] См. материалы конференций: Проблемы обработки больших массивов неструктурированных текстовых документов, Москва, июль 2002 г.; Информационная безопасность компьютерных систем, ноябрь 2000 г.

[17] Основатель и руководитель РосНИИ ИИ — Александр Семенович Нариньяни, один из ведущих ученых мира в этой области; лабораторию, которая занимается семантическими процессорами, возглавляет Ю. А. Загорулько, и эта лаборатория продолжает работать в новосибирском Академгородке.

[18] Желающие подробнее ознакомиться с этим направлением контент-анализа см.: http://www.rco.ru

[19] Сравнительные характеристики подобных программ можно найти на сайтах http://www.intext.de/TEXTANAE.HTM (Германия) и http://www.gsu.edu/~wwwcom/content.html (США).

 


Поделиться с друзьями:

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.014 с.