Краткая история возникновения и развития SPSS. — КиберПедия 

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Краткая история возникновения и развития SPSS.

2017-11-16 326
Краткая история возникновения и развития SPSS. 0.00 из 5.00 0 оценок
Заказать работу

Первая версия программно-аналитического комплекса SPSS появилась в 60-х гг. ХХ в. в США. В то время (1965 г.) два студента Норман Най (Norman Nie) и Дейл Бент (Dale Bent), специализировавшиеся в области политологии, попытались отыскать в Стенфордском университете в Сан-Франциско компьютерную программу, подходящую для анализа социологической информации. Вскоре они разочаровались в своих попытках, т.к. имеющиеся программы не удовлетворяли потребностей социологов, были либо неудачно построены, либо не обеспечивали наглядность представления обработанной информации. К тому же принципы

пользования менялись от программы к программе. Тогда они решили разработать свою собственную программу, со своей концепцией и единым синтаксисом.

В их распоряжении в то время был язык программирования FORTRAN и вычислительная машина типа IBM 7090. Уже через год была разработана новая версия программы, которая еще через год (1967 г.) могла работать на IBM 360. Программы того периода времени представляли собой пакеты перфокарт. На это указывает и исходное название программы, которое авторы дали своему продукту. SPSS – это аббревиатура: Statistical Package for Social Science.

В 1970 г. работа над программой была продолжена на базе Чикагского университета. К середине 70-х гг., когда стало ясно, что программное обеспечение – это своего рода товар, который приносит прибыль, Норман Най организовал новую специальную фирму по разработке и усовершенствованию созданной ими программы. К тому моменту было произведено уже 60 инсталляций программы SPSS. Первое руководство для

пользователей описывало 11 различных процедур. В это время SPSS отделяется от пакета NORC, на базе которого первоначально формировалась.

Спустя 5 лет программа была инсталлирована уже 600 раз, причем под разными операционными системами. С самого начала версиям программы присваивали соответствующие порядковые номера.

В 1975 г. была разработана 6-я версия (SPSS 6). В период до 1981 г. вышли версии 7, 8, 9. Командный язык (синтаксис), используемый в SPSS, в то время был еще не так хорошо развит, как сегодня, и, естественно, он был ориентирован на перфокарты. Поэтому так называемые управляющие карты

состояли из идентификационного поля, представляющего собой столбцы 1-15, и поля параметров (столбцы 16-80). В 1983 г. командный язык программы был полностью переработан, синтаксис стал значительно удобней. Чтобы

отметить этот факт, программа была переименована в SPSSХ, где буква Х должна служить и номером версии в римских числах, и сокращением для extended (расширенный).

\ Год от года постоянно увеличивалось и количество процедур.

С появлением персональных компьютеров была разработана РС-версия SPSS. В 1983 г. появилась версия SPSS/PC+, рассчитанная на операционную систему MS-DOS. Позже, с момента основания в 1984 г. европейского

торгового представительства в Горинхеме в Нидерландах и благодаря основанию в 1968 г. филиала в Мюнхене, SPSS стала широко применяться и в Германии.

В России первый запуск программы SPSS произошел 13 февраля1982 г. В настоящее время это самое распространенное пользовательское приложение для статистического анализа во всем мире. Для того, чтобы отразить возможность использования программы во всех областях, имеющих отношение к статистическому анализу, буква Х была вновь удалена из названия марки, а исходной аббревиатуре присвоено новое значение: Superior Performance Software System (система программного обеспечения высшей производительности). Если версия SPSS/PC+ была чуть усовершенствованной версией для больших ЭВМ, то SPSS для операционной системы Windows (SPSS for Windows) стала большим шагом вперед. Эта версия программы, во-первых, обладает всеми возможностями версии для больших ЭВМ; во-вторых, за некоторыми немногочисленными исключениями программой можно пользоваться без особых знаний в области прикладного программирования. Не случайно данную программу называют пакет для домохозяек. Вызов необходимых процедур статистического анализа происходит при помощи стандартной техники, применяемой в Windows, т.е. с помощью мыши и соответствующих диалоговых окон. Первая версия SPSS for Windows имела порядковый номер 5. Затем последовали 6.0 и 6.1 с некоторыми нововведениями в статистической и графической областях. Версия 6.1 была первой статистической программой для Windows, которая использовала 32-битную архитектуру Windows 3.1. Это можно было заметить по более высокой скорости выполнения вычислений. Усовершенствования также коснулись и интерфейса пользователя. В конце концов была выпущена версия 6.1.3, которая уже могла работать и в Windows 95, и в NT. В начале 1996 г. появилась 7-я версия программы SPSS. (7.0, затем 7.5). Наряду с расширением возможностей в сфере статистики разница между версиями заключалась в том, что последняя была выполнена на немецком языке. Причем 7-я версия могла работать лишь при наличии Windows 95 (NT). Прогресс 8-й версии заключался в усовершенствовании графической оболочки. Возможность составления интерактивных графиков предоставляет ряд преимуществ по сравнению с традиционными графиками, которые являются стандартом для многих других пакетов.

Версия 9.0 включает в себя несколько новых статистических методов, в том числе многозначную логистическую регрессию, и новые графические возможности.

Версия 10.0 имеет 2 существенных отличия по сравнению с предыдущими версиями.

1. Благодаря закладкам «Просмотр данных» и «Просмотр переменных» облегчен переход между полем ввода данных и описанием переменных, т.е. форма описания переменных была упрощена и стала соответствовать общепринятым стандартам, применяемым в сфере табличных расчетов.

2. В области статистики добавлен регрессионный анализ с целевой переменной, относящейся к порядковой шкале.

Большинство изменений в версии SPSS 11.0 связано с усовершенствованием и добавлением статистических процедур.

1. Появилась новая процедура «Descriptive ratio statistics» (дескриптивные статистики отношений).

2. В функцию «Advanced Model» (усложненные модели) добавлена новая статистическая процедура «Linear mixed models» (Смешанные линейные модели), известная как «Hierarchical Linear Models» (Иерархические линейные модели), которая используется для получения наиболее точной прогнозирующей модели при работе с вложенной структурой данных.

3. Улучшена масштабируемость и повышена производительность функций многомерной логистической регрессии («Multinomial Logistic Regression»), иерархического кластерного анализа («Hierarchical Cluster Analysis»).

4. Скорость выполнения иерархического кластерного анализа возросла от 5 до 50 раз в зависимости типа вычислений. А скорость выполнения мультиноминальной логистической регрессии и общих линейных моделей («General Linear Models») увеличилась в 10 раз.

5. Появилась возможность к доступу данных только для чтения.

6. Повышена защита данных путем шифрования при обмене между клиентом и сервером SPSS.

Сегодня пакет содержит все основные разделы анализа данных и во многих зарубежных и отечественных университетах является базовым для преподавания анализа данных студентам гуманитарного направления. Следует заметить, что практически ежегодно выпускается новая версия SPSS, постоянно изменяется дизайн, появляются новые программы и возможности работы с пакетом.

 

Модули программы SPSS

 

Основу программы составляет базисный модуль, предоставляющий разнообразные возможности регистрации и изменения информации. Он содержит методы анализа, которые применяются чаще всего. Этот модуль входит в базовую поставку и включает все процедуры ввода, отбора и корректировки данных. Наряду с простыми методиками статистического анализа данных – частотный анализ, расчет статистических характеристик, таблицы сопряженности, корреляции, построение графиков – этот модуль включает непараметрические тесты (непараметрические тесты не учитывают параметры распределения, т.е. средние значения и дисперсию), а также усложненные методы анализа данных: многомерный линейный регрессионный анализ, дискриминационный анализ, факторный анализ, кластерный, дисперсионный.

Традиционно вместе с базисным модулем поставляются еще два модуля: Advanced Models (усложненные модели) и Regression Models (регрессионные модели). Эти три модуля охватывают тот спектр методов анализа данных, который входил в раннюю версию программы для больших ЭВМ.

Regression Models (регрессионные модели). Данный модуль включает в себя различные методы регрессионного анализа, такие как бинарная и многозначная логистическая регрессия, нелинейная регрессия и пробит-анализ.

Advanced Models (усложненные модели). В этот модуль входят различные методы дисперсионного анализа (многомерный, с учетом повторных измерений), необходимые после применения общих линейных моделей, включая метод Каплана-Майера и регрессию Кокса, а также логлинейные модели.

Наряду с упомянутыми модулями существует еще ряд специальных дополнительных модулей и самостоятельных программ, число которых постоянно увеличивается.

Мы отметим существующие на сегодняшний день модули и программы, расширяющие возможности SPSS.

Tables. Модуль служит для создания презентационных таблиц. Здесь предоставляются более широкие возможности по сравнению с упрощенными частотными таблицами и таблицами сопряженности, которые строятся в базисном модуле.

Amos. (Analysis of moment structures – анализ моментных структур.) Включает методы анализа с помощью линейных структурных уравнений. Целью программы является проверка сложных теоретических связей между различными признаками случайного процесса и их описание при помощи подходящих коэффициентов. Проверка проводится в форме причинного анализа и анализа траектории. При этом пользователь в графическом виде должен задать теоретическую модель, в которую вместе с данными непосредственных наблюдений могут быть включены и так называемые скрытые элементы. Программа Amos включена в состав модулей расширения SPSS как приемник LISREL (Linear Structural RELationships – линейные структурные взаимоотношения).

Answer Tree (дерево решений). Включает 4 различных метода деления популяции на отдельные семейства (сегменты) с помощью заранее заданных категориальных переменных. Деление проводится таким образом, что зависимая переменная в различных сегментах принимает значимо различающиеся значения. Типичным примером применения данного метода является создание характерных профилей покупателей при исследовании потребительского рынка.

Categories. Модуль содержит различные методы для анализа категориальных данных, а именно: метод анализа соответствия и три метода оптимального масштабирования (анализ однородности, нелинейный анализ главных компонентов, нелинейный канонический анализ корреляции).

Clementine. Это программа для моделирования процесса распространения информации, в которой пользователю предлагаются многочисленные подходы к построению моделей (нейронные сети, виды регрессионного анализа).

Conjoin (анализ совместимости). Применяется при исследовании рынка для изучения потребительских свойств продуктов на предмет их привлекательности. При этом опрашиваемые респонденты должны по своему усмотрению расположить предлагаемые наборы потребительских свойств продуктов в порядке предпочтения. На основании этого выводятся так называемые частичные показатели полезности отдельных категорий каждого потребительского свойства.

Data Entry (ввод данных). Программа предназначена для быстрого составления вопросников и ввода данных. Этот модуль генерирует анкеты и шаблоны для ввода данных с монитора, в которых выбранные ранее вопросы и категории ответов опросника потом используются в качестве меток переменных и значений.

Точные тесты. Этот модуль служит для точного вычисления вероятности ошибки (величины р) в условиях ограниченности данных при проверке по критерию χ-квадрат, а также при непараметрических тестах.

GOLD MineR. Программа содержит специальную регрессионную модель для регрессионного анализа упорядоченных зависимых и независимых переменных.

Sample Power. При помощи данной программы может быть определен оптимальный размер выборки для большинства статистических анализов, используемых в SPSS.

SPSS Missing Value Analysis. Данный модуль служит для анализа и восстановления закономерностей, которым подчиняются отсутствующие значения. Он предоставляет различные варианты замены недостающих значений.

Таким образом, можно сказать, что программно- аналитический комплекс SPSS является на сегодняшний день наиболее универсальным инструментом для осуществления статистической обработки разнообразных социологических данных с учетом их специфики.

 

7. Подготовка и создание базы данных в SPSS: подготовка социологических данных к обработке (в т.ч. дихотомический и категориальный способы кодировки).

Для того чтобы полученные данные можно было обработать, прежде всего следует создать так называемую кодировочную таблицу. Эта таблица устанавливает соответствие между отдельными вопросами анкеты и переменными, используемыми при компьютерной обработке данных.

Для создания таблицы необходимо иметь анкету или иной инструментарий, в котором отражены вопросы и варианты ответов на данные вопросы, поэтому подобную кодировочную таблицу можно создавать как в течение полевого этапа исследования, так и после его завершения. Например, вопросу анкеты «Ваш пол» может соответствовать переменная «пол». Таким образом, на подготовительном этапе, прежде чем перейти к вводу данных, необходимо определить переменные, соответствующие измеряемым в исследовании признакам. Признак – это некоторое общее для всех объектов (респондентов) качество, конкретные проявления которого, (значения признака) могут меняться от объекта к объекту. Значения признака называют также альтернативами, градациями. Пример. В качестве значений признака «возраст» респондентов могут выступать значения 21, 46, 89 лет. Признак «отношение к работе транспорта» может иметь следующие градации: положительное, отрицательное, нейтральное и т.д.

Переменные – это ячейки памяти, в которые можно записывать значения, введенные с клавиатуры. Пример.

Все значения переменных в дальнейшем будут заноситься в матрицу данных. Она представляет собой таблицу, состоящую из определенного числа строк и столбцов. При этом каждая строка соответствует одной анкете (респонденту), а столбец – одной переменной.

Создание базы данных начинается с запуска программы SPSS. В результате откроется редактор данных SPSS (см. рис. 2.3). Здесь можно вводить новые данные или загружать существующие файлы данных при помощи команд File (файл) → Open.

Первым шагом является определение переменных. Для этого надо в редакторе данных дважды щелкнуть на ячейке с надписью «var» или на ярлычке –закладке в нижнем левом углу таблицы «Variable view» (просмотр переменных). Чтобы задать имя переменной, надо в текстовом поле «Name» ввести выбранное имя переменной. При этом каждая переменная имеет свое имя. Оно может представлять собой отражение номеров вопросов в анкете. Например, имена «var1» или «в25» будут соответствовать 1 и 25 вопросу анкеты. При выборе имени переменной следует соблюдать определенные правила:После ввода с клавиатуры в ячейку имя переменной нажмите клавишу <Tab>, чтобы подтвердить ввод и перейти к установке типа переменной.

Как видно из электронной таблицы, вновь созданные в SPSS переменные по умолчанию являются численными с максимальной длиной 8 знаков и дробной частью из 2 знаков (формат 8.2).

Если требуется изменить тип переменной, то щелкните в данной ячейке на кнопку с тремя точками.1. Numeric (числовые) – любые цифры, перед которыми стоит знак «+», «–» и десятичный разделитель.2. Comma (запятая) – к допустимым значениям относятся цифры, перед которыми стоит знак «+» или «–», точка как десятичный разделитель и одна или несколько запятых в качестве разделителей групп разрядов.3. Dot (точка) – к допустимым значениям относятся цифры, перед которыми стоит знак «+» или «–», и только точка как десятичный разделитель.4. Scientific notation (экспоненциальное представление) – при вводе данных разрешаются все допустимые численные значения, включая экспоненциальное представление, о котором говорит содержащаяся в числе буква Е или D.5. Date – дата или время.6. Dollar (знак доллара, точка как разделитель десятичный и запятая).7. Special currency (специальная валюта). Можно задавать собственные форматы валют.8. String (строка символов, текстовые переменные). В большинстве процедур их применение ограничивается или не допускается. С ними нельзя проводить никаких вычислительных операций, но можно проводить простой подсчет повторяемости. Десятичные разряды (Decimal). Увеличение или уменьшение этого значения также производится при помощи кнопки лифта. Например, переменная «пол» может принимать два значения, которые будут закодированы цифрами 1 и 2. Для нее можно задать. Метка переменной (Label)

Это название позволяет описать переменную более подробно. Метка переменной может содержать до 256 символов. Метки значений (Values) Эти названия позволят более подробно описать возможные значения переменной.

♦ Чтобы задать отсутствующие значения, надо нажать на кнопку с тремя точками в поле Пропуски (Missing). Откроется диалоговое окно «Define Missing Values» (определение отсутствующих значений)

♦ По умолчанию в программе предлагается вариант «No missing values» (нет отсутствующих значений), т.е. все значениясейчас рассматриваются как допустимые.

♦ Щелкнув левой клавишей мыши на пункте «Discrete missing values» (отдельные отсутствующие значения), для однойпеременной можно задать до трех пользовательскихотсутствующих значений. В рассматриваемом нами примере этобудут значения: 3, 4, 5.

♦ Щелкнуть левой клавишей мыши на пункте «Range and one optional discrete missing value» (диапазон отсутствующих значений).

В полях Columns (Столбцы) и Alignment (Выравнивание) примите настройки, предлагаемые программой SPSS по умолч. Шкала измерения Scale – метрическая,номинальная, порядковая.Подобным образом описываются все переменные, соответствующие всем вопросам анкеты. При создании матрицы данных надо помнить, что для кодировки однозначных и многозначных вопросов применяются разные методы. Создание переменных для многозначных вопросов и их кодировка.Дихотомический способ применяется в том случае, когда не известно или не ограничено возможное число вариантов ответа. Тогда для каждого варианта ответа (в нашем случае для проблемы) будет создаваться своя переменная. Кодировка каждой из таких переменных будет осуществляться по дихотомическому принципу (например, 1 = выбран ответ, 0 = не выбран ответ). При этом цифры, которые будут использованы Категориальный метод кодировки более удобен в ситуации неопределенного количества вариантов ответов на вопрос. Например, если респонденты перечисляют политиков, которым больше всего симпатизируют, или свои ассоциации в связи с чем-либо. При этом мы не можем заранее знать весь спектр ответов на вопрос. Но можем ограничить число ответов, которые должен дать респондент. Например, респонденту предлагается назвать не более трех известных магазинов бытовой техники, авторитетных лиц или интересующих передач. В таком случае мы создаем три переменные (в соответствии с ограничением возможного числа ответов одного респондента). Каждая из этих переменных будет содержать коды всех возможных (или указанных) вариантов ответа на данный вопрос.

Корректировка базы данных.

На этапе создания переменных, предшествующем вводу данных, невозможно при отсутствии определенного опыта работы просчитать все ситуации и создать «идеальную» матрицу для ввода данных.

Дополнение новых переменных. это можно сделать в любой момент на этапевведения и обработки данных, причем создавать переменную можно, находясь в любом диалоговом окне «Редактор данных: просмотр данных» или «Редактор данных: просмотр переменных».

Для создания новой переменной следует определить ее месторасположение, выделив переменную, перед которой надо вставить новую, а затем воспользоваться командой «Insert Variable» («Вставить переменную / наблюдение»). После создания новой переменной необходимо ее описать (все характеристики) в диалоговом окне «Редактор данных: просмотр переменных».

Кроме того, лишние переменные всегда можно удалить. Для этого их необходимо выделить, а затем воспользоваться клавишей Del.

Просмотр перечня всех переменных. В процессе ввода данных всегда можно посмотреть полный список переменных со всеми кодами их значений.Для этого не обязательно переходить в дополнительное окно редактора данных «просмотр переменных». В главном меню диалогового окна «Редактор данных: просмотр данных» можновоспользоваться функциями Utilites→Variables (Утилиты /Дополнительные возможности / Сервис → Переменные). В результате откроется окно, в котором приводится весьперечень переменных.

Для этого можно воспользоваться функцией главного меню View (Вид.

Поиск ошибок ввода.

При обработке результатов в базу данных вместо 18 лет было ошибочно введено 81. В первую очередь изменится значение среднего возраста. Для количественных переменных визуально по массиву определить наличие опечаток достаточно сложно, поэтому надо быть особо внимательными при вводе. Поэтому при заполнении базы данных необходимо нумеровать обработанные анкеты для возможности их последующего соотнесения.

Для нахождения опечаток надо в диалоговом окне «Редактор данных: просмотр данных» выделить переменную, их содержащую. Для этого щелкните левой клавишей мыши на имени переменной (для нашего примера var 4), выделится весь столбец. После чего надо воспользоваться командами главного меню редактора данных Edit /Правка → Find / Найти

В результате откроется новое диалоговое окно «Find Dada in Variable VAR 4» «Найти и заменить – Данные: Столбец_ VAR 4» в котором надо написать искомоезначение (для нашего примера это 51) и нажать на клавишу Find Next / Найти далее. И вы автоматически попадете в ячейку электронной таблицы, содержащую искомое значение.

Если надо найти несколько аналогичных значений, то повторное нажатие на клавишу «Find Next» / Найти далее переносит вас в следующую ячейку, содержащую данное значение. Если указанных для поиска значений в последующих случаях не найдено, то откроется следующее окно. Аналогичным образом можно найти любую ячейку базы данных, содержащую определенное, заданное с клавиатуры значение.


Поделиться с друзьями:

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

История развития пистолетов-пулеметов: Предпосылкой для возникновения пистолетов-пулеметов послужила давняя тенденция тяготения винтовок...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.01 с.