Настройка прозрачности разброса — КиберПедия 

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

Адаптации растений и животных к жизни в горах: Большое значение для жизни организмов в горах имеют степень расчленения, крутизна и экспозиционные различия склонов...

Настройка прозрачности разброса

2018-01-04 61
Настройка прозрачности разброса 0.00 из 5.00 0 оценок
Заказать работу

В ситуациях, аналогичных приведенной выше, когдадиаграмма рассеяния переполнена точками, можно улучшить визуализацию внутренней структуры данных путем настройки уровняпрозрачности. Поскольку наложение полупрозрачных точек будет менее прозрачным, а области с меньшим количеством точек будут более прозрачными, то точечныйграфик с полупрозрачными точками может изобразить плотность данных намного лучше, чем сплошные точки.

Выполнить настройку альфа-канала, регулирующего прозрачность изображаемых на графикеPandasточекможно при помощиименованного аргумента alpha в функции scatterв виде числа между 0 и 1, где 1 означает полную непрозрачность, 0—полную прозрачность.

defex_1_35():

'''Показать диаграмму рассеяния (с прозрачностью) выборов в РФ'''

df = load_ru_victors()[ ['Явка', 'Доля победителя'] ]

rows = sp.random.choice(df.index.values, 10000)

df.ix[rows].plot.scatter(0, 1, s=3, alpha=0.1)

plt.xlabel('Явка')

plt.ylabel('Доляпобедителя')

plt.axis([0, 1.05, 0, 1.05])

plt.show()

Приведенный выше пример сгенерирует следующую диаграмму:

Приведенный выше точечныйграфик показывает общую направленность совместного изменения доли победителя иявки на выборы. Мы видим корреляцию между двумя значениями и "горячую точку" в правом верхнем углу графика, которая соответствует явке близкой к 100% и 100%-омуголосованию в пользу побеждающей стороны. Как раз эта особенность в частности является признаком того, что исследователи из Венского медицинского университета обозначили как сигнатура фальсификации выборов. Этот факт также подтверждается результатами других спорных выборов по всему миру, например, таких как президентские выборы 2011 г. в Уганде.

Результаты многих других выборов по всему миру на уровне округов доступны по адресу http://www.complex-systems.meduniwien. ac.at/elections/election.html. На веб-сайте можно получить ссылку на научно-исследовательскую работу и скачать другие наборы данных, на которых можно попрактиковать то, что Вы узнали в этой главе об исправлении и преобразовании реальных данных.

Мы рассмотрим корреляцию более подробно в Главе 3, Корреляция, где узнаем, каким образомколичественно определять силу связи между двумя значениями и создавать основанную на ней прогнозную модель. Мы вернемся к этим данным в Главе 10, Визуализация, где реализуем собственную двумерную гистограмму, чтобы еще четче визуализировать связь между явкой на выборах и долей голосов, отданных за победителя.

Резюме

В этой первой главе мы узнали о сводных статистиках и значении статистических распределений. Мы увидели, каким образом даже простой анализ может предъявитьсвидетельства о потенциальной фальсификационной деятельности.

В частности, мы познакомились с центральной предельной теоремой и увидели, почему она играет такую важную роль в объяснении широкого применения нормального распределения в науке о данных. Подходящее статистическое распределение способно всего в нескольких статистикахвыразить сущность большой последовательности чисел, некоторые из которых мы реализовали в этой главе на основевстроенных функций языка Python и функций библиоткиSciPy. Мы также представили пакет библиотекуPandas и использовали ее для загрузки, преобразования и визуального сопоставления нескольких наборов данных. Впрочем, на данном этапе мы не были в состоянии добиться большего, кроме как обнаружить любопытное расхождение между двумя статистическими распределениями.

В следующей главе мы расширим то, что мы узнали об описательных статистиках, познаниями из области инференциальнойстатистики, которые позволят нам давать количественное оценку измеренному расхождению между двумя или несколькими статистическими распределениями и принимать решение о том, является ли это расхождение статистически значимым. Мы также узнаем о методах проверкистатистических гипотез, которые лежат в основе проведения робастных статистических экспериментов, позволяющих делать выводы, исходяиз данных.


Поделиться с друзьями:

Состав сооружений: решетки и песколовки: Решетки – это первое устройство в схеме очистных сооружений. Они представляют...

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.01 с.