Важно понимать, что Excel – это не только программа для создания баз данных, но и профессиональный статистический инструмент. И в статистике есть множество способов обработки числовых значений. Один из них – регрессионный анализ. Он тесно связан с корреляциями. Перед тем, как разобраться в том, как в Эксель осуществлять его на практике, необходимо сперва понять, что же такое регрессионный анализ и чем он отличается от корреляционного.
Термин «корреляция» знаком многим, даже тем, кто не особо хорошо разбирается в статистике. Он уже стал настолько популярным, что нередко его можно услышать в быту. А означает он очень простое явление – взаимосвязь между двумя переменными, когда при изменении одной происходит изменение и другой.
Важно понимать, что корреляция сама по себе устанавливает закономерность, но при этом не указывает на характер этой закономерности. То есть, одна переменная может влиять на другую, а может у них быть какая-то третья переменная, изменение которой влечет изменение обеих сразу. То есть, корреляция дает возможность установить взаимосвязь между явлениями, но не влияние одной на другую.
Линейная регрессия позволяет как раз установить разновидность этой связи, чтобы стало возможным прогнозирование зависимой переменной в зависимости от того, как будет изменяться независимая. А теперь подробнее рассмотрим, как можно почувствовать себя провидцем, не закрывая документа Эксель.
Как подключить пакет анализа в программе Excel
- Открыть меню «Файл». Для этого нужно нажать на одноименную кнопку слева от вкладки «Главная».
- Далее у нас откроется меню настроек файла. Нас интересует вкладка «Параметры».
- Теперь у нас появляется возможность настроить параметры Excel. Затем переходим в меню надстроек, выставляем надстройки Excel в перечне, который находится внизу и нажимаем на «Перейти».
- После этого появляется окошко, в котором можно управлять существующими надстройками. Нас интересует опция «Пакет анализа». Нужно поставить галочку возле нее и нажать на «ОК».
А теперь более подробно опишем, какие виды регрессионного анализа бывают и как его осуществлять в Excel.
Какие бывают виды регрессионного анализа
- Параболическая.
- Степенная.
- Логарифмическая.
- Экспоненциальная.
- Показательная.
- Гиперболическая.
- Линейная регрессия.
Линейная регрессия в Excel
- Y. Обозначает переменную, которая зависима от определенных факторов. Именно ее нам и нужно проанализировать. В нашем примере в качестве такой переменной выступает количество покупателей.
- х – это совокупность факторов, которые способны изменить значение переменной. В данном случае ею выступает температура воздуха. Но могут включаться и другие значения, которые могут быть измерены математическими.
- а – это коэффициент регрессии. Необходим для того, чтобы формула могла определить не только наличие самого фактора, но и степень его влияния на переменную Y.
- k – это общее число всех факторов, которые имеются на текущий момент.
- Сделать клик по кнопке «Анализ данных», появившейся после добавления соответствующей надстройки. Она располагается на вкладке «Данные» в группе «Анализ».
- После этого появится крошечное диалоговое окно. Но несмотря на это, оно содержит достаточное количество информации о том, какие инструменты анализа можно использовать. Нас же интересует регрессия. Соответствующий пункт и нужно выбрать. После того, как он будет выделен, можно нажимать кнопку «ОК».
- После этого нам нужно настроить регрессию. В соответствующем диалоговом окне необходимо обязательно заполнить входные интервалы X и Y. К оставшимся параметрам, если их не заполнять, будут применены настройки, запрограммированные по умолчанию. В поле с входным интервалом Y записываем тот диапазон, в котором находятся переменные, для которых мы пытаемся установить влияние имеющихся факторов. Простыми словами, общее число покупателей. Есть несколько способов ввода адреса: с клавиатуры или же непосредственное их выделение с помощью мыши. Естественно, проще первый вариант в большинстве случаев, но если человек владеет слепым методом печати и точно помнит адрес диапазона, то вручную ему будет все же проще.
Что касается других настроек, то они дают возможность задать метки, уровень надежности показателей, константу-ноль, а также задать ряд других параметров. Но в подавляющем количестве ситуаций нет необходимости корректировать эти настройки. Единственное, что нужно сделать – так это задать правильный переключатель для опции вывода результатов.
По стандарту итоги выводятся на другой лист, но пользователь может, если у него будет такое желание, осуществить вывод на тот же лист, что и таблица с первоначальными данными. Также возможен вывод результатов в отдельную книгу. Наконец, после завершения настроек нужно нажать кнопку «ОК», после чего программа все оставшиеся действия выполнит самостоятельно.
Как интерпретировать результаты анализа
Ознакомиться с результатами регрессионного анализа можно в том месте, которое было указано в параметрах. Выглядит он таким приблизительно образом.
Самое главное значение, на которое мы будем ориентироваться – это R-квадрат. В нем записывается качество используемой модели. Чем он выше, тем оно выше. Если оно меньше 0,5, то зависимость считается плохой, если выше – то уже лучше. Чем ближе к 1, тем лучше. Соответственно, максимальный коэффициент – 1.
Также нужно обратить внимание на еще один важный показатель. Его можно найти в ячейке, которая находится на стыке строки Y-пересечение и колонки «Коэффициенты». Здесь можно увидеть значение Y, которое будет равно нулю при определенных условиях. Также можно понять, насколько наша зависимая переменная является зависимой от факторов.
Для этого нужно посмотреть, какая цифра стоит на пересечении граф Переменная X1» и «Коэффициенты». Чем коэффициент выше, тем лучше.
Видим, что программа Microsoft Excel открывает широкие возможности для регрессионного анализа. Но конечно, нужна дополнительная подготовка, чтобы читать эти результаты. Но если вы уже разбираетесь в статистике, то будет значительно проще. А теперь давайте приведем некоторые простые примеры, чтобы было более наглядно понятно, как линейная регрессия проводится на практике.
Пример регрессионного анализа №1
- Открыть рабочий лист и ввести данные.
- Активировать инструмент регрессия способом, описанным выше.
- В появившемся диалоговом окне необходимо задать входной интервал X, Y, задать метки
- Также не стоит забывать ввести выходной интервал. Для выполнения этой задачи необходимо также указать такие параметры, как «График нормальной вероятности» и «График остатков».
Пример регрессионного анализа №2
Второй случай, в котором можно проводить регрессионный анализ – это необходимость найти максимальную модель распределения расходов на разные виды рекламы для того, чтобы получить самую большую прибыль. И такую маркетинговую задачу вполне может решить обычный Excel, кто бы мог подумать?
Предположим, максимальный бюджет на рекламу, который может быть потрачен организацией – 170000 рублей. Это ограничение невозможно предусмотреть стандартным средством, описанным выше. Здесь нужно использовать совсем другую надстройку, которая называется «Поиск решения». Есть ее возможность найти в том же разделе, что и описываемую нами. И аналогично пакету анализа, нам необходимо включить эту надстройку в том же самом меню.
Что же собой являет инструмент «Поиск решения»? Это надстройка, позволяющая найти оптимальный способ решения определенной задачи. Она имеет два основных параметра: целевая функция и ограничения. Таким образом, пользователь может находить оптимальную сумму затрат для рекламу в определенных условиях. Это одно из главных преимуществ данного инструмента.
Точно также, как в случае с пакетом анализа, инструмент поиска решения требует наличия математической модели. В качестве неё и выступает целевая функция. В нашем случае она следующая: Y= 2102438,6 + 6,4004 X1 – 54,068 X2 > max. В качестве используемых ограничений используется следующее выражение: X1 + X2 = 0, X2 >=0.
- Для начала нажать «Параметры Excel», после чего отправиться в категорию «Надстройки».
- После этого в поле «Управление» найти «Надстройки Excel» и кликнуть по «Перейти».
- После этого в списке надстроек активировать «Поиск решения».
Источник: topuch.com
Регрессия в Excel: уравнение, примеры. Линейная регрессия
Регрессионный анализ — это статистический метод исследования, позволяющий показать зависимость того или иного параметра от одной либо нескольких независимых переменных. В докомпьютерную эру его применение было достаточно затруднительно, особенно если речь шла о больших объемах данных. Сегодня, узнав как построить регрессию в Excel, можно решать сложные статистические задачи буквально за пару минут. Ниже представлены конкретные примеры из области экономики.
Виды регрессии
Само это понятие было введено в математику Фрэнсисом Гальтоном в 1886 году. Регрессия бывает:
- линейной;
- параболической;
- степенной;
- экспоненциальной;
- гиперболической;
- показательной;
- логарифмической.
Пример 1
Рассмотрим задачу определения зависимости количества уволившихся членов коллектива от средней зарплаты на 6 промышленных предприятиях.
В статье речь пойдет о том, что представляет собой функция «СЧЕТЕСЛИ» в Excel.
Задача. На шести предприятиях проанализировали среднемесячную заработную плату и количество сотрудников, которые уволились по собственному желанию. В табличной форме имеем:
Для задачи определения зависимости количества уволившихся работников от средней зарплаты на 6 предприятиях модель регрессии имеет вид уравнения Y = а0 + а1×1 +…+аkxk, где хi — влияющие переменные, ai — коэффициенты регрессии, a k — число факторов.
Для данной задачи Y — это показатель уволившихся сотрудников, а влияющий фактор — зарплата, которую обозначаем X.
Использование возможностей табличного процессора «Эксель»
Анализу регрессии в Excel должно предшествовать применение к имеющимся табличным данным встроенных функций. Однако для этих целей лучше воспользоваться очень полезной надстройкой «Пакет анализа». Для его активации нужно:
Надстройка Поиск решений в Excel 2007 не является стандартной. Она предназначается для сложных.
- с вкладки «Файл» перейти в раздел «Параметры»;
- в открывшемся окне выбрать строку «Надстройки»;
- щелкнуть по кнопке «Перейти», расположенной внизу, справа от строки «Управление»;
- поставить галочку рядом с названием «Пакет анализа» и подтвердить свои действия, нажав «Ок».
Если все сделано правильно, в правой части вкладки «Данные», расположенном над рабочим листом «Эксель», появится нужная кнопка.
Линейная регрессия в Excel
Теперь, когда под рукой есть все необходимые виртуальные инструменты для осуществления эконометрических расчетов, можем приступить к решению нашей задачи. Для этого:
- щелкаем по кнопке «Анализ данных»;
- в открывшемся окне нажимаем на кнопку «Регрессия»;
- в появившуюся вкладку вводим диапазон значений для Y (количество уволившихся работников) и для X (их зарплаты);
- подтверждаем свои действия нажатием кнопки «Ok».
В результате программа автоматически заполнит новый лист табличного процессора данными анализа регрессии. Обратите внимание! В Excel есть возможность самостоятельно задать место, которое вы предпочитаете для этой цели. Например, это может быть тот же лист, где находятся значения Y и X, или даже новая книга, специально предназначенная для хранения подобных данных.
Анализ результатов регрессии для R-квадрата
В Excel данные полученные в ходе обработки данных рассматриваемого примера имеют вид:
Прежде всего, следует обратить внимание на значение R-квадрата. Он представляет собой коэффициент детерминации. В данном примере R-квадрат = 0,755 (75,5%), т. е. расчетные параметры модели объясняют зависимость между рассматриваемыми параметрами на 75,5 %. Чем выше значение коэффициента детерминации, тем выбранная модель считается более применимой для конкретной задачи.
Считается, что она корректно описывает реальную ситуацию при значении R-квадрата выше 0,8. Если R-квадрата
Анализ коэффициентов
Число 64,1428 показывает, каким будет значение Y, если все переменные xi в рассматриваемой нами модели обнулятся. Иными словами можно утверждать, что на значение анализируемого параметра оказывают влияние и другие факторы, не описанные в конкретной модели.
Следующий коэффициент -0,16285, расположенный в ячейке B18, показывает весомость влияния переменной Х на Y. Это значит, что среднемесячная зарплата сотрудников в пределах рассматриваемой модели влияет на число уволившихся с весом -0,16285, т. е. степень ее влияния совсем небольшая. Знак «-» указывает на то, что коэффициент имеет отрицательное значение. Это очевидно, так как всем известно, что чем больше зарплата на предприятии, тем меньше людей выражают желание расторгнуть трудовой договор или увольняется.
Множественная регрессия
Под таким термином понимается уравнение связи с несколькими независимыми переменными вида:
y=f(x1+x2+…xm) + ε, где y — это результативный признак (зависимая переменная), а x1, x2, …xm — это признаки-факторы (независимые переменные).
Оценка параметров
Для множественной регрессии (МР) ее осуществляют, используя метод наименьших квадратов (МНК). Для линейных уравнений вида Y = a + b1x1 +…+bmxm+ ε строим систему нормальных уравнений (см. ниже)
Чтобы понять принцип метода, рассмотрим двухфакторный случай. Тогда имеем ситуацию, описываемую формулой
где σ — это дисперсия соответствующего признака, отраженного в индексе.
МНК применим к уравнению МР в стандартизируемом масштабе. В таком случае получаем уравнение:
в котором ty, tx1, …txm — стандартизируемые переменные, для которых средние значения равны 0; βi — стандартизированные коэффициенты регрессии, а среднеквадратическое отклонение — 1.
Обратите внимание, что все βi в данном случае заданы, как нормируемые и централизируемые, поэтому их сравнение между собой считается корректным и допустимым. Кроме того, принято осуществлять отсев факторов, отбрасывая те из них, у которых наименьшие значения βi.
Задача с использованием уравнения линейной регрессии
Предположим, имеется таблица динамики цены конкретного товара N в течение последних 8 месяцев. Необходимо принять решение о целесообразности приобретения его партии по цене 1850 руб./т.
Источник: autogear.ru
Регрессионнный в Excel. Дисперсионный анализ
Классификационная и регрессионная модели
устанавливают закономерности между входными
и выходными переменными.
Если входные и выходные переменные модели
непрерывные — перед нами задача
регрессии.
Если выходная переменная одна и она
является дискретной (метка класса), то речь
идет о задаче классификации.
В медицине с помощью классификации и
регрессии можно диагностировать заболевания
на
основе
наблюдаемых
симптомов
(температура, давление, состав крови и т. д.),
оценивать ожидаемые результаты лечения.
2
3. Регрессия
РЕГРЕССИЯ
1.
2.
3.
4.
Цель регрессионного анализа – по результатам
наблюдений за входными и выходными величинами
найти зависимость между входами и выходом, т.е.
получить математическую модель.
Нахождение функциональной зависимости между
входными атрибутами и непрерывным выходным
атрибутом.
Задачи регрессионного анализа :
Прогнозирование ухудшения состояния пациента.
Оценка вероятности повторных рецидивов заболевания.
Расчет загруженности докторов при обслуживании
населения.
Анализ влияния различных факторов на исследуемый.
3
4. Регрессия
РЕГРЕССИЯ
4
5. Регрессия
РЕГРЕССИЯ
Регрессией Y на X называется функциональная
зависимость
между
значениями
x
и
соответствующими условными средними y(x).
Форма связи результативного признака Y с факторами
X1, X2,…Xm называется уравнением регрессии. В
зависимости от типа выбранного уравнения различают
линейную и нелинейную регрессию, а в зависимости
от количества факторов – парную (простую, m = 1) и
множественную (многофакторную, m > 1).
Регрессионный анализ связан с корреляционным (также
часто
встречается
термин
«корреляционнорегрессионный анализ».
Корреляционный
анализ
позволяет
сделать
предположения о характере связи между изучаемыми
факторами.
6. Нелинейная регрессия
НЕЛИНЕЙНАЯ РЕГРЕССИЯ
На практике в качестве функции f (x) для парной
регрессии используются следующие виды функций:
7. Нелинейная регрессия
НЕЛИНЕЙНАЯ РЕГРЕССИЯ
в ячейке С2 программируется выражение =$B$9*A2^$B$10
8. Нелинейная регрессия
НЕЛИНЕЙНАЯ РЕГРЕССИЯ
В
случае
нелинейной
зависимости
между
исследуемыми факторами, степень их взаимосвязи
характеризуется индексом корреляции:
9. Регрессия
РЕГРЕССИЯ
На этапе регрессионного анализа решаются
следующие задачи:
1. Выбор общего вида уравнения регрессии и
определение параметров регрессии.
2.
Определение
степени
взаимосвязи
результативного признака и факторов, проверка
общего качества уравнения регрессии.
3. Проверка статистической значимости каждого
коэффициента уравнения регрессии и определение
их доверительных интервалов.
10. Регрессия
11. Регрессия
РЕГРЕССИЯ
По пространственной выборке примера нужно
построить диаграмму рассеяния и определить тип
функции
12. Регрессия
Scatterplot (БД250.sta 14v*245c)
РКДО
ЕГРЕССИЯ
= 0,0923+0,7554*x
1,2
КДО
При проведении статистических исследований получаемые результаты
часто представляются в виде упорядоченных последовательностей
1,0
значений
этих результатов, называемых элементами последовательности.
Упорядочение
заключается
в
том,
что
каждому
элементу
последовательности присваивается соответствующий номер. При этом
0,8
полученные результаты записываются в порядке возрастания их номеров.
Временной
ряд
–
это
ряд
последовательных
значений,
характеризующих
изменение показателя во времени ( показатели
0,6
кардиограммы).
Трендом (trend – тенденция, направление) временного ряда называют
0,4
изменяющийся,
нециклический компонент, описывающий влияние
долговременных факторов, эффект которых сказывается постепенно. К
таким
0,2 факторам относятся изменение демографических характеристик,
рост рождаемости и др.
Сезонный компонент временного ряда описывает поведение,
0,0
изменяющееся
регулярно в течение заданного периода (года, месяца,
недели, дня и т.п.). Состоит из почти повторяющихся циклов (пики
сезонных
заболеваний).
-0,2
Циклический
описывает
длительные
-0,2
0,0 компонент
0,2
0,4
0,6
0,8
1,0периоды1,2
относительного
подъема и спада и состоит из циклов, меняющихся по
2
КСО:КДО: r = 0,6027; r = 0,7764; p = 00,0000; КСО
y = 0,0923 + 0,7554*x
амплитуде и протяженности.
13. РЕГРЕССИОННЫЙ АНАЛИЗ
14. РЕГРЕССИОННЫЙ АНАЛИЗ
Параметры уравнений парной и множественной
регрессий могут быть определены с помощью метода
наименьших квадратов, который реализован в Excel.
Для этого используется функция Регрессия. Для ее
вызова необходимо выбрать требуемое имя в окне
диалога Анализ данных.
Проверить значимость уравнения регрессии – значит
установить, соответствует ли построенное уравнение
регрессии экспериментальным данным и достаточно
ли
включенных
в
уравнение
объясняющих
переменных для описания зависимой переменной.
Проверка
значимости
может
проводиться
по
следующим направлениям:
проверка значимости коэффициентов уравнения
регрессии;
проверка значимости уравнения регрессии;
15. Параметры
ПАРАМЕТРЫ
1. Входной интервал Y – вводится диапазон ячеек (один столбец), содержащих
исходные данные по результирующему признаку.
2. Входной интервал X – вводится диапазон ячеек (число столбцов равно
количеству признаков), содержащих исходные данные факторного признака.
3. Метки – флажок ставится, если первая строка содержит заголовок, в противном
случае будут созданы стандартные заголовки автоматически.
4. Уровень надежности – флажок устанавливается, если требуется ввести значение
уровня отличное от 95%. При выключенном флажке уровень надежности
принимается равным 95%.
5. Константа-ноль — флажок устанавливается в том случае, когда требуется, чтобы
линия регрессии прошла через начало координат, т.е. b=0
6. Параметры вывода – указывается место, где будут указаны таблицы
результатов анализа.
7. Остатки – при необходимости вывода столбцов остатков и графиков остатков и
подбора необходимо включить соответствующие флажки.
8. Нормальная вероятность – флажок устанавливается, если не требуется вывести
график зависимости наблюдаемых значений от автоматически формируемых
интервалов персентилей.
16. РЕГРЕССИОННЫЙ АНАЛИЗ
Множественный R – коэффициент корреляции.
R-квадрат – коэффициент детерминации.
Нормированный R-квадрат – нормированное значение коэффициента
корреляции.
Стандартная ошибка — стандартное отклонение для остатков.
Наблюдения — количество исходных наблюдений.
17. коэффициент детерминации
КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ
Одной
из наиболее эффективных оценок
адекватности
уравнения
регрессии
(мерой
качества «подгонки» регрессионной модели к
«наблюденным»
значениям
yi)
является
коэффициент детерминации R2, определяемый
по формуле:
18. коэффициент детерминации
КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ
Чем ближе R2 к 1, тем лучше регрессия аппроксимирует
эмпирические данные. Если R2 = 1, то эмпирические
точки (xi, yi) лежат на линии регрессии (Qe = 0), и между
X
и
Y
существует
линейная
функциональная
зависимость. Если R2 = 0 (Qe = Q), то вариации Y
полностью обусловлены воздействием неучтенных в
уравнении регрессии переменных, и линия регрессии
параллельна оси абсцисс.
Внимание!
Коэффициент
R2
имеет
смысл
рассматривать,
если
в
уравнении
регрессии
присутствует свободный член (в случае парной
линейной регрессии – коэффициент b0).
В случае парной линейной регрессии имеет место важное
тождество
19. РЕГРЕССИОННЫЙ АНАЛИЗ
Дисперсионный анализ – анализ изменчивости результативного
признака под влиянием каких-либо контролируемых переменных
факторов.
Дисперсионный анализ — статистический метод, применяемый для
выявления влияния отдельных факторов (количественных, порядковых или
качественных) на изучаемый признак и оценку степени этого влияния.
20. Дисперсионный анализ
ДИСПЕРСИОННЫЙ АНАЛИЗ
Если изучается действие количественного фактора, то предварительно
производится его разбивка на градации. Для каждой градации
подсчитывается среднее значение изучаемого признака, затем дисперсия
среднего по градациям фактора относительно общего среднего и, наконец,
общая дисперсия изучаемого показателя (независимо от значения
фактора).
В теории дисперсионного анализа показано, что общая дисперсия D равна
дисперсии средних по градациям фактора DF (доля дисперсии за счет
действия исследуемого фактора — объясненная дисперсия) плюс
остаточная дисперсия за счет действия случайных факторов (DS):
D = DF + DS.
Чем больше эта величина, тем сильнее влияние фактора на изучаемый
признак. Для количественной оценки степени влияния вычисляют
показатель F по формуле:
где L — число градаций фактора, N — объем статистической совокупности.
Показатель влияния F затем сравнивается со стандартным значением Fst
в таблице Фишера (для выбранного уровня значимости при
соответствующем числе степеней свободы). Если F > Fst то факт влияния
считается достоверно доказанным.
21. Дисперсионный анализ в системах имитационного моделирования
ДИСПЕРСИОННЫЙ АНАЛИЗ В СИСТЕМАХ
ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ
Статистический
метод
анализа
результатов
наблюдений,
зависящих
от
различных,
одновременно
действующих
факторов,
выбор
наиболее важных факторов и оценка их влияния.
С помощью него определяются количественные
отклонения наблюдений от средних значений.
Если какой-либо фактор не оказывает влияния на
отклик, то он является незначимым.
Главным эффектом фактора j называется
средняя
величина
изменения
в
отклике,
обусловленная переходом фактора j с уровня « – » на
уровень «+», в то время как остальные факторы
остаются без изменений.
22. Дисперсионный анализ
ДИСПЕРСИОННЫЙ АНАЛИЗ
Эффектом взаимодействия можно назвать
комбинированное влияние на отклик двух или более
факторов, проявляющееся помимо индивидуального
влияния всех этих факторов по отдельности.
Эффект взаимодействия определяется как
половина разности междy средним эффектом
фактора j1, когда фактор j2 находится на уровне «+»
(а все остальные факторы, кроме j1 и j2 остаются без
изменений) и средним эффектом фактора j1, когда
фактор j2 находится на уровне «-».
23. ГЛАВНЫЙ ЭФФЕКТ ФАКТОРА J
24. Факторный анализ
ФАКТОРНЫЙ АНАЛИЗ
Факторный анализ — совокупность методов исследования многомерных
признаков за счет снижения их размерности (путем введения так
называемых общих факторов, которые непосредственно наблюдаться не
могут). В медицине методы факторного анализа применяются для
решения двух взаимосвязанных задач: группировки исходной системы
признаков на основе их корреляционных связей и сжатия информации за
счет построения системы обобщенных индикаторов.
В факторной модели каждый исходный признак представляется в виде
комбинации новых показателей (общих факторов), число которых, как
правило, устанавливается меньше числа исходных. Такой метод
описания удобен, например, для получения обобщенных индексов,
характеризующих состояние системы здравоохранения различных
регионов или однородных учреждений (исходные показатели —
заболеваемость, смертность, количество профосмотров — заменяются
набором обобщенных показателей, определяющих ресурсное обеспечение,
качество врачебного обслуживания и т.п.).
Недостатком факторного анализа является трудность содержательной
интерпретации общих факторов.
25. РЕГРЕССИОННЫЙ АНАЛИЗ
Столбец df — число степеней свободы. Для строки Регрессия
показатель равен числу независимых переменных kr =k= m-1;
для строки Остаток — равен ko =n -(kr+1) =n-m;
для строки Итого – равен kr + ko
Столбец F – значение Fc , равное F критерию Фишера
Столбец значимость F — значение уровня значимости, соответствующее
вычисленной величине F критерия и равное вероятности P(F(kr ,ko ) Fc ) ,
где F(kr ,ko ) — случайная величина, подчиняющаяся распределению
Фишера с kr ,ke степенями свободы. Эту вероятность можно также
определить с помощью функции = FРАСП( Fc ;kr ;ke ).
Если вероятность меньше уровня значимости (обычно 0.05 ), то
построенная регрессия является значимой.
26. РЕГРЕССИОННЫЙ АНАЛИЗ
Помимо этого указываются нижние и верхние границы доверительных
интервалов для коэффициентов регрессии — Нижние 95%, Верхние 95%
Для проверки значимости коэффициентов сформулируем
статистические гипотезы:
H0: коэффициент b0 не значим
H1: коэффициент b0 значим
и примем уровень значимости (вероятность ошибки первого рода) равным =
0.05.
Если вероятность P-значение меньше уровня значимости , то
принимается гипотеза о значимости соответствующего коэффициента
регрессии.
27. РЕГРЕССИОННЫЙ АНАЛИЗ
На основе данных из полученных таблиц можно сделать следующие
выводы:
1. Уравнение регрессии имеет вид: . Y=-1,06+2,75 x
2. Значение коэффициента детерминации, равного 0,97 показывает,
что срок службы существенно влияют на затраты на ТО, что
подтверждает правильность включения его в построенную модель.
3. Рассчитанный уровень значимости Значимость F = 0,002
меньший
0,05
подтверждает
значимость
величины
коэффициента детерминации.
4. P-Значение для срока службы, равное 0,002 и меньшее 0,05
подтверждает значимость коэффициента b1
5. P-Значение для коэффициента превышает 0,05, это означает, что
данный коэффициент для модели не является значимым и его
можно опустить, т.е. график модели будет проходить через точку
начала координат b0
28. Функции Excel для регрессионного анализа
ФУНКЦИИ EXCEL ДЛЯ РЕГРЕССИОННОГО
АНАЛИЗА
Статистические функции Excel, полезные при
построении парной линейной регрессии.
Функция ОТРЕЗОК. Вычисляет коэффициент b0 и
обращение имеет вид
ОТРЕЗОК(диапазон_значений_ y ; диапазон_значений_
x ).
Функция НАКЛОН. Вычисляет коэффициент b1 и
обращение имеет вид
НАКЛОН(диапазон_значений_ y ; диапазон_значений_
x ).
29. Функции Excel для регрессионного анализа
ФУНКЦИИ EXCEL ДЛЯ РЕГРЕССИОННОГО
АНАЛИЗА
Функция ПРЕДСКАЗ. Вычисляет значение линейной парной
регрессии при заданном значении независимой переменной
(обозначена через z ) и обращение имеет вид
ПРЕДСКАЗ(z;диапазон_значений_y;диапазон_значений_ x ).
Функция ТЕНДЕНЦИЯ возвращает значения в соответствии с
линейным трендом. Аппроксимирует прямой линией (по методу
наименьших квадратов) массивы известные_значения_y и
известные_значения_x. Возвращает значения y, в соответствии с
этой прямой для заданного массива новые_значения_x.
ТЕНДЕНЦИЯ(y; x; n_x; конст):
y — известные_значения_y – множество значений y, для которых
уже известна линейная зависимость;
x — известные_значения_x — множество значений x, для которых
уже известна линейная зависимость;
n_x — новые_значения_x – новые значения x, для которых
функция возвращает соответствующие значения y.
конст – логическое значение, если оно равно 0, то свободный
член равен нулю, в противном случае свободный член
вычисляется обычным образом.
30. Регрессионный анализ данных
РЕГРЕССИОННЫЙ АНАЛИЗ ДАННЫХ
Функция
РОСТ
рассчитывает
прогнозируемый
экспоненциальный рост на основании имеющихся
данных:
РОСТ(y; x; n_x; конст):
y — известные_значения_y – множество значений y,
для которых уже известна экспоненциальная
зависимость;
x — известные_значения_x — множество значений x,
для которых уже известна экспоненциальная
зависимость;
n_x — новые_значения_x – новые значения x, для
которых функция возвращает соответствующие
значения y.
конст – логическое значение, если оно равно 0 или
отсутствует, то константа равна единице, в противном
случае вычисляется обычным образом.
31. РЕГРЕССИОННЫЙ АНАЛИЗ
После
проведения
эксперимента
необходимо
убедиться в существовании линейной зависимости,
адекватности линейной модели в пределах
выбранного диапазона значений входной величины.
Оценка отклонения от линейной базируется на
определении коэффициента детерминации.
Проведя расчеты, основанные на одних и тех же
исходных данных, для нескольких типов функций,
мы можем из них выбрать такую, которая дает
наибольшее значение R2
Чем больше R2, т. е. чем больше числитель, тем
больше изменение факторного признака объясняет
изменение результативного признака и тем,
следовательно, лучше уравнение регрессии, лучше
выбор функции.
Источник: ppt-online.org