Наклон линии регрессии является мерой крутизны линии. Это числовое значение, которое сообщает нам, как связаны две переменные. Он сообщает нам, насколько изменится зависимая переменная в случае изменения независимой переменной.

Есть несколько способов найти наклон линии регрессии для заданного набора переменных в Excel:

  • Использование функции SLOPE (НАКЛОН)
  • Использование точечной диаграммы Excel

В этом уроке я покажу вам, как рассчитать уклон, используя каждый из вышеупомянутых методов.

Что такое наклон? Обзор

Наклон — это значение, которое сообщает нам, как два значения (обычно называемые значениями x и y) связаны друг с другом.

Чтобы дать вам простой пример, если у вас есть данные о росте и годовом доходе некоторых людей и вы рассчитываете наклон для этих данных, он подскажет вам, существует ли положительная или отрицательная корреляция между этими точками данных.

Значение наклона может быть положительным или отрицательным.

В нашем примере, если значение наклона равно 138, это означает, что существует положительная корреляция между ростом и доходом людей. Так что если рост увеличится на 1 сантиметр, доход, скорее всего, увеличится на 138 долларов.

Помимо наклона, еще одна вещь, о которой вам нужно знать, — это Intercept.

Позвольте мне объяснить это уравнением:

Y = Slope*X + Intercept

В этом уравнении мы уже вычислили наклон, но чтобы точно знать, каким будет значение Y для данного значения X, вам также необходимо знать точку пересечения.

К счастью, в Excel есть формула для этого, и я расскажу, как вычислить перехват во всех методах.

Метод 1: Использование функции наклона (SLOPE) Excel

Самый простой способ рассчитать уклон в Excel — использовать встроенную функцию SLOPE .

Она находит значение наклона заданного набора координат xy за один шаг.

Хотя вычислить уклон вручную может быть сложно, с функцией SLOPE вам просто нужно указать ей значения x и y, и она сделает всю тяжелую работу в бэкэнде.

Синтаксис функции SLOPE в Excel

Синтаксис функции наклона:

=SLOPE(y_vals, x_vals)

Здесь y_vals и x_vals каждый состоит из массива или диапазона ячеек, содержащих числовые зависимые значения данных.

Помните, что вам нужно указать значения Y в качестве первого аргумента и значения X в качестве второго аргумента . Если вы сделаете наоборот, вы все равно получите результат, но он будет неверным.

Предположим, у вас есть приведенный ниже набор данных, как показано ниже, где у меня есть рост (в см) как значения X и средний годовой доход (в долларах США) как значения Y.

Ниже приведена формула для расчета уклона с использованием этого набора данных:

=SLOPE(B2:B11,A2:A11)

Приведенный выше результат говорит мне, что из этого набора данных я могу предположить, что в случае увеличения роста на 1 см доход увеличится на 138,58 долларов США.

Еще одна распространенная статистическая величина, которую люди часто вычисляют при работе с уклоном, — это вычисление значения пересечения .

Чтобы обновить, уравнение наклона выглядит примерно так:

Y = Slope*X + Intercept

Хотя нам известен наклон, нам также необходимо знать значение точки пересечения, чтобы убедиться, что мы можем вычислить значения Y для любого значения X.

Это легко сделать с помощью следующей формулы:

=INTERCEPT(B2:B11,A2:A11)

При этом наше уравнение для этого набора данных становится:

Y = 138,56 * X + 65803,2

Итак, если я спрошу вас, каков будет доход любого человека, рост которого составляет 165 см, вы легко сможете рассчитать его стоимость.

Y = 138,56 * 165 + 65803,2

Значения наклона и точки пересечения могут быть положительными или отрицательными.

Что следует помнить при использовании функции SLOPE в Excel

Вот несколько моментов, которые следует помнить при нахождении наклона линии регрессии с помощью функции SLOPE:

  • Аргументы функции SLOPE должны быть числовыми (также принимаются значения DATE). Если какая-либо из ячеек пуста или содержит текстовую строку, они будут проигнорированы.
    • Если в какой-либо ячейке / ячейках стоит «0», он будет использован при вычислении.
  • При использовании в качестве входных данных для функции SLOPE должно быть равное количество значений x и y. В случае, если вы дадите ему диапазоны неравных размеров, вы получите ошибку # N / A
  • Должно быть несколько наборов точек, иначе функция SLOPE вернет #DIV! ошибка

Метод 2 — Использование точечной диаграммы для получения значения наклона

Если вы предпочитаете визуализировать данные и линию регрессии, вы можете нанести данные на диаграмму рассеяния и использовать ее, чтобы найти наклон и точку пересечения линии тренда (также называемой линией наилучшего соответствия).

Предположим, у вас есть набор данных, показанный ниже, и вы хотите узнать наклон и точку пересечения для этих данных:

Ниже приведены шаги для этого:

  • Выберите точки данных X и Y (в нашем примере это будут столбцы высоты и дохода).
  • Щелкните вкладку «Вставка» на ленте.

  • Щелкните раскрывающееся меню «Вставить разброс» (в группе «Диаграммы»).
  • В появившемся раскрывающемся списке выберите параметр «Точечная диаграмма».

  • Это вставит точечную диаграмму в ваш рабочий лист, отображая ваши значения xy в виде точек разброса (как показано ниже).

  • Щелкните правой кнопкой мыши одну из точек разброса и выберите «Добавить линию тренда» в появившемся контекстном меню. Это вставит линию тренда, а также откроет панель «Форматировать линию тренда» справа.

  • На панели «Форматирование линии тренда» в разделе «Параметры линии тренда» установите флажок «Отображать уравнение на диаграмме».

  • Закройте панель «Форматировать линию тренда»

Приведенные выше шаги позволят вставить диаграмму рассеяния с линией тренда, а линия тренда также имеет уравнение наклона и пересечения.

В нашем примере мы получаем следующее уравнение:

у = 138,56x + 65803

Здесь:

  • 138,56 — наклон линии регрессии
  • 65803 — точка пересечения линии регрессии

Вы можете сравнить это со значениями, которые мы получили от функций SLOPE и INTERCEPT (это то же значение).

Если значение наклона положительное, вы увидите, что линия тренда идет вверх, а если значение наклона отрицательное, вы увидите, что линия тренда идет вниз. Крутизна склона будет зависеть от его значения уклона.

Хотя метод формулы для вычисления наклона и пересечения несложен, преимущество использования метода точечной диаграммы заключается в том, что вы можете визуально увидеть распределение точек данных, а также наклон линии регрессии.

И в случае, если вы все равно создаете диаграмму рассеяния для своих данных, получение значения наклона путем добавления линии тренда на самом деле будет быстрее, чем использование формул.

Итак, это два действительно простых способа, которые вы можете использовать для вычисления наклона и значения пересечения набора данных в Excel.

Надеюсь, вы нашли этот урок полезным.

Как найти уклон в Excel? Использование формулы и диаграммы