A análise de regresión é un dos métodos máis populares de investigación estatística. Con el, pode establecer o grao de influencia das variables independentes na variable dependente. Microsoft Excel ten ferramentas para realizar este tipo de análises. Vexamos o que son e como usalos.
Paquete de análise de conexión
Pero, para usar unha función que permita a análise de regresión, primeiro hai que activar o paquete de análise. Só entón as ferramentas necesarias para este procedemento aparecerán na cinta de Excel.
- Mover á pestana "Ficheiro".
- Ir á sección "Opcións".
- Ábrese a ventá de opcións de Excel. Ir á subsección Complementos.
- Na parte inferior da xanela que se abre, reorganice o interruptor no bloque "Xestión" en posición Complementos de Excelse está nunha posición diferente. Pulsamos o botón "Vaia".
- Ábrese a ventá de complementos de Excel. Insira unha marca preto do elemento "Paquete de análise". Fai clic no botón "Aceptar".
Agora cando imos ao separador "Datos", nunha cinta nun bloque de ferramentas "Análise" veremos un novo botón - "Análise de datos".
Tipos de análises de regresión
Hai varios tipos de regresións:
- parabólica;
- poder;
- logarítmica;
- exponencial;
- indicativo;
- hiperbólico;
- regresión lineal.
Falaremos máis sobre a implementación do último tipo de análise de regresión en Excel.
Regresión lineal en Excel
Debaixo, a modo de exemplo, preséntase unha táboa que mostra a temperatura media diaria do aire exterior e o número de compradores de tendas para o día laborable correspondente. Descubrimos coa axuda da análise de regresión, como poden afectar exactamente as condicións meteorolóxicas en forma de temperatura do aire a asistencia dun establecemento comercial.
A ecuación de regresión xeral dun tipo lineal é a seguinte:Y = a0 + a1x1 + ... + akhk
. Nesta fórmula Y significa unha variable, a influencia dos factores nos que estamos a tentar estudar. No noso caso, este é o número de compradores. Significado x - Estes son varios factores que afectan á variable. Parámetros a son coeficientes de regresión. É dicir, determinan a importancia dun determinado factor. Índice k Denota o número total destes factores.
- Fai clic no botón "Análise de datos". Colócase na pestana. "Fogar" no bloque de ferramentas "Análise".
- Ábrese unha pequena ventá. Nel, selecciona o elemento "Regresión". Pulsamos o botón "OK".
- Ábrese a ventá de configuración de regresión. Nel, os campos requiridos son "Intervalo de entrada Y" e "Intervalo de entrada X". Pódense deixar por defecto todos os outros axustes.
No campo "Intervalo de entrada Y" especificamos o enderezo do intervalo de celas onde se atopan os datos variables, a influencia dos factores nos que estamos intentando establecer. No noso caso, estes serán celas na columna "Número de compradores". O enderezo pódese introducir manualmente desde o teclado, ou simplemente pode seleccionar a columna desexada. A última opción é moito máis sinxela e cómoda.
No campo "Intervalo de entrada X" introduza o enderezo do intervalo de celas onde se atopan os datos do factor, cuxa influencia sobre a variable que desexamos establecer. Como se mencionou anteriormente, necesitamos determinar o efecto da temperatura sobre o número de clientes na tenda e, polo tanto, introducir a dirección das celas na columna "Temperatura". Isto pódese facer do mesmo xeito que no campo "Número de compradores".
Coa axuda doutras opcións, pode establecer etiquetas, nivel de fiabilidade, constante cero, mostrar un gráfico da probabilidade normal e realizar outras accións. Pero, na maioría dos casos, estas configuracións non precisan ser modificadas. O único que debería prestar atención son os parámetros de saída. De xeito predeterminado, os resultados da análise aparecen noutra folla, pero ao reorganizar o conmutador, pode axustar a saída no intervalo especificado na mesma folla onde se atopa a táboa cos datos orixinais ou nun libro separado, é dicir, nun novo ficheiro.
Despois de definir todos os axustes, faga clic no botón. "OK".
Análise dos resultados da análise
Os resultados da análise de regresión móstranse en forma de táboa no lugar indicado na configuración.
Un dos principais indicadores é R-squared. Indica a calidade do modelo. No noso caso, esta proporción é de 0.705, ou do 70,5%. Este é un nivel de calidade aceptable. A dependencia inferior a 0,5 é mala.
Outro indicador importante está situado na cela na intersección da liña. "Intersección Y" e columna Probabilidades. Indica que valor estará en Y, e no noso caso, este é o número de compradores, con todos os outros factores iguais. Nesta táboa, este valor é 58,04.
Valor na intersección do gráfico "Variable X1" e Probabilidades mostra o nivel de dependencia de Y en X. No noso caso, este é o nivel de dependencia do número de clientes da tenda na temperatura. Un coeficiente de 1,31 considérase un indicador de influencia bastante elevado.
Como podes ver, usar Microsoft Excel é bastante fácil de crear unha táboa de análise de regresión. Pero só unha persoa adestrada pode traballar cos datos de saída e comprender a súa esencia.