Estatística multivariante
Os métodos estadísticos multivariantes e a análise multivariante son ferramentas estatísticas que estudan o comportamento de varias variables ó mesmo tempo, incluíndo a dependencia dunhas fronte a outras. Úsanse principalmente para buscar as variables menos representativas para poder eliminalas, simplificando así modelos estatísticos nos que o número de variables sexa un problema e para comprender a relación entre varios grupos de variables. Algúns dos métodos máis coñecidos e utilizados son a Regresión lineal e a Análise discriminante.
Pódense sintetizar dous obxectivos claros:
- Proporcionar métodos nos que a finalidade é o estudo conxunto de datos multivariantes que a análise estatística uni e bidimensional é incapaz de conseguir.
- Axudar ó analista ou investigador a tomar decisións óptimas no contexto no que se encontre tendo en conta a información dispoñible polo conxunto de datos analizado.
Existen diferentes modelos e métodos, cada un co seu tipo de análise:
- Métodos de Dependencia:
- Un Estudo de regresión permítenos descubrir ata que punto unha variable pode ser prevista coñecendo outra. Utilízase para intentar predicir o comportamento de certas variables a partir doutras, como por exemplo os beneficios dunha película a partir do gasto en mercadotecnia e do gasto en produción.
- A Análise da Correlación canónica intenta analizar a posible existencia de relación entre dous grupos de variables.
- Unha Análise discriminante pódenos dar unha función discriminante que pode ser utilizada para distinguir entre dous ou máis grupos, e deste modo tomar decisións.
- Unha análise multivariante da varianza (MANOVA), estendendo a análise da varianza (ANOVA), cobre os casos nos que se coñeza a existencia de máis dunha variable dependente sen poderse simplificar máis o modelo.
- A Regresión loxística permite a elaboración dunha análise de regresión para estimar e probar a influencia dunha variable sobre outra, cando a variable dependente ou de resposta é de tipo dicotómico .
- Métodos de Interdependencia:
- A Análise de compoñentes principais (PCA) procura determinar un sistema máis pequeno de variables que sinteticen o sistema orixinal.
- A Análise clúster clasifica unha mostra de entidades (individuos ou variables) nun número pequeno de grupos de forma que as observacións pertencentes a un grupo sexan moi similares entre si e moi disimilares do resto. A diferenza da análise discriminante, descoñécese o número e a composición de ditos grupos.
- Métodos Estruturais: Analizan as relacións existentes entre un grupo de variables representadas por sistemas de ecuacións simultáneas nas que se supoñen que algunhas delas (denominadas constructos) mídense con erro a partir doutras variables observables denominadas indicadores. Os modelos utilizados constan, polo tanto, de dúas partes: un modelo estrutural que especifica as relacións de dependencia existente entre as constructos latentes e un modelo de medida que especifica como os indicadores relaciónanse cos seus correspondentes constructos.