IBM SPSS Categories

Pronostique resultados y conozca las relaciones entre sus datos categóricos

Libere todo el potencial de sus datos a través del análisis predictivo, conocimiento estadístico, mapas preceptuales, escalamiento de preferencias y técnicas de reducción de la dimensionalidad de sus datos. IBM SPSS Categories le proporciona todas las herramientas que necesita para obtener una visión clara de datos categóricos complejos y datos altamente dimensionales.

Por ejemplo, utilice IBM SPSS Categories para entender qué características relacionan estrechamente a los consumidores con su producto o marca, o determine la percepción que tienen sus clientes de sus productos en comparación con otros productos suyos o de la competencia.

Con IBM SPSS Categories, usted puede hacer una regresión cuando ambas variables, predictoras y de salida son numéricas, ordinales o nominales y puede interpretar visualmente datos y ver cómo las filas y las columnas se relacionan en tablas grandes de frecuencias, puntuaciones o rangos. Esto le permitirá:

  • Trabajar y entender datos ordinales y nominales en procedimientos similares a la regresión convencional, componentes principales y correlación canónica
  • Manipular residuos no normales en datos numéricos o relaciones no lineales entre variables predictoras y la variable de resultados. Utilice las opciones Regresión Ridge, Lasso, Elastic Net, selección de variables y selección de modelos para datos numéricos y categóricos
  • Use diagramas de doble y triple entrada para representar la relación entre los objetos (casos), categorías, y (conjuntos) variables en análisis de correlación
  • Represente similitudes entre uno o dos grupos de objetos como distancias en mapas perceptuales

    Más información

Convierta sus variables cualitativas en variables cuantitativas

Los procedimientos avanzados disponibles en IBM SPSS Categories le permiten llevar a cabo operaciones estadísticas adicionales en datos categóricos.

Utilice los procedimientos de escalamiento óptimo de IBM SPSS Categories para asignar unidades de medida y puntuaciones cero a sus datos categóricos. Esto abre un nuevo conjunto de funciones estadísticas al permitirle realizar análisis sobre variables con niveles de medida mixtos – por ejemplo, variables nominales, ordinales y numéricas.

La capacidad de IBM SPSS Categories de realizar una regresión múltiple con un escalamiento óptimo le da la oportunidad de aplicar una regresión cuando usted tiene mezclas de variables numéricas, ordinales y nominales así como predictoras y de resultados.

La última versión de IBM SPSS Categories incluye procedimientos avanzados para la selección y regularización del modelo. Usted puede realizar el análisis de correspondencia simple y múltiple para evaluar numéricamente las similitudes entre dos o más variables nominales en sus datos. También puede usar el análisis de correspondencia para cualquier tabla con entradas no negativas.

Y con el procedimiento de análisis de componentes principales, puede resumir sus datos de acuerdo con los componentes principales. Gráfico de dispersiones de dos y tres dimensiones, categorías y variables muestran sus relaciones. Estas opciones también se encuentran disponibles para datos numéricos. El escalamiento óptimo le ofrece una matriz de correlación basada en cuantificaciones de sus variables nominales y ordinales. Usted puede dividir sus variables en grupos, y luego analizar las relaciones entre estos grupos al usar análisis de correlación no lineal canónica.

Descubra las relaciones subyacentes gráficamente

Cualquiera que sea el tipo de categorías que estudie –segmentos de mercado, diagnósticos médicos, subculturas, partidos políticos, o especies biológicas – los procedimientos de escalamiento óptimo le liberan de las restricciones asociadas con las tablas de doble entrada, situando las relaciones entre las variables en un sistema de referencia más amplio. Puede ver un mapa de sus datos, no un simple informe estadístico.

Las técnicas de reducción de dimensiones de IBM SPSS Categories le permiten ir más allá de tablas inmanejables. A cambio, usted puede clarificar relaciones en sus datos mediante el uso de mapas perceptuales y gráficos de dispersión.

  • Los mapas perceptuales son gráficos de resumen de alta resolución que muestran las variables o categorías similares y cercanas unas a otras. Le proporcionan un conocimiento único entre más de dos variables categóricas
  • Los gráficos de dos y tres dimensiones le permiten ver las relaciones entre casos, variables y categorías. Por ejemplo, puede definir relaciones entre productos, clientes y características demográficas

Utilizando procedimientos de escalamiento de preferencias, visualiza las relaciones entre objetos. El algoritmo avanzado en el que se basa este procedimiento permite realizar análisis no métricos para datos ordinales y obtener resultados significativos. El procedimiento de escalamiento por proximidad (PROXSCAL) le permite analizar las similitudes entre los objetos, e incorporar características en el mismo análisis.

Cómo puede utilizar IBM SPSS Categories

Los siguientes procedimientos están disponibles para añadir significado a sus análisis de datos.

La regresión categórica (CATREG) predice los valores de una variable nominal, ordinal o numérica a partir de una combinación de variables categóricas predictoras que el procedimiento cuantifica a través de técnicas de escalamiento óptimo.Puede utilizar regresión con escalamiento óptimo para descubrir, por ejemplo, la relación que existe entre la satisfacción en el trabajo y el puesto que se desempeña, la región geográfica o la cantidad de viajes relacionados con el trabajo.

Las técnicas de escalamiento óptimo cuantifican las variables de modo que R se maximiza. El escalamiento óptimo puede ser aplicado a variables numéricas cuando éstas no están linealmente relacionadas con la variable de resultados. Tres nuevos métodos de estabilización: regresión Ridge, Lasso y Redes Elásticas mejoran la exactitud de la predicción al estabilizar las estimaciones del parámetro. La selección automática de variables hace posible analizar un gran volumen de grupos de datos- más variables que objetos. Al usar el escalamiento numérico, usted puede estabilizar una regresión al usar la regresión Lasso o la Red Elástica para sus datos numéricos.

Usted también puede usar CATREG para aplicar Modelos Aditivos Generalizados (GAM), para sus datos numéricos y categóricos.

Análisis de correspondencia (CORRESPONDENCE) le permite analizar tablas de doble entrada que contengan alguna medida de correspondencia entre filas y columnas. Puede mostrar las filas y las columnas como puntos en un mapa. Un tipo muy común de tablas de correspondencia es una tabla cruzada donde las celdas contienen frecuencias absolutas. IBM SPSS Categories visualiza las relaciones entre las categorías de estas variables nominales en una presentación visual.

Análisis de correspondencias múltiple (MULTIPLE CORRESPONDENCE) se utiliza para analizar datos categóricos multivariantes. Se diferencia del análisis de correspondencia simple en que le permite utilizar más de dos variables en su análisis. Con este procedimiento, todas las variables se analizan a un nivel nominal (categorías desordenadas).

Por ejemplo, puede utilizar el análisis de correspondencias múltiples para explorar las relaciones entre un programa de televisión, el grupo de edad y el género. Al examinar un mapa de dimensiones reducidas creado con IBM SPSS Categories, podrá ver qué grupos gravitan en cada programa revelando simultáneamente qué programas son los más parecidos.

Análisis categórico de componentes principales (CATPCA) emplea escalamiento óptimo para generalizar el procedimiento de análisis de componentes principales, de manera que se puedan acomodar variables de niveles de medida mixtos. Es un análisis similar al análisis de correspondencias múltiples, sólo que le permite especificar un nivel de análisis variable por variable.

Por ejemplo, puede mostrar las relaciones entre marcas de coches y características tales como precio, peso, eficacia del combustible, etc. Alternativamente, puede describir los coches por su clase (compactos, medianos, descapotables, todoterreno, etc.), el análisis CATPCA utiliza estas clasificaciones para agrupar los puntos para los coches. SPSS Categorias muestra relaciones complejas entre objetos, grupos y variables en un mapa dimensional que facilita el entendimiento de las relaciones.

Análisis no lineal de correlación canónica (OVERALS) utilice escalamiento óptimo para generalizar el procedimiento de análisis de correlación canónica, de manera que se puedan acomodar variables de niveles de medida mixtos. Este tipo de análisis le permite comparar más de un conjunto de variables con otro dentro de un mismo gráfico tras eliminar la correlación entre los conjuntos.

Por ejemplo, puede analizar las características de productos como sopas, en un estudio de degustación. Los jueces representan las variables dentro de los conjuntos, mientras que las sopas son los casos. OVERALS promedia las evaluaciones de los jueces luego de eliminar las correlaciones y combina las diferentes características para mostrar las relaciones entre las sopas.

Alternativamente, cada juez puede emplear su propio conjunto de criterios para juzgar las sopas. En este último caso, OVERALS promedia los criterios tras eliminar las correlaciones y entonces combina las puntuaciones de los diferentes jueces.

El procedimiento de OVERALS también puede usarse para generalizar regresiones múltiples cuando se tienen múltiples variables de salida a ser estimadas simultáneamente a partir de un conjunto de variables predictivas.

El escalamiento multidimensional (PROXSCAL) realiza escalamiento multidimensional de una o más matrices con similitudes o proximidades. Alternativamente puede calcular distancias entre casos en datos multivariantes como datos de entrada PROXSCAL. PROXSCAL, muestra las proximidades como distancias en un mapa con el fin de ganar conocimiento espacial de cómo se relacionan los objetos. En el caso de múltiples matrices de proximidades, PROXSCAL analiza las concordancias y traza las diferencias entre ellas.

Por ejemplo, puede utilizar PROXSCAL para mostrar las similitudes entre diferentes sabores de refrescos de cola preferidos por los consumidores, en varios grupos de edad. Puede descubrir que la gente joven enfatiza la diferencia entre sabores tradicionales y sabores nuevos; mientras que los adultos enfatizan las bebidas bajas en calorías y las normales.

Escalamiento de preferencias (PREFSCAL) examina visualmente las relaciones entre dos grupos de objetos, por ejemplo, consumidores y productos. El escalamiento de preferencias realiza despliegues multidimensionales con el objetivo de encontrar un mapa que represente las relaciones entre estos dos grupos representados como distancias entre puntos.

Por ejemplo, si un grupo de conductores clasifica 26 modelos de coches en 10 atributos en una escala de 6 puntos, podrá encontrar un mapa con clusters que muestre qué modelos son similares y a qué personas son a las que más les gusta estos modelos. Este mapa es el resultado de plasmar los diez diferentes atributos y mostrar la relación que existe entre los atributos y los modelos.

Mejor comprensión de las percepciones de los consumidores

Unos investigadores de mercado del Sur de Australia querían tener una mejor comprensión de cómo percibían los consumidores 6 marcas de café helado. Les pidieron
que clasificaran cada una de las marcas (nominadas AA a FF en la Figura 1) con 16 atributos categóricos distintos. En la tabla de 96 celdas que obtuvieron resultaba muy difícil para los analistas ver claramente las relaciones entre las marcas y los atributos percibidos.

Los investigadores de mercado utilizaron los procedimientos de correspondencia de SPSS para identificar los factores más fuertes subyacentes de la relación entre marcas y
atributos. Al asignar a cada marca y atributo un número específico dentro de cada dimensión, la información se muestra en un gráfico de fácil comprensión, comúnmente
denominado gráfico o mapa perceptual. Por ejemplo, se ve claramente en la Figura 1 que la marca AA es la marca más cercana que se ha identificado en el mercado con el
atributo “popular”. Similarmente, los investigadores pueden identificar rápidamente que los clientes interesados en la salud y en productos bajos en calorías perciben las marcas
CC y DD como las mejores; mientras que FF se percibe como una marca dulce.


* Fuente de datos y ejemplo: Kennedy, R., C. Riquier, y Byron Sharp.
1996. “Aplicaciones Practicas de Análisis de Correspondencia para Datos Categóricos en la Investigación de Mercados,” Journal of Targeting, Medidas y Análisis para el Marketing, Vol. 5, No. 1, pp. 56-70..