Basé sur les données ou la théorie?
Le premier problème est de savoir si vous voulez que le composite soit axé sur les données ou axé sur la théorie? Si vous souhaitez former une variable composite, il est probable que vous pensez que chaque la variable de composant est importante pour mesurer un domaine global.
Dans ce cas, vous préférerez probablement un ensemble théorique de poids. Si, alternativement, vous êtes intéressé par ce qui est partagé ou commun entre les variables du composant, au risque de ne pas inclure l'une des variables car elle mesure quelque chose d'orthogonal ou moins lié à l'ensemble restant, alors vous voudrez peut-être explorer les données
Cette question correspond à la discussion dans la littérature sur la modélisation d’équations structurelles entre les mesures réflexives et formatives (par exemple, voir ici).
Quoi qu’il en soit vous faites, il est important d'aligner votre mesure avec votre question de recherche réelle.
Basé sur la théorie
Si le composite est théoriquement dirigé, vous voudrez former un composite pondéré des variables de composant où le poids attribué s'aligne sur votre pondération théorique du composant.Si les variables sont ordinales, vous devrez réfléchir à la façon de mettre à l'échelle la variable.Après avoir mis à l'échelle chaque variable de composant, vous devrez réfléchir à la pondération relative théorique et problèmes liés à la différence tous les écarts-types de la variable.Une stratégie simple consiste à convertir toutes les variables de composants en scores z et à additionner les scores z.Si vous avez des variables de composants, où certaines sont positives et d'autres négatives, vous devrez inverser soit juste les variables de composants négatives, soit seulement les variables de composants positives.
J'ai écrit un article sur la formation de composites qui aborde plusieurs scénarios de formation de composites.
Approches théoriques peut être implémenté facilement dans n'importe quel package statistique. score.items
dans le package psych
est une fonction qui le rend un peu plus facile, mais elle est limitée.
Vous pouvez simplement écrire votre propre équation en utilisant une arithmétique simple, et peut-être la fonction scale
.
Data Driven
Si vous êtes plus intéressé par les données, alors il existe de nombreuses approches possibles.
Prendre le premier composant principal semble être une idée raisonnable.
Si vous avez des variables ordinales, vous pourriez penser à l'ACP catégorielle qui permettrait aux variables des composants de être repondéré. Cela pourrait gérer automatiquement la quantification compte tenu des contraintes que vous fournissez.