Réflexions sur l’amorçage sémantique et les tests psychologiques

Connaissez-vous l’amorçage sémantique ? De nombreuses études ont été publiées sur ce sujet.

Le principe en est très simple, il repose sur le fait que la répétition de X mots du même domaine sémantique a une influence non-négligeable sur la psychologie du sujet pour un temps Y.

Par exemple, il a été démontré que si on demande à une personne de nous trouver le plus de mots possible autour des notions de « vérité » et « honnêteté », elle est, par la suite, significativement plus prompte à dire la vérité sur d’autres questions qui n’ont rien à voir.

Dans un autre domaine, il a été montré que le vocabulaire des personnes est moins étendu après avoir vu un film d’horreur qu’une comédie.

Bref, vous l’aurez compris, l’amorçage sémantique c’est un vecteur d’influence.

Quel rapport avec les tests psychologiques ?

Simple : Dans les tests de type « boite à chaussure » les personnes lisent avec attention un rapport listant tous les traits de sa personnalité sur le ton lyrique des discours horoscopiques, c’est-à-dire de la paraphrase en veux-tu en voilà.

Pour avoir fait l’exercice de résumer toutes les interprétations possibles des typologies MBTI et autres Socionique, une chose apparaît avec évidence: toutes ces descriptions ont été construites de la même façon : broder autour de 2 ou 3 notions en les déclinant à toutes les sauces, en amour, en travail, en santé, à la tienne Etienne.

Et voilà donc la situation : on a une personne qui lit X paragraphes, utilisant en plus le « vous êtes »,  c’est-à-dire, a priori, le présupposé accepté que les adjectifs des paragraphes s’appliquent à elle !

Les conséquences logiques

Les descriptions de types de personnalité sont de fabuleux amorçages sémantiques !

Si le type donné correspond à l’image que la personne a d’elle-même, il s’agira d’un merveilleux exercice de renforcement. Dans le cas contraire, si les résultats sont à côté de la plaque, il s’agira d’une sorte de remise en question par reprogrammation.

Le plus rigolo dans tout ça, c’est que les personnes font des tests pour essayer de faire le point et avancer.

Or, si on considère l’amorçage sémantique, de toute évidence, ce sont les tests les moins performants et perspicaces qui ont le plus de chance d’amener et d’aider la personne à remettre en question certains de ses traits !

Aussi, si  une personne autour de vous a fait un test psychologique pertinent, sachez qu’a priori elle devrait être particulièrement elle-même pendant 2 ou 3 jours !

Finalement, les personnes devraient répondre aux questions des tests selon ce qu’elles voudraient être et non ce qu’elle pense qu’elles sont…

Amusant non ?

Le pire, c’est que cela nous a donné une idée … qui passera par une commission d’éthique sur le thème  » la fin justifie-t-elle les moyens? « . Y a de l’expérience dans l’air !

A suivre !

Trouver une methode de profilage automatique

Rappel: 640 000 observations sur 131 items sur 12 ans , tous âges, sexe, CSP

Il s’agit ici d’une réflexion à voix haute sur une problématique qui nous occupe. Les commentaires sont donc bienvenus.

Les données du problème

L’objectif est qu’à l’issue du test, les résultats permettent de dire si le profil de la personne correspond à une catégorie professionnelle. Autrement dit, de pouvoir dire à un employé qu’il a le profil d’un cadre, ou à un cadre qu’il a le profil d’un chômeur. (un peu d’humour noir …. 🙂 )

Le plus simple étant de prendre un exemple, nous nous baserons sur les « cadres du secteur informatique ».

La première étape est donc de repérer si les « cadres du secteur informatique » répondent différemment des autres catégories professionnelles et, en les rassemblant, générer un indicateur.

Empirique

Nous avons généré toutes les moyennes des 131 questions par catégorie professionnelle. Pour des raisons de confidentialité, nous ne pouvons les rendre public.

Pour autant, nous pouvons sortir quelques chiffres, pour le moins, étonnants.

Pour l’exemple qui nous préoccupe, la Q1 « Je fais attention à ma façon de m’habiller «  marque une différence !

Les cadres du secteur informatique ont une moyenne de 1.93 pts (de 1 à 4. oui =1 , non =4, neutre =2.5)

et les cadres « autres secteurs » ont une moyenne de 1.73 pts.

C’est une différence énorme ! Elle s’interprète facilement : Les cadres du secteur informatique font moins attention à leur façon de s’habiller que les autres. (En cela… pas de commentaires 🙂 )

Oui, mais comment le repérer ? :

– Avec une moyenne de 1.93 pt, nous sommes sur une réponse de type « plutôt oui » , mais avec 1.73 pts aussi ! Nous ne pouvons donc pas repérer sur cette simple question la différence entre les personnes.

Passer outre la méthode classique

La méthode classique la plus simple (que nous utilisons sur d’autres types de résultats au test) consiste à attribuer des points suivant la réponse. L’incrément est linéaire, par exemple : oui = 10pts, plutôt oui=6.5pts, plutôt non=2.5 pts et non=0pts.

Puis de créer un indicateur en moyenne de différentes questions suivant leur importance. Par exemple ( Q1 x 2 + Q123 x5 + Q321 x1 ) / 8 = résultat

Mais dans notre problème, cette méthode sera difficile à mettre en place car elle ne reflète pas « les tendances » par profils. Elle nous oblige à tout faire reposer sur l’importance des questions.
Autrement dit, il y a une sorte de perte d’information dans l’équation que nous serons condamné à essayer de recréer.

La conclusion s’impose : Nous devons trouver un moyen de refléter les différences de profils dans la cotation des réponses.

Autrement dit, nous devons trouver une méthode d’attribution des points non-linéaire et fonction des différences de moyennes.

La nouvelle méthode que nous allons tester

Soit les cadres du secteur informatique avec une moyenne à la Q1 de 1.93 pts , soit 0.25 > à moyenne générale (1.68)

Soit les cadres autres secteurs avec une moyenne à la Q1 de 1.73 pts, soit 0.05 > à moyenne générale

Nous partirons du principe que pour un cadre informatique, le fait de « ne pas faire attention à la façon de s’habiller » est plus courant que pour les autres (sauf les retraités qui montent à 2.09…)

aussi, au lieu d’attribuer la Q1 de la forme 10->6.5->2.5->0, nous coterons la Q1 de la forme 0->10->10->10 , et nous donnerons à cette question un facteur de 25 (écart x 100)

En d’autres termes, nous devons, dans le score final, prendre en compte que pour un cadre informatique, il n’est pas « normal » de faire très attention à la façon de s’habiller, alors que cela peut l’être dans toutes les autres catégories professionnelles.

Autrement dit, la formule finale, appliquée aux 131 questions du test de personnalité, sera composée de ( Ecart_moyenne_totale x 100) x poids + etc.

TODO (à faire)

  1. Ecrire un programme qui établis automatiquement l’équation
  2. vérifier que l’équation donne bien un score nettement différent que les autres CSP
  3. vérifier le taux de positifs sur 100 000 fiches

A suivre …

 

 

 

 

 

A la recherche de ce qui ne varie pas – Partie 2

Suite de notre recherche de ce qui ne varie pas sur 12 ans de données et 640 000 observations

Article précédent : La question « j’aime manger »

 

Nous allons à présent regarder de plus près

la Question 326 : »Les formes sensibles ne sont qu’un renseignement »

D’emblée, nous avons parfaitement conscience que cette question est difficile. Il est donc probable que beaucoup de sujets aient répondu au hasard, ce qui expliquerait sa constance proche de la moyenne neutre à 2.50 pts.

Pour autant, cette question pose aussi 2 paradigmes de la perception :

1. Ce que je perçois est de la pure information.

2. Ce que je perçois contient du sens en plus de la simple information.

De plus, et c’est là une bonne surprise, les variations de moyennes font passer de oui à non et inversement !

Variations par années et par mois

Aucune variation notable de 2001 à 2013, la moyenne reste à 2.56 (Ecart moyen de 0.02), c’est-à-dire, plutôt non.

 

Par genre, entre les hommes et les femmes

Si les personnes ont répondu au hasard, alors les hommes et les femmes n’ont pas le même hasard …

B_Q326
B_genre Moyenne N Ecart type
1 2.48 243812 .919
2 2.61 398668 .956
Total 2.56 642480 .945

 

Là c’est vraiment intéressant. Non seulement il y a un écart non-négligeable entre les hommes et les femmes sur cette question, mais en plus il s’agit d’une réponse opposée !

Pour les hommes, OUI, les formes sensibles ne sont qu’un renseignement.
Pour les femmes, NON, les formes sensibles ne sont pas qu’un renseignement.

Et pour le coup, ce résultat nous a tellement surpris que nous vous donnons aussi le comptage pour bien mesurer l’impossibilité d’une erreur.

Il semble donc qu’en cherchant ce qui ne varie pas, nous ayons trouvé une des différences fondamentales entre les hommes et les femmes (sans dire pour autant sa cause, culturelle, biologique etc.) . Autrement dit, l’un et l’autre perçoivent le réel différemment. Les hommes perçoivent de l’information, les femmes perçoivent du sens.

Mais nous ne sommes pas au bout de nos surprises…

Variations par âge

B_Q326
B_age Moyenne Ecart type
0-16 2.56 .969
16-18 2.59 .928
18-25 2.59 .926
25-35 2.54 .949
35-45 2.46 .994
45-55 2.39 .997
55+ 2.30 .975
Total 2.56 .945

Ces chiffres sont particulièrement importants. Avec l’âge la réponse passe de NON (jusqu’à 35 ans) à OUI (au-delà)

Résumé vulgairement, quand on est jeune on croit que tout à du sens, à 40 ans, on y croit plus ! C’est la crise de la quarantaine !

Par métier

B_Q326
B_cspintra Moyenne Ecart type
Cadres (informatique, télécoms) 2.50 .882
Cadres autres secteurs 2.50 .907
Chefs d’entreprises 2.44 .947
Professions libérales 2.46 .991
Professions intellectuelles, artistiques 2.60 .992
Chercheurs ou médecins des hopitaux 2.48 .968
Enseignants ou personnels de la santé 2.55 .967
Etudiants 2.60 .912
Collégiens-Lycéens 2.59 .942
Agriculteurs exploitants 2.52 .967
Ouvriers spécialises ou agricoles 2.48 .988
Artisans 2.50 1.008
Commercants et assimilés 2.49 .992
Employés (informatique, télécoms) 2.56 .926
Employés de la fonction publique 2.53 .977
Employés des entreprises 2.55 .960
Retraités, pré-retraités 2.25 .957
Chomeurs et inactifs 2.55 .996

Pour les retraités, oui, les formes sensibles ne sont qu’un renseignement, et cela confirme la courbe descendante selon l’âge

Et pour les intellectuels et les artistes, non, il y a plus dans les formes sensibles.

Voilà les 2 opposés.

Conclusion

Mine de rien, par cette simple analyse de surface, 2 observations importantes :

Alors que cette question semble indépendante de l’époque (invariante sur 12 ans), elle a la particularité d’opposer 2 visions du réel. Nous aurions pu penser, qu’étant donné la difficulté de la question, les réponses seraient pour le moins toutes orientées selon la même tendance. Et c’est là la surprise : Les variations sont de l’ordre de la réponse opposée.

Ainsi, hommes et femmes sont plus que différents, il sont opposés sur cette question.

De même, l’âge fait changer d’avis sur la question .

Nous regrettons de ne pas avoir demandé des 1999 l’âge exact des sujets, ce qui nous aurait permis de définir exactement l’âge de « bascule ».

Nous pouvons donc dire que cette question est invariante, a priori culturellement, mais qu’elle reste particulièrement dépendante de l’expérience du réel, au sens du vécu.

Plus que cela, nous pouvons plus philosophiquement affirmer que la prise de position de « percevoir du sens », ou « il y a du sens », est durement mise à l’épreuve au fil des années vécues… au point même d’être abandonnée autour de 40 ans…

Prophétie hypothétique : Il nous paraîtrait étonnant qu’un tel changement de paradigme ne s’accompagne pas de changement physiologique, en cause ou en effet.

To be continued

A la recherche de ce qui ne varie pas – repérage

Toutes ces données accumulées sont un peu comme une boite de pandore. Il y a tout à comprendre, à analyser, sur tous les axes, dans toutes les dimensions.

Mais en écrivant les travaux préliminaires sur la différence entre les hommes et les femmes, nous nous sommes aperçu qu’au milieu de toutes ces chiffres qui varient, ce qui est vraiment intéressant du coup est ce qui ne varie pas.

Quelles sont donc ces questions sur lesquelles les moyennes ne changent pas dans le temps, ni par âge, ni par genre ?

Autrement dit, quels sont ces sujets qui sont indépendants de l’époque, de l’expérience ou des hormones ?

Voilà une belle quête.

Ni une ni deux, nous avons fait tourner nos logiciels de statistique sur cette recherche. Et la réponse est incroyable :

Les 2 questions dont les réponses moyennes ont un écart moyen de 0.02 (sur 4pt) sur 12 ans et 605 000 observations :

 

Il s’agit de la Q3 : « J’aime manger »

et de la Q326 : « Les formes sensibles ne sont qu’un renseignement  »

2 belles analyses en perspectives ! Car si ces deux questions ne varient pas sur 12 ans, reste tout de même à vérifier que c’est vrai aussi avec l’âge et avec le genre.

Pendant que nous y sommes, il y a aussi LA question qui varie le plus sur 12 ans, avec un écart moyen de 0.19 (presque 10 fois plus).

Il s’agit de la question Q353 : « Je récompense facilement les efforts des autres » …

To be continued

 

Différence entre les hommes et les femmes

Travaux préliminaires

Base 640 000 observations sur 12 ans – fichedepersonnalite.com – LAINE Pierre-jean

 

Introduction

Soyons clair, sur le sujet, tout a été dit. Tout ou presque. Notre propos est ici d’aborder cette question de la différence ou de la similarité des genres par le biais de notre base de données.

Autrement dit, comment s’expriment les différences entre les hommes et les femmes sur 12 ans de collecte de donnée (640 000 observations) et 131 questions (item) ?

Le système de notation : les valeurs vont de 1 (oui) à 4 (non), la moyenne neutre est donc de 2.5

Première passe :

Nous avons simplement, pour chacune des questions, regardé la valeur absolue de la différence de score entre les hommes et les femmes, tous âges, toutes CSP, et ce, par année et mois, de 2001 à 2014

Résultats :

  • 62 questions ont un écart moyen négligeable inférieur à 0.10 points
  • 28 questions ont un écart moyen supérieur à 0.20 points
  • 9 questions (sur les 28) ont un écart moyen supérieur à 0.30 points

Nous pourrions penser, d’emblée, qu’il y a donc une différence notable entre les genres. Pour autant, ce n’est pas aussi simple que cela.

Il a déjà été prouvé et rabâché que certaines fonctions (motrices par exemples) sont différentes entre les sexes. Ce qui nous intéresse est plutôt de l’ordre des différences psychologiques.

Est-ce à dire que nous allons étudier les questions une par une pour analyser et évaluer leur pertinence sur le sujet qui nous préoccupe ? Non. Il y a plus simple à faire.

Nous allons tester une hypothèse :

S’il est vrai que petit à petit, dans nos pays francophones, culturellement, la différence entre les hommes et les femmes s’amenuise, alors, sur 12 ans, nous devrions retrouver l’amenuisement de cet écart. Plus que cela, nous devrions être en mesure, théoriquement, de définir un indicateur d’égalité.

Autrement dit, nous devrions être en mesure d’identifier :

  • GROUPE 1 : Les questions qui ont un écart faible et invariant, c’est-à-dire les sujets sur lesquels ni la culture, ni la physiologie n’a d’incidence.
  • GROUPE 2 : Les questions qui ont un écart important, mais une faible variation. Ces questions seront donc directement liées aux différences physiologiques entre les sexes
  • GROUPE 3 : Les questions qui ont un écart important, et qui ont des variations importantes dans le temps. Ces questions seront donc les sujets sur lesquels les différences entre hommes et femmes sont imputables à la culture et au contexte

 

Observations

Groupe 1 : Faible écart (NEC), faibles variations (NV)

NEC NV

2001

   0.01

2002

             0.01

2003

             0.02

2004

             0.01

2005

             0.02

2006

             0.02

2007

             0.02

2008

             0.02

2009

             0.02

2010

             0.02

2011

             0.01

2012

             0.01

2013

             0.02

2014

             0.01

clip_image002

Ce groupe est indexé sur la moyenne de 23 questions avec variation d’écart moyen (écart type) inférieur à 0.02 par mois, et écart moyen total inférieur à 0.10

Analyse :  Nous constatons que, même si l’indice change sensiblement pour les femmes et les hommes, l’écart lui, reste stable.

Nous pouvons donc en déduire 2 conclusions a priori :

  • Les 23 questions représentent un indice qui subit des variations chez les femmes et chez les hommes séparément depuis 2012 /2013. Nous ne pouvons rien dire de la cause de ses variations.
  • Les variations de cet indice n’ont aucun impact sur l’écart entre les hommes et les femmes. Les deux sexes varient avec la même amplitude.

Donc, cet ensemble de 23 questions semble être un bon indicateur de la similarité invariante entre les genres.

 

Groupe 2 : Grand écart (GDEC), faibles variations (NV)

GDEC NV

2001

             0.06

2002

             0.04

2003

             0.06

2004

             0.05

2005

             0.06

2006

             0.06

2007

             0.06

2008

             0.05

2009

             0.04

2010

             0.05

2011

             0.05

2012

             0.04

2013

             0.05

2014

             0.05

clip_image004

Ce groupe est indexé sur la moyenne de 11 questions avec variation d’écart moyen inférieur ou égal à 0.02 par mois, et écart moyen total supérieur à 0.20

Analyse :  Nous constatons que cet indice change sensiblement pour les femmes et les hommes en 2012/2013. Cette variation n’a pas d’impact sur les variations d’écarts.

Cet indicateur est censé représenter les différences irréductibles (donc physiologiques) entre les hommes et les femmes, et être invariant.

Groupe 3 : Grand écart (GDEC), Grandes variations (GDV)

GDEC GDV

2001

             0.05

2002

             0.08

2003

             0.09

2004

             0.07

2005

             0.11

2006

             0.13

2007

             0.13

2008

             0.15

2009

             0.13

2010

             0.14

2011

             0.14

2012

             0.12

2013

             0.13

2014

             0.11

 

clip_image006

Ce groupe est indexé sur la moyenne de 8 questions avec variation d’écart moyen supérieur ou égal à 0.03 par mois, et écart moyen total supérieur à 0.20

Analyse :  Nous constatons que :

  • L’écart se réduit depuis 2011, après 10 ans de hausse.
  • Les indices séparés Hommes/Femmes ne sont pas du tout synchronisés.

 

Interprétation :

C’est évidement le groupe 3 qui nous intéresse. Autrement dit, l’indice de ce qui est clairement différent entre les genres et variable dans le temps.

L’indice d’écart en lui-même :

Contrairement à ce que l’on aurait pu penser, l’écart entre les hommes et les femmes se creusait depuis les années 2004. Ce n’est que depuis 2011 qu’il semble se réduire.

La courbe des indices par genre nous indique que :

En 2004 , ce sont les hommes qui ont changés de façon non-négligeable, alors que les femmes, elles, ont continué une évolution stable à la baisse.

Autrement dit, si à cette époque les hommes n’avaient pas changé, l’écart culturel/contextuel entre les hommes et les femmes se serait amoindri. Au lieu de cela les hommes, en changeant plus vite, ont augmenté cet écart.

En 2011, il semble que ce soit le contraire qui se passe. Ce sont les femmes qui viennent de changer de façon notable, alors que les hommes, eux, restent stables. L’écart se réduit donc vers les valeurs des hommes, alors qu’avant 2004, c’étaient les hommes qui rejoignaient les valeurs des femmes.

En d’autres termes, sur la question de l’égalité des sexes :

Notre approche nous permet de dire qu’il s’est passé quelque chose en 2003/2004 qui a amené un changement soudain des hommes sur l’ensemble des questions de cet indice. Les femmes n’ont pas réagit à cet événement avec la même amplitude.

De plus, en 2012/2014, les femmes s’approchent de plus en plus de l’indice que les hommes avaient en 2004. Alors que l’indice de ces derniers apparaît stable. Ce qui explique une baisse d’écart.

Il nous semble important de noter que, selon cet indice, de toute évidence :

  • Les hommes et les femmes n’évoluent pas de la même façon
  • Les femmes semblent, sur 12 ans, se rapprocher de l’indice des hommes et non le contraire. Ou tout du moins, plus vite que ces derniers.

Ce qui nous permet de conclure qu’a priori :

  • Globalement, les hommes et les femmes sont plus similaires que divergents
  • Sur les questions de divergences, la tendance est au mouvement des femmes vers les valeurs des hommes et non le contraire.

 

Conclusion

Depuis 12 ans l’indice des femmes se rapproche de celui des hommes (femmes 2014 : 2.26 pts, hommes 2004 : 2.23 pts)

Or l’indice des hommes lui aussi varie à la baisse dans les années 2004, à la hausse faible depuis 2008.

Donc, les femmes vont vers plus d’égalité en s’approchant des valeurs des hommes.

Mais les valeurs des hommes ont changé et changent plus rapidement, ce qui fait varier l’écart final.
Donc, par rapport à notre hypothèse de départ, nous pouvons dire que :

  • Oui, nous allons vers plus d’égalité du fait que les femmes prennent petit à petit les valeurs des hommes.
  • Oui, il y a plus de similarités invariantes que de divergences.
  • Non, dans les chiffres, nous n’allons vers plus d’égalité que depuis peu d’années. Nous nous en sommes largement éloignés depuis le début des années 2000 du fait d’un durcissement soudain des valeurs des hommes vers 2004.

 

Note : nous laissons le soin au lecteur de faire sa propre enquête sur les événements qui pourraient expliquer les variations de l’indice des hommes, car cela n’est pas notre propos.

 

NEC NV : 3, 259, 266, 268, 269, 271, 272, 276, 277, 278, 279, 280, 281, 282, 287, 289, 298, 297, 302, 311, 321, 347, 59

GDEC NV : 245, 250, 253, 254, 264, 284, 306, 323, 340, 349, 97

GDEC GDV : 1 , 291, 305, 318, 319, 330, 336, 82