Licence CC BY-NC

Réflexions sur Parcoursup

Doit on s'attendre à un Parcoursupocalypse ?

Ce billet est à la base un thread twitter par @Ipochocho, repris et adapté avec son autorisation.

Thread étendu qui explique pourquoi l’algorithme Parcoursup est beaucoup moins efficace que Admission Post Bac et pourquoi nous devons nous attendre à un ocalypse le 22 mai, jours des résultats.

Affectation étudiants/formations dans l'enseignement supérieur

Parcoursup est un service proposé par l’état qui permettra prochainement d’affecter futurs bacheliers dans les filières d’enseignement supérieur de leur choix. L’état chaque année fait face à la déclinaison d’un ancien et classique problème de mathématiques appliquées : les mariages stables. L’enjeu est de taille, maximiser le nombre de couple candidat/formation stable dans le temps.

Les données d’entrées sont simples : 887 681 candidats et 13200 formations. C’est un problème de mathématiques caractérisé par une forte explosion combinatoire à la frontière entre la théorie des systèmes complexes et la théorie des jeux. Ce problème des mariages stables fut résolut en 1962 par David Gale et Lloyd Shapley par un algorithme qui porte désormais leurs noms. Chose importante à retenir, l’algorithme de Gale Shapley est reconnu actuellement comme le meilleur algorithme d’affectation. La puissance de l’algorithme de Gale Shapley réside dans le classement: le candidat classe ses vœux dans l’ordre de préférence désiré sans aucune stratégie.

Entre 2009 et 2017, le service Admission Post Bac chargé d’affecter les bacheliers implémentait cet algorithme. La plateforme APB réalisait plutôt bien la tâche qu’on lui avait attribué avec un vœux proposé à 80,6% des candidats dès le premier tour en 2016. Après la campagne d’affectation 2017 et pour des raisons que les éléments de langages du gouvernement vous fournira, les autorités ministérielles ont décidé de modifier l’ algorithme d’affectation.

Règles de Parcoursup

Voici ci quelques unes des nouvelles règles de la plateforme Parcoursup.

Le candidat ne classe plus ses vœux mais écrira des lettres de motivations et un CV et les institutions seront dotées d’outils de classement des candidats. Les résultats seront donnés en bloc et le choix des candidats se feront « au fil de l’eau ». La première règle a fait ces derniers mois la fortune des coachs en orientation quand bien même les lettres de motivations et les CV n’auront qu’un impact limité dans le classement réalisé par les institutions. D’autant plus que ces documents ne seront pas lu pour cause de manque flagrant de ressources dans la plupart des institutions d’enseignement supérieur.

Il est fort probable qu’un candidat en tête d’un classement réalisé par une institution d’enseignement supérieure le soit également dans les classements de toutes les autres institutions dans lesquelles il aura déposé des voeux. En effet, si vous avez des bonnes notes dans toutes les matières, vous êtes dans le peloton de tête quel que soit la pondération choisie. Le jour ou les candidats recevront leurs réponses, une petite élite scolaire "trustera" donc la quasi totalité des places dans toutes les filières. Les autres attendront leur tour lors des multiples rounds qui suivront. Seules des simulations numériques peuvent prédire la taille des nombreuses et géantes files d’attente qui se formeront.

Au vu du calendrier décidé par le gouvernement, 7 jours du 22 mai au 25 juin, 3 jours du 26 juin au 20 août et 1 jour à partir du 21 août ce risque d’explosion des files d’attente est connu au niveau gouvernemental. Cela va grandement contribuer à l’anxiété des 887 681 candidats à quelques semaines du bac. En première approximation, il est raisonnable de se placer dans le cadre de la loi de Pareto, 20% des candidats monopoliseront alors 80% des places disponibles: Winners take all. Imaginez seulement le niveau de panique des candidats laissés sur le carreau pendant les premiers rounds. Ceux qui auront les moyens économiques et/ou culturels fuiront vers les institutions privées hors Parcoursup. Bon plan : c’est le moment d’acheter des actions d’écoles de commerce post bac.

Par ces choix à priori seulement techniques, nous passons insidieusement d’une logique de service publique d’affectation aux institutions d’enseignement supérieures à une logique de public au service des institutions d’enseignement supérieures.

Surbooking

Il existe un palliatif risqué pour atténuer la taille des files d’attente : surbooker les filières et croiser les doigts pour que le bon nombre de candidat refuse la proposition.@ingenuingenieur en parle dans son blog, je ne peux que conseiller sa lecture.

La fameuse loi de Murphy, (chère aux ingénieurs) dont l’énoncé est « Tout ce qui est susceptible de mal tourner, tournera mal » sera le coup de grâce donné aux astucieux universitaires s’essayant au surbooking. La disparition de l’ordre de vœux va en effet jeter les équipes pédagogiques dans le brouillard. Les formations vont devoir anticiper précisément le nombre de candidats qui peuvent répondre "oui" à leur proposition sachant que les décisions des candidats sont également conditionnées par les réponses ("oui","non","oui si" et "en attente") des neuf autres vœux. Si les équipes pédagogiques visent trop bas c’est le risque de sousbooking, si les équipes pédagogiques visent trop haut c’est le risque de surbooking. Comme n’y a aucun retour d’expérience, il n’est même pas possible d’ajuster "gros grains" le nombre de candidats à classer pour limiter ces risques.

Il était possible avec APB de connaître le rang moyen du vœux obtenu au bout de la procédure dans le classement. Sans classement des vœux par le candidat c’est impossible. Les responsables de l’outil perdent un outil de gouvernance essentiel: non seulement les files d’attente seront plus longue mais il sera également impossible de déterminer le niveau de satisfaction des candidats vis à vis des vœux finalement obtenu.Pas très startup nation.

Dans l’algorithme de Gale Shapley implémenté dans APB, l’idée est de maximiser la satisfaction des candidats en leur donnant le plus haut vœux possible dans leur classement. L’algorithme pouvait décider de réaliser un grand nombre de permutation permutations pour pour accéder à un optimum acceptable. Parcoursup en sera incapable car il n’est pas spécifié pour.

Temps de traitement des candidatures

Pour finir ce tableau, une petite estimation du temps théorique traitement humain que les sélectionneurs devront passer pour classer les vœux de la fameuse plateforme.

7 millions de vœux ont été déposés sur la plateforme. En faisant de l’abattage, imaginons qu’on peut classer un candidat en 3 minutes. 21 millions de minutes seront nécessaires pour réaliser ce travail, 350 000 heures de travail seront nécessaires pour réaliser ce travail. Nos héros stakanovistes peuvent fournir 7 heure de travail par jour. 50 000 jours de travail seront nécessaires pour réaliser ce travail.

La plateforme demande donc une quantité colossale de ressources humaines pour réaliser un travail par le passé réalisé plutôt efficacement par un algorithme. Ce temps de travail n’étant pas financé, ce seront (d’obscures) algorithmes locaux qui réaliseront ce classement. Les CV et lettres de motivations seront classés par le très efficace algorithme de classement vertical, c’est à dire à la poubelle. Un candidat moyen venant d’un lycée moyen risque d’attendre pas mal de temps pour avoir ne serait ce qu’un de ses vœux (qui ne sera sans doute pas son vœux le plus désiré) et soit contraint de donner une réponse par défaut.

Bilan de la disparition du classement

En résumé la disparition du classement va avoir pour conséquences :

  • La monopolisation des places sur les premiers rounds par les candidats ayant les meilleurs dossiers
  • L’explosion des délais d’attente pour les autres ce qui induit stress et fuite pour ceux qui le peuvent vers le post bac hors parcoursup (souvent privé)
  • incapacité de contrôler la satisfaction générale des candidats vis à vis des propositions.
  • Dégradation de la gouvernance.
  • Surbooking ou sousbooking non maîtrises des filières
  • Surcroît de travail pour les équipes pédagogiques
  • Solution de mariage sous optimale

Au vu de tous ces éléments il est légitime de s’attendre à au moins à beaucoup de frustration lors de la révélation des premiers résultats d’affectation. Le 22 mai prochain, sera le jour du crash test.. et peut être celui du Parcoursupocalypse.

Comme vous m’avez l’air sympathique, voici une modélisation de l’évolution d’étudiants sans affectation lors des différents jalons de Parcoursup.

image1

Et voici une modélisation de l’évolution des étudiants avec affectation lors des différents jalons de Parcoursup. L’hypothèse dans ce modèle est une répartition des propositions "à la pareto".

billet2

C’est un modèle à considérer avec recul car il n’inclut pas toutes la complexité des choix que feront les candidats. « Tous les modèles sont faux, mais certains sont utiles » disait George Box. Cependant, il incite à penser qu’au moins au premier tour, peu de candidats (177 000) auront une résolution de leur dossier, soit près de 20% des candidats. C’est un élément est à mettre en lumière avec les 80,6% des candidats qui on eu une proposition en 2016. Donner une prévision du comportement de est à l’heure actuelle assez risqué: cela dépends aussi du niveau de risque accepté par les institutions d’enseignement supérieur concernant le surbooking.


Rendez vous le 22 mai, le jour du crash test pour voir si cette prévision se réalise.

46 commentaires

Et boom !

Les résultats sont tombés : la moitié des lycéen-ne-s n’ont reçu aucune proposition de Parcoursup, ce qui en laisse 400 000 sur le carreau. La ministre promet que 80% des élèves auront une réponse d’ici le bac…

Source : https://www.lesechos.fr/politique-societe/societe/0301704622817-parcoursup-400000-lyceens-en-attente-ce-soir-2177573.php

+3 -0

D’ici le bac on parle d’un tiers des candidats qui n’auront obtenu aucune réponse … Même pas la plus inintéressante. Rappelons que en prévisions, beaucoup ont essayé de mettre une filière non selective.
Seulement la moitié, même après avoir fait du surbooking :/ C’est assez décevant, mais c’était prévisible.

Ça vallait le coup de supprimer le classement …

+0 -0

Note : une partie du code source a été publiée je vais pas copier / coller les réflexions de l’article du monde ici, mais c’est quand même plutôt décevant.

Je suis allé voir le package "algo" en pensant y trouver, bah, les algos, et… Non.

Cette partie du code est vraiment de mauvaise qualité, j’ai la forte impression que les algos sont réellement implémentés sous forme de procédure stockées Oracle. Bref… On peut imaginer qu’un truc fait à-la-va-vite soit pas un modèle de soft, mais là on est très très loin de ce qu’on pourrait qualifer de standards.

Déjà dans la publication, le moindre "weekend experiment" sur Github possède un README plus propre et un jeu de donnée, un Dockerfile, ou un truc te permettant de jouer avec en local, et puis en termes d’implém, je suis un peu effrayé de voir que la principale logique business du machin (l’algo de tri) est codé en PL/SQL, ça fait bien bien longtemps que c’est considéré comme "le truc le plus merdique qui soit" par l’industrie.

:\

+0 -0

@Javier : la grosse majorité est codée en Java, de ce que j’ai pu voir rapidement, non ?

Titi_Alone

En fait le Java ne sert pas à grand chose, à part sérialiser les résultats en XML avec JAXB si j’ai bien vu, et lancer des requêtes SQL.

Regarde

La logique de classement des candidats n’est pas écrite en Java (ou très très peu), mais dans le code la requête SQL (mot-clef NVL Oracle).

+0 -0

Bon, nous voilà un mois après le début du fonctionnement de Parcoursup. Selon la page officielle des "indicateurs publics", il y a toujours près de 27% des bacheliers qui n’ont pas eu d’affectation. Plein de courage à elles et eux pour le passage du bac dans ces conditions…

+0 -0

Petit rectificatif. Ce n’est pas 27% des bacheliers qui n’ont pas d’affectation, mais 27% des candidats au Bac. Nuance importante, développée ci-dessous.

Ce serait quoi, le ratio idéal ? Il faudrait que 100% des candidats au Bac aient une réponse positive ? Il faudrait donc que les fac acceptent de faire du Sur-Booking, en donnant 800k réponses positives. Tout en sachant qu’au final, il y aura 100k ou 150k élèves de terminale qui vont redoubler, et qu’il n’y a pas 800k places disponibles ?

+0 -0

Ce serait quoi, le ratio idéal ? Il faudrait que 100% des candidats au Bac aient une réponse positive ?

elegance

Oui.

Je ne vois pas le problème.

+6 -0

Depuis le 26 juin, Parcoursup est en « phase complémentaire », et près de 140 000 candidats n’ont toujours aucune place. Du 29 juin et jusqu’au 1er septembre, les candidats ont trois jours (jusqu’au surlendemain inclus) pour répondre à une proposition. Pour les propositions émises le 2 septembre, ils ont auront deux jours. Ensuite, du 3 au 21 septembre, ils devront répondre… le jour même.

Rappelons que les demandes de bourses universitaires se font du 15 janvier au 31 mai (il est possible de les demander après cette date, mais puisque c’est « hors-délais », la procédure est plus lourde)…

Plein de courage aux canditat-e-s conerné-e-s !

Calendrier : https://www.parcoursup.fr/pdf/Calendrier_Parcoursup.pdf

+0 -0

Pour les demandes de bourses, j’ai très souvent fait mes demandes hors délai (académies de Dijon/Lyon/Paris), et je n’ai jamais eu de soucis. La procédure est exactement la même que quand on est dans les délais et le temps de traitement aussi identique dans mon expérience.:)

Le vrai problème que je vois serait pour les logements du crous, qui seront peut être tous pris !

+0 -0

Pour les demandes de bourses, j’ai très souvent fait mes demandes hors délai (académies de Dijon/Lyon/Paris), et je n’ai jamais eu de soucis. La procédure est exactement la même que quand on est dans les délais et le temps de traitement aussi identique dans mon expérience.:)

Le vrai problème que je vois serait pour les logements du crous, qui seront peut être tous pris !

Demandred

Ah ? Quand j’avais fais la mienne (hors-délai aussi) ça avait mis un peu plus de temps, mais ça n’est arrivé qu’une fois donc c’est peut-être une exception. Bien vu pour les logements universitaires, tu as raison. Même chose pour ceux qui doivent louer un logement au dernier moment ou acheter un titre de transport en vitesse pour la ville dans laquelle ils vont étudier, par ailleurs.

+0 -0

Alors oui … Y a hors délais et hors délais.

Moi aussi ça m’est arrivé de faire une demande hors délais. Pour les bourses, j’ai eu un peu de retard mais rien de génant. Pour les APLs, c’est une autre histoire, je ne sais pourquoi exactement alors je vais pas accusé le hors délais mais des retards importants sont bien possibles.

Pour les bourses, le faire en début Juin et finir en fin Aout, c’est pas la même chose. Je pense que là on peut avoir du retard dans la procedure.

+0 -0

Ça m’est arrivé de les faire en septembre quand je savais pas où je serai l’année prochaine et de mêmoire le délai était tout à fait correct ! Par contre il fallait avancer les frais d’inscription à la fac avant de se les faire rembourser, ce qui était un peu embêtant. Sinon une fois traité la bourse du CROUS était même rétro active, jusqu’à trois mois je crois.

Pour les APL je ne sais pas du tout, je n’ai jamais eu de truc particulier de ce côté là !

+1 -0

Je pose ça là.

Désolé pour le déterrage mais c’est un billet donc je pense que ça va.

https://linuxfr.org/news/audit-du-code-source-de-parcoursup-par-la-cour-des-comptes

ache

En même temps il fallu pondre un truc depuis 0 en quelque mois (2,3?) sans vrai spec. A un moment, c’est normal.

Edit: bon, en vrai ca à l’air d’avoir été la suite ABP retravaillé.

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte