Je me suis mis à écrire sur une problématique que j’ai rencontrée il y a de ça un an. Cela fait suite aux "nouvelles" législations qui commencent à poindre le nez au niveau international afin de mieux lutter contre le blanchiment d’argent et l’évasion fiscale. J’ai voulu raconter un peu le voyage que j’avais effectué avec la présentation de la solution ultra-classique afin de résoudre le problème et des problèmes que j’avais rencontrés ce faisant.
Hey @Gawaboumga,
Chouette de voir un article sur une application réelle des chaines de Markov. Je me rappelle les avoir étudier à l’université mais je ne les ai jamais rencontrées depuis.
Mes remarques:
Markov
Je pense que ça serait plus clair si tu présentes les chaines de Markov avant de faire le lien avec ton problème. Car dans ce paragraphe:
Dans la définition du problème, vous aurez remarqué deux caractéristiques principales:
Le problème concerne des graphes.
Il s’exprime en terme de pourcentages; au début, chaque entité possède 100% d’elle-même et des parts sont vendues à différents actionnaires. Néanmoins, la somme des pourcentages de détention directs est toujours égale à 100% (s’il manque des pourcentages, on considèrera qu’ils sont encore détenus par la société).
Ces deux caractéristiques sont synonymes du concept de chaîne de Markov.
la conclusion disant que ces caractéristiques sont synonymes de chaîne de Markov sort un peu de nulle part. Si tu présentes les chaines de Markov avant de donner cette conclusion, ce serait plus évident pour le lecteur je pense.
Que représente ton exemple ? La probabilité qu’une pizza se transforme en hamburger ? Ce serait bien de donner une courte description. Il y a une erreur par ailleurs, les flèches entre pizza et hotdog vont dans le mauvais sens.
Dans ta matrice A, il serait bon de définir quelle ligne/colonne correspond à quoi. On peut le deviner mais ça serait plus clair de l’expliquer. Aussi, certaines de tes équations un peu plus bas sont cassées et ne s’affichent pas bien.
Réduction
Je ne comprends pas la matrice B. Je pense qu’un schéma pourrait être utile (ou je suis peut-être un peu lent). Ou plutôt je comprends la première ligne (actionnaire possède 100% de la société) mais que représente la seconde ligne ?
On préfèrera décomposer le graphe en chaînes de Markov irréductibles et appliquer les traitements adéquats pour prendre en considération les transitions "entrantes" du système. Il faut par contre effectuer une autre démarche si le système possède des transitions "sortantes".
Je pense que ceci nécessite plus d’explications. Pourquoi préférera-t-on des chaines irréductibles ? Ca veut dire quoi exactement décomposer un graphe en chaine de Markov irréductibles ? C’est quoi exactement des transitions entrantes et sortantes ?
Matrices de transitions singulières
Nous ferons quand même remarquer que la situation peut nécessiter quelques éclaircissements. Il est, en effet, possible d’avoir des matrices de transitions qui sont singulières, où les valeurs propres seront dégénérées.
Intuivement, ces matrices auront quand même un état stationnaire, puisqu’il semble logique de penser qu’on passera autant de temps sur chacun des états dans un tel système. Heureusement pour nous, il existe le théorème de Perron–Frobenius qui affirme qu’il existera au moins une valeur propre réel avec un vecteur propre strictement positif.
Je ne comprends pas à ce stade en quoi cette remarque est importante et je dois avouer que je ne me souviens plus de ce que sont les valeurs propres et pourquoi il est important qu’il y en ait au moins une réelle et qu’un vecteur propre soit positif.
Soit ce n’est pas très important et je pense que ça peut être omis, soit c’est important et il faudrait plus d’explications. Ou il faut préciser en début d’article qu’il faut avoir des "bonnes" notions de calcul matriciel.
Résolution et steady state
Steady state, c’est l’état stationnaire j’imagine ? Si c’est bien le cas, il faudrait remplacer ça par le bon terme.
Je regarderai à la partie Algorithmes ce week-end.
Merci pour ton retour ! C’était particulièrement pertinent !
Chouette de voir un article sur une application réelle des chaines de Markov. Je me rappelle les avoir étudier à l’université mais je ne les ai jamais rencontrées depuis.
Exactement ! On avait eu des cours en 2e là-dessus en abordant des problèmes liés aux HMM avec les algorithmes de Baum–Welch ou Viterbi. Et puis, plus rien, jusqu’à ce que je prenne un cours de preuve formelle en 4e qui abordait notamment l’outil Prism. Je dois admettre n’avoir jamais imaginé employer ces trucs un jour (ou même devoir travailler sur ces problématiques) mais bon la vie est curieuse ^^.
Je pense que ça serait plus clair si tu présentes les chaines de Markov avant de faire le lien avec ton problème. La conclusion disant que ces caractéristiques sont synonymes de chaîne de Markov sort un peu de nulle part. Si tu présentes les chaines de Markov avant de donner cette conclusion, ce serait plus évident pour le lecteur je pense.
Parfaitement d’accord, cela fait plus de sens dans l’ordre que tu proposes. Je dois encore réfléchir à améliorer la transition parce qu’elle tombe de manière impromptue pour le moment.
Que représente ton exemple ? La probabilité qu’une pizza se transforme en hamburger ? Ce serait bien de donner une courte description. Il y a une erreur par ailleurs, les flèches entre pizza et hotdog vont dans le mauvais sens.
Dans ta matrice A, il serait bon de définir quelle ligne/colonne correspond à quoi. On peut le deviner mais ça serait plus clair de l’expliquer. Aussi, certaines de tes équations un peu plus bas sont cassées et ne s’affichent pas bien.
Bien vu ! J’ai rajouté un paragraphe sur la description du système et son interprétation. Cela manquait complètement de contexte. C’est ce qu’il se passe quand c’est clair dans sa tête et qu’on ne relit pas …
Je ne comprends pas la matrice B. Je pense qu’un schéma pourrait être utile (ou je suis peut-être un peu lent). Ou plutôt je comprends la première ligne (actionnaire possède 100% de la société) mais que représente la seconde ligne ?
J’ai rajouté un schéma. En me disant que la vue du système précédent allait être suffisamment clair ?
Je pense que ceci nécessite plus d’explications. Pourquoi préférera-t-on des chaines irréductibles ? Ca veut dire quoi exactement décomposer un graphe en chaine de Markov irréductibles ? C’est quoi exactement des transitions entrantes et sortantes ?
J’ai reformulé cette partie afin de clarifier ce que j’entendais par "entrant/sortant" ou sur la différentiation nécessaire entre celles irréductibles et réductibles.
Je ne comprends pas à ce stade en quoi cette remarque est importante et je dois avouer que je ne me souviens plus de ce que sont les valeurs propres et pourquoi il est important qu’il y en ait au moins une réelle et qu’un vecteur propre soit positif. Soit ce n’est pas très important et je pense que ça peut être omis, soit c’est important et il faudrait plus d’explications. Ou il faut préciser en début d’article qu’il faut avoir des "bonnes" notions de calcul matriciel.
J’ai déplacé le paragraphe afin de l’introduire après la résolution du système. C’est important d’avoir un vecteur propre de réels positifs parce que l’on cherche des probabilités. J’ai rajouté la condition de "bonnes notions de calcul matriciel" dans l’introduction.
Steady state, c’est l’état stationnaire j’imagine ? Si c’est bien le cas, il faudrait remplacer ça par le bon terme.
En effet, j’ai essayé de reprendre le terme "état stationnaire". Et j’en ai profité pour définir "transient" qui sortait de nulle part. J’ai toujours eu beaucoup de mal à garder les mots en français alors que je les ai toujours entendu en anglais …
En tant que juriste, j’aurais quelques remarques quant à certains points… imprécis soulevés dans ton article.
Je suis actuellement en vacances donc j’essaierai de te faire cela de manière plus précise début août. Mais par exemple, tu as l’air de dire que le fait que Proximus SA "change de nom" en néerlandais pour devenir Proximus NV est un problème. D’un point de vue du droit européen et des pays avec lesquels les entreprises européennes sont actives, il ne faut pas oublier qu’une donnée est particulièrement utilisée pour identifier l’entreprise : son numéro de TVA. Il est tenu compte de ces éléments dans les flux d’informations, notamment fiscales, tels que le Common Reporting Standard. Les fiscs européens ont une panoplie d’outils et des pouvoirs (et délais) d’investigation et d’enrôlement spéciaux dans les situations qui impliquent des montages financiers, la communication de données par les États tiers. Il ne faut pas également exclure les conventions de prévention des doubles impositions qui prévoient très fréquemment des protocoles d’échange de données, ni les présomptions concernant les pays qui figurent sur les listes des États à faible taxation (paradis fiscaux).
Il y a des sources très diverses qui servent de support aux flux d’informations échangés entre les États (notamment ici en Europe), et les nouvelles obligations comme les registres UBO y ajoutent une couche.
Et quand l’UE ou ses EM prennent des mesures restrictives, tout ça sert également de support pour identifier et cibler les individus ou entreprises.
Il devient donc de plus en plus compliquer de frauder le fisc. En terme de données brutes, on a accès à une flopée d’informations. Le gros problème, c’est que tous les Etats n’ont pas les mêmes moyens humains (notamment). En Belgique, par exemple, les moyens à notre disposition ne sont pas les mêmes qu’en Italie, France, Roumanie,…
Les mesures restrictives peuvent également avoir lieu hors du cadre des décisions du CSNU. Il y a en fait deux catégories de mesures restrictives : celles qui sont prises en application d’une décision du CSNU (lien direct et étroit) et celles qui sont autonomes (même si elles peuvent s’appuyer sur des décisions onusiennes) et qui relèvent purement d’une entité juridique.
C’est par exemple le cas des récentes mesures prises par l’UE relativement à ce qui se passe en Chine, etc.
Attention également à la manière de référencer un texte juridique en notes de bas de page.
Au niveau de la forme, il y a quelques remarques à faire pour aérer le texte, mettre en évidence les questions etc. Mais @Gabbro s’en chargera.
En tant que juriste, j’aurais quelques remarques quant à certains points… imprécis soulevés dans ton article.
Parfait ! C’est pile ce que je recherchais comme point de vue !
Je suis actuellement en vacances donc j’essaierai de te faire cela de manière plus précise début août.
J’espère qu’elles seront bonnes et le retour se fera en pleine forme !
Mais par exemple, tu as l’air de dire que le fait que Proximus SA "change de nom" en néerlandais pour devenir Proximus NV est un problème.
Voici mon texte:
N’oublions pas le petit point bonus qui fait qu’une société ne possède pas toujours le même nom: 微软 (Wéiruǎn) signifie "Microsoft" en chinois ou encore: Proximus SA ou Proximus NV qui représente la même société dans deux des langues nationales belges.
Je n’ai pas l’impression d’introduire cette confusion, personnellement. C’est juste qu’on fait du scrapping de données et qu’il faut veiller à faire correspondre ces entités de noms différentes mais qui correspondent bel et bien à la même "entreprise". C’est juste un point à prendre en compte. Comme le fait qu’il peut exister plusieurs fois le même nom d’entreprise dans un même pays.
D’un point de vue du droit européen et des pays avec lesquels les entreprises européennes sont actives, il ne faut pas oublier qu’une donnée est particulièrement utilisée pour identifier l’entreprise : son numéro de TVA.
En Belgique, il y a le numéro d’entreprise, le numéro d’établissement et le numéro ONSS. Mais nous sommes d’accord que TVA est "suffisant" au niveau national. Pour l’international, on quitte ce genre d’identifiants au profit des TIN, LEI ou EU VAT. Tout ceci devenant évidemment caduque pour les individus.
Le point de "Proximus" (qui est d’ailleurs enregistrée sous le nom "PROXIMUS" à la banque carrefour) est particulièrement mis en évidence sur cet exemple de deux entités sur la liste des OFAC SSI:
AUTOMATED BANKING TECHNOLOGIES
CJSC (a.k.a. CJSC 'AUTOMATED BANKING
TECHNOLOGIES’; a.k.a. JOINT STOCK
COMPANY 'AVTOMATIZIROVANNYYEE
BANKOVSKIYE TEKHNOLOGII’; a.k.a. ZAO
'AVTOMATIZIROVANNIY BANKOVSKIY
TECHNOLOGII’), Street Pushechnaya, D. 5, G.,
Moscow 107031, Russia; Executive Order
13662 Directive Determination - Subject to
Directive 1; Tax ID No. 7702026595 (Russia);
For more information on directives, please visit
the following link:
http://www.treasury.gov/resourcecenter/sanctions/Programs/Pages/ukraine.aspx
#directives [UKRAINE-EO13662] (Linked To:
BANK OF MOSCOW).
BALTECH LLC (a.k.a. LLC BALTECH; a.k.a.
OOO 'BALTECH’), Russia; Executive Order
13662 Directive Determination - Subject to
Directive 1; For more information on directives,
please visit the following link:
https://www.treasury.gov/resourcecenter/sanctions/Programs/Pages/ukraine.aspx
#directives [UKRAINE-EO13662] (Linked To:
BANK OF MOSCOW)
Une a un identifiant (TVA), l’autre non …
Il est tenu compte de ces éléments dans les flux d’informations, notamment fiscales, tels que le Common Reporting Standard. Les fiscs européens ont une panoplie d’outils et des pouvoirs (et délais) d’investigation et d’enrôlement spéciaux dans les situations qui impliquent des montages financiers, la communication de données par les États tiers. Il ne faut pas également exclure les conventions de prévention des doubles impositions qui prévoient très fréquemment des protocoles d’échange de données, ni les présomptions concernant les pays qui figurent sur les listes des États à faible taxation (paradis fiscaux).
Il y a des sources très diverses qui servent de support aux flux d’informations échangés entre les États (notamment ici en Europe), et les nouvelles obligations comme les registres UBO y ajoutent une couche.
Et quand l’UE ou ses EM prennent des mesures restrictives, tout ça sert également de support pour identifier et cibler les individus ou entreprises.
Il devient donc de plus en plus compliquer de frauder le fisc. En terme de données brutes, on a accès à une flopée d’informations. Le gros problème, c’est que tous les Etats n’ont pas les mêmes moyens humains (notamment). En Belgique, par exemple, les moyens à notre disposition ne sont pas les mêmes qu’en Italie, France, Roumanie,…
Les mesures restrictives peuvent également avoir lieu hors du cadre des décisions du CSNU. Il y a en fait deux catégories de mesures restrictives : celles qui sont prises en application d’une décision du CSNU (lien direct et étroit) et celles qui sont autonomes (même si elles peuvent s’appuyer sur des décisions onusiennes) et qui relèvent purement d’une entité juridique.
C’est par exemple le cas des récentes mesures prises par l’UE relativement à ce qui se passe en Chine, etc.
Nous sommes parfaitement d’accord.
Attention également à la manière de référencer un texte juridique en notes de bas de page.
Je ne connais pas les habitudes dans ce domaine (n’étant pas juriste).
J’attends avec impatience ton retour ! J’espère apprendre plein de trucs