Analyse d'association de mot

Problème d'algorithme

a marqué ce sujet comme résolu.

Salut Victor,

Alors j’essaye d’apprendre l’analyse de texte et plus précisément faire ressortir d’un texte les lexie et champs lexicaux. Cela passe par du nettoyage : suppression de la ponctuation, terme pauvre, etc mais aussi par l’analyse des expressions.

L’analyse de mot simple (composé d’un élément) ne pose pas de problème. Je retraite les éléments pauvres (le, la , des, un , mon, ton son, etc). J’arrive à voir et comprendre comment faire.

Toutefois, cela s’avère beaucoup plus compliqué pour moi pour comprendre comment analyser et traiter les BONNES associations de mots : 2 ou 3 mots.

Par exemple le terme "de" peut être un élément pauvre du langage pour comprendre un texte que je supprime. Toutefois dans l’expression : "faire part de mariage" ou "voiture de tourisme" il devient important.

Voila un peu mon but.

Je fais cela pour apprendre et me perfectionner : nouveau problème pour moi -> nouvelle fonction du langage à utiliser et surtout cela forme le cerveau à réfléchir autrement pour trouver une solution. Tout cela en php car c’est le langage que je maîtrise le mieux.

Après je cours peut être dans tous les sens comme un poulet sans tête par faute de connaissance du domaine.

Florian

L’analyse de mot simple (composé d’un élément) ne pose pas de problème.

Si par "analyse" tu ne parles que de la fréquence dans le texte, ou de la longueur du mot, ou de trucs comme ça oui. C’est pas très compliqué. Si tu parles d’en trouver la racine, la fonction grammaticale, la sémantique, là c’est très compliqué.

Toutefois, cela s’avère beaucoup plus compliqué pour moi pour comprendre comment analyser et traiter les BONNES associations de mots : 2 ou 3 mots.

C’est un problème très compliqué, oui. Tu peux googler pas mal de résultats de recherche à ce sujet, utilise idiom detection ou noun phrase detection. C’est deux concepts différents mais en plein dans ce qui t’intéresse. Si les résultats sont pas pertinents, ajoute nlp dans ta recherche.

+0 -0

Salut Victor,

Pur se qui st de la fréquence des expressions en effet je n’ai pas eu de problème. J’ai même trouvé une solution encore plus simple pour sliding window.

Je vais regarder, du coté de toutes les pistes que tu m’as donné. Merci ;-).

J’ai de quoi faire …

Florian

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte