Salut,
Aujourd'hui, quand on index les tutoriels, on indexe quatre types de modèles avec les informations suivante:
- Les tutoriels
- Indexes
- L'introduction et la conclusion au format HTML
- Les catégories des tutoriels (titre et description)
- Description et titre du tutoriel
- On peut recherche en ciblant les champs (parfois sauvegardé)
- titre et description
- sha_public
-
Les parties
- Indexes
- L'introduction et la conclusion au format HTML
- Description et titre du tutoriel (à supprimer)
- La date de publication (à supprimer)
- Le titre de la partie
- On peut recherche en ciblant les champs (parfois sauvegardé)
- En double: Le nom du tutoriel, le titre de la partie
-
Les chapitres
- Indexes
- L'introduction et la conclusion au format HTML
- Le titre du chapitre
- La date de publication du tutoriel (à supprimer)
- La date de la publication de la partie (à supprimer)
- On peut recherche en ciblant les champs (parfois sauvegardé)
- En double: le titre du chapitre
- Le nom du tutoriel
- Le nom de la partie
-
Les extraits
- Indexes
- L'extrait en html
- Le titre du chapitre
- La description du chapitre
- La date de publication du chapitre
- Le titre de la partie
- Le titre de la partie du tutoriel (ça provoque un bug à l'indexation)
- La description de la partie du tutoriel (ça provoque un bug à l'indexation)
- La date de publication du chapitre (ça provoque un bug à l'indexation)
- Le titre de l'extrait (? ça provoque un bug à l'indexation)
- On peut recherche en ciblant les champs (parfois sauvegardé)
- Le nom du fichier Markdown ( \o/ )
- En double: le titre (? ça provoque un bug à l'indexation) et Le nom du chapitre
Au début, j'étais partis pour vous lister quelques champs mais j'ai trouvé des énormités, alors je le partage avec vous.
Ma question était comment on indexe le contenu du tutoriel ? Le contenu est stocké sois sous forme html, soit sous forme markdown dans la base de donnée. On peut indexer les deux. Personnellement, j'avais envie de récupérer le html lors de l'indexation, récupérer uniquement le texte, mettre dans des champs à parts les différents titre et les mots mis en gras. Même si ça prend que les millisecondes de plus, que pensez vous de cette solution ?
+0
-0