Bonsoir chers amis je travail avec python3.4 et beautifulsoup . Je voudrais savoir s’il est possible d’extraire deux balises d’un coup suivant leur ordre et s’il était
possible de recuperer le texte contenu dans toutes les balises imbriquées. Je m’explique.
<h1>Économie</h1>
<p>du texte ici relatif au premier h1<b>le texte contenu ici<em>important</em></b></p>
<h1>Sport</h1>
<p>du texte ici relatif au deuxième h1</p>
<p>du texte ici relatif au deuxième h1</p>
Ici telle que les données sont disposées on a un lien entre un h1 avec un p, donc si je prend d’abord les balise p ensuite les balises h1 je vais avoir une erreur, je ne vais pas savoir si tel p est relié avec tel h1, D’où ma question de savoir si on ne peut pas recuperer deux balises a la fois selon leur disposition.
<p>du texte ici relatif au premier h1<b>le texte contenu ici<em>important</em></b></p>
recuperer le texte: du texte ici relatif au premier h1 le texte contenu ici important.
J’ai fait des recherches mais je n’ai rien trouver de convainquant.
Merci pour vos réponses.