Grattage avec belle soupe sur ordinateur portable jupyter.
Dans [1] Importer une belle soupe
In[1]
from bs4 import BeautifulSoup
Dans [2] Stockez le html de l'article que vous souhaitez gratter dans la variable kiji
In[2]
kiji = """<html>
        <head>
           <title>Je l'ai posté sur Qiita</title>
        </head>
        <body>
           <p class="title">
              <b>Défiez Qiita pour la sortie.</b>
           </p>
        <p class="article">
              <b>Je ferai de mon mieux pour écrire un article.</b>
           </p>
        </body>
   </html>"""
Écrivez le code HTML que vous souhaitez stocker entre "" "et" "".
Dans [3] Chargez le code HTML stocké dans la variable kiji dans BeautifulSoup.
In[3]
soup = BeautifulSoup(kiji,"html.parser")
Écrivez BeautifulSoup (variable contenant le code HTML stocké, "l'analyseur (analyseur) que vous souhaitez utiliser"). Cette fois, c'est (kiji, "html.parser"). Veillez à ne pas oublier de placer l'analyseur dans "" ou d'écrire. Comme htmlparser.
Utilisez la soupe In [4] avec joliment pour le rendre plus facile à voir.
In[4]
print(soup.prettify())
En utilisant prettify (), il est superposé et facile à voir.
In [4] Résultat de sortie
In[4]
<html>
 <head>
  <title>
Je l'ai posté sur Qiita
  </title>
 </head>
 <body>
  <p class="title">
   <b>
Défiez Qiita pour la sortie.
   </b>
  </p>
  <p class="article">
   <b>
Je ferai de mon mieux pour écrire un article.
   </b>
  </p>
 </body>
</html>
Dans [5] Afficher le titre
In[5]
print(soup.html.head.title)
In[5]Résultat de sortie
<title>Je l'ai posté sur Qiita</title>
        Recommended Posts