<!-- LTeX: language=fr -->

Cours 10‚ÄØ: G√©n√©rer du HTML
==========================

**Lo√Øc Grobol** [<lgrobol@parisnanterre.fr>](mailto:lgrobol@parisnanterre.fr)


In [None]:
from IPython.display import display

## HTML

Tutoriels interactifs sur [MDN Learn](https://developer.mozilla.org/en-US/docs/Learn) (ils sont
aussi disponibles en fran√ßais)

- [*Getting started with
  HTML*](https://developer.mozilla.org/en-US/docs/Learn/HTML/Introduction_to_HTML/Getting_started)
- [*Web forms*](https://developer.mozilla.org/en-US/docs/Learn/Forms)
  - Il n'est pas forc√©ment n√©cessaire de s'attarder trop longtemps sur les questions de style ou les
    contr√¥les avanc√©, l'objectif est d'arriver jusqu'√† [*Sending and retrieving form
    data*](https://developer.mozilla.org/en-US/docs/Learn/Forms/Sending_and_retrieving_form_data)
- Ne pas h√©siter √† fouiller dans les autres parties du tutoriel (notamment CSS et JavaScript) pour
  mieux les comprendre. √Ä faire selon vos go√ªts.

## ü•ã Exo ü•ã

Concevoir

- Une page HTML avec un formulaire comprenant un champ de texte et un bouton de soumission.
  Assurez-vous qu'elle passe au [valideur du W3C](https://validator.w3.org)
- Une API avec FastAPI qui re√ßoit des requ√™tes de type POST venant de la page que vous avez cr√©√© et
  qui cr√©e pour chacune un nouveau fichier texte sur votre machine dont le contenu est le contenu du
  champ de texte. Vous aurez besoin de regarder [dans sa
  doc](https://fastapi.tiangolo.com/tutorial/request-forms/) comment on r√©cup√®re dans FastAPI des
  donn√©es envoy√©es depuis un formulaire (malheureusement ce n'est pas du JSON‚ÄØ! Pour √ßa il faut
  court-circuiter avec du JavaScript).

## G√©n√©rer du HTML en Python

**En g√©n√©ral** quand on cr√©e un service web, on a envie de lui donner une **interface web** lisible
par des humain‚ãÖe‚ãÖs. Autrement dit une page web.

C'est bien gentil de lire du JSON dans un navigateur, mais au bout d'un moment √ßa va bien.

On a vu comment r√©cup√©rer des informations envoy√©es par l'utilisateur avec des formulaires,
maintenant on va voir comment lui r√©pondre en affichant des donn√©es g√©n√©r√©es par notre programme.

Il va donc nous falloir *g√©n√©rer du HTML en Python*

### √Ä la main

C'est-√†-dire que HTML c'est du texte. Des cha√Ænes de caract√®res donc.

Du coup vous pouvez en g√©n√©rer en Python, √ßa va, on sait faire.

In [None]:
doc = """<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8" />
    <title>What is the Average Flying Speed of an African Sparrow?</title>
  </head>
  <body>
    <h1>What is the Average Flying Speed of an African Sparrow?</h1>
    <p>The airspeed velocity of an unladen swallow is something like 20.1 miles per hour or 9 meters per second</p>
  </body>
</html>
"""
print(doc)

En plus dans un notebook √ßa se fait bien avec
[`IPython.display.HTML`](https://ipython.readthedocs.io/en/stable/api/generated/IPython.display.html#IPython.display.HTML)

In [None]:
from IPython.display import HTML
HTML(doc)

Et vous savez comment √©crire dans un fichier

In [None]:
with open("local/spam.html", "w") as out_stream: 
    out_stream.write(doc)

Et voil√† on a √©crit [du HTML](local/spam.html).

### üéà Exo üéà

√âcrire une fonction qui prend en argument une liste de chaines de caract√®res et un chemin vers un
fichier et qui √©crit dans ce fichier une page HTML qui contient une liste non-ordonn√©e dont les
√©l√©ments sont les cha√Ænes pass√©es en argument.

In [None]:
from typing import List

def make_ul(elems: List[str], path: str):
    pass  # √Ä vous de jouer

# Pour tester
make_ul(["The Beths", "Beirut", "Death Cab for Cutie"], "local/moody_bands.html")
print(open("local/moody_bands.html").read())

Bien entendu, v√©rifiez que votre HTML passe au [valideur du W3C](https://validator.w3.org).


### Avec `lxml`

lxml propose une interface sympa pour g√©n√©rer du HTML en √©tant s√ªr‚ãÖe de ne pas faire d'erreurs de
syntaxe

In [None]:
import lxml
from lxml.html import builder as E
html = E.HTML(
    E.HEAD(
        E.META(charset="utf-8"),
        E.TITLE("What is the Average Flying Speed of an African Sparrow?")
    ),
    E.BODY(
        E.H1("What is the Average Flying Speed of an African Sparrow?"),
        E.P("The airspeed velocity of an unladen swallow is something like 20.1 miles per hour or 9 meters per second"),
    )
)

print(lxml.html.tostring(html, encoding=str))

In [None]:
HTML(lxml.html.tostring(html, encoding=str))

## Avec FastAPI

Pour afficher du HTML quand on acc√®de √† votre point d'acc√®s FastAPI, vous pouvez utiliser
`fastapi.responses.HTMLResponse`, ce qui indique par exemple au navigateur qu'il faut interpr√©ter les donn√©es re√ßues comme une page web.

In [None]:
# %load examples/html_api.py
from fastapi import FastAPI
from fastapi.responses import HTMLResponse


app = FastAPI()


@app.get("/", response_class=HTMLResponse)
async def read_items():
    html_content = """
    <html>
        <head>
            <title>What is the Average Flying Speed of an African Sparrow?</title>
        </head>
        <body>
            <h1>What is the Average Flying Speed of an African Sparrow?</h1>
            <p>The airspeed velocity of an unladen swallow is something like 20.1 miles per hour or 9 meters per second</p>
        </body>
    </html>
    """
    return HTMLResponse(content=html_content, status_code=200)

Comme d'habitude, lancez depuis [`examples/`](examples/) avec 

```sh
uvicorn html_api:app
```

Et allez voir <http://localhost:8000>

## üßä Exo üßä

1\. Concevoir une API avec FastAPI qui re√ßoit des requ√™tes de type POST contenant une liste de
cha√Ænes de caract√®re et r√©pond avec une page HTML qui contient une liste ordonn√©e dont les
√©l√©ments sont les cha√Ænes de caract√®res re√ßus.

Bien entendu, v√©rifiez que votre HTML passe au [valideur du W3C](https://validator.w3.org).


2\. Reprendre votre API pr√©c√©dente qui utilisait spaCy pour renvoyer les POS tag correspondant √†
une requ√™te et faites lui renvoyer une pr√©sentation des r√©sultats en HTML plut√¥t que du JSON.


## Les templates avec Jinja

Vous avez d√ª vous en rendre compte, g√©n√©rer du HTML programmatiquement comme √ßa c'est plut√¥t p√©nible‚ÄØ:

- En √©crivant des cha√Ænes de caract√®res √† la main, c'est pas simple d'√™tre dans les clous du valideur.
- Avec lxml, on doit manipuler des grosses hi√©rarchies d'objets compliqu√©s, c'est vite le bazar.

En plus dans aucun des deux cas on a le confort de

- La coloration syntaxique du HTML
- Une gestion correcte par git
- ‚Ä¶

Ce qui serait **bien** √ßa serait de pouvoir √©crire du HTML normalement et en Python de ne faire que changer les parties int√©ressantes.

√áa tombe bien, il y a des outils pour √ßa.

*Meet* [Jinja](https://jinja.palletsprojects.com).

### Jinja‚ÄØ?

Jinja.

In [None]:
%pip install -U Jinja2

Jinja est un ¬´‚ÄØmoteur de templates‚ÄØ¬ª (*template engine*), c'est un genre de `str.format` ou de *f-string*. Voyez plut√¥t‚ÄØ:

In [None]:
from jinja2 import Template 
t = Template("Hello {{ something }}!")
t.render(something="World")

OK, super mais √ßa on sait d√©j√† faire

In [None]:
s = "Hello {something}"
s.format(something="World")

Du coup, qu'est-ce que √ßa apporte de plus‚ÄØ?

In [None]:
t = Template("My favorite numbers: {% for n in numbers %} {{n}} {% endfor %}")
t.render(numbers=[2, 7, 1, 3])

C'est une boucle for‚ÄØ!

√Ä quoi √ßa sert‚ÄØ? Et bien par exemple on peut s'en servir pour g√©n√©rer des listes‚ÄØ:

In [None]:
t = Template("""Some interesting people:
<ul>
{% for p in people %}
<li>{{p.name}}, {{p.position}}</li>
{% endfor %}
</ul>
""")
lst = t.render(
    people=[
        {"name": "Guido van Rossum", "position": "Benevolent dictator for life"},
        {"name": "Ines Montani", "position": "Cofounder of explosion.ai"},
        {"name": "Kirby Conrod", "position": "Linguist and scholar"},
    ]
)

In [None]:
print(lst)

In [None]:
display(HTML(lst))

Petite subtilit√©‚ÄØ: pour se d√©barrasser des lignes vides intempestives, [on peut utiliser un
`-`](https://jinja.palletsprojects.com/en/3.1.x/templates/#whitespace-control)

In [None]:
t = Template("""Some interesting people:
<ul>
{% for p in people -%}
<li>{{p.name}}, {{p.position}}</li>
{% endfor -%}
</ul>
""")
lst = t.render(
    people=[
        {"name": "Guido van Rossum", "position": "Benevolent dictator for life"},
        {"name": "Ines Montani", "position": "Cofounder of explosion.ai"},
        {"name": "Kirby Conrod", "position": "Linguist and scholar"},
    ]
)
print(lst)

Il y a d'[autres](https://jinja.palletsprojects.com/en/3.1.x/templates/#list-of-control-structures)
fonctionnalit√©s int√©ressantes dans les templates Jinja, comme les conditions et les macros. On ne va
pas rentrer dans le d√©tail parce que c'est en g√©n√©ral une meilleure id√©e de faire les traitements
compliqu√©s c√¥t√© Python, mais elles existent et peuvent √™tre utiles √† l'occasion.

Ce qui est plus int√©ressant pour nous, c'est la possibilit√© d'√©crire nos templates dans des
fichiers. Voici par exemple le contenu de
[`examples/templates/basic.html.jinja`](examples/templates/basic.html.jinja)‚ÄØ:

```django
<!DOCTYPE html>
<html lang="en">
<head>
    <title>My favourite people</title>
</head>
<body>
    <h1>My favourite people</h1>
    <ul>
        {% for p in people -%}
            <li>{{p.name}}, {{p.position}}</li>
        {% endfor -%}
    </ul>
</body>
</html>
```

On s'en sert ainsi

In [None]:
from jinja2 import Environment, FileSystemLoader
env = Environment(
    loader=FileSystemLoader("examples/templates"),
)
t = env.get_template("basic.html.jinja")
lst = t.render(
    people=[
        {"name": "Guido van Rossum", "position": "Benevolent dictator for life"},
        {"name": "Ines Montani", "position": "Cofounder of explosion.ai"},
        {"name": "Kirby Conrod", "position": "Linguist and scholar"},
    ]
)
print(lst)

√áa permet de s√©parer un peu plus la partie **traitement des donn√©es** qui est g√©r√©e par cotre code
Python et la partie **affichage** des donn√©es qui est g√©r√©e en Jinja.

En plus, les bons IDE supportent la syntaxe de Jinja, vous devriez donc au moins avoir de la coloration syntaxique‚ÄØ!

Parmi les autres fonctions int√©ressantes, Jinja permet d'√©chapper automatiquement le HTML, afin de
se pr√©munir des injections de code. Par exemple si on reprend l'environnement pr√©c√©dent mais qu'on
change un peu les donn√©es (ce qui peut arriver si les donn√©es en question ne sont pas g√©r√©es directement par vous, mais sont issues des utilisateurs de votre application).

In [None]:
lst = t.render(
    people=[
        {"name": "<strong>Guido</strong> van Rossum", "position": "Benevolent dictator for life"},
        {"name": "Ines Montani", "position": "cofounder of explosion.ai"},
        {"name": "Kirby Conrod", "position": "Linguist and scholar"},
    ]
)
print(lst)
display(HTML(lst))

√âvidemment ici ce n'est pas tr√®s grave, `<strong>` n'est pas un tag tr√®s dangereux. En revanche on peut faire beaucoup de choses avec `<script>`. Pour un exemple, d√©commentez la derni√®re ligne de la cellule suivante, puis ex√©cutez la.

In [None]:
lst = t.render(
    people=[
        {"name": "<script>alert('boo!')</script>Guido van Rossum", "position": "Benevolent dictator for life"},
        {"name": "Ines Montani", "position": "cofounder of explosion.ai"},
        {"name": "Kirby Conrod", "position": "Linguist and scholar"},
    ]
)
print(lst)
# display(HTML(lst)) 

 Pour √©viter √ßa‚ÄØ:


In [None]:
env = Environment(
    loader=FileSystemLoader("examples/templates"),
    autoescape=True,
)

t = env.get_template("basic.html.jinja")
lst = t.render(
    people=[
        {"name": "<script>alert('boo!')</script>Guido van Rossum", "position": "Benevolent dictator for life"},
        {"name": "Ines Montani", "position": "cofounder of explosion.ai"},
        {"name": "Kirby Conrod", "position": "Linguist and scholar"},
    ] 
)
print(lst)
display(HTML(lst)) 

## FastAPI et Jinja

Les deux s'interfacent bien, ou plus pr√©cis√©ment, FastAPI propose des interfaces vers Jinja

Voici le contenu de [`examples/templates/hello.html.jinja`](examples/templates/jinja_api.py)

```django
<!DOCTYPE html>
<html lang="en">
<head>
    <title>Hello, {{name}}</title>
</head>
<body>
    <h1>Hello, {{name}}</h1>
    <p>How do you do, fellow nerd?</p>
</body>
</html>
```

Et de [`examples/jinja_api.py`](examples/jinja_api.py)

In [None]:
# %load examples/jinja_api.py
from fastapi import FastAPI, Request
from fastapi.responses import HTMLResponse
from fastapi.templating import Jinja2Templates

app = FastAPI()

templates = Jinja2Templates(directory="templates")


# Le param√®tre `request` est obligatoire, c'est la faute √† Starlette‚ÄØ!
@app.get("/hello/{name}", response_class=HTMLResponse)
async def read_item(request: Request, name: str):
    return templates.TemplateResponse(
        "hello.html.jinja", {"request": request, "name": name}
    )


Lancez cette API avec `uvicorn jinja_api:app` et allez √† <http://localhost:8000/hello/world>


## üôÑ Exo üôÑ

Reprenez les APIs de üßä et r√©√©crivez-les en Jinja. Si, si, c'est pour votre bien.