<!-- LTeX: language=fr -->

Cours 4‚ÄØ: Modules
=================

**Lo√Øc Grobol** [<lgrobol@parisnanterre.fr>](mailto:lgrobol@parisnanterre.fr)


# Les fonctions c'est bien

Quand on r√©utilise plusieurs fois le m√™me morceau de code, c'est pratique de ne pas avoir √† se
r√©p√©ter

In [None]:
def un_truc_long_√†_√©crire(s):
    res_lst = []
    for c in s:
        if c.islower():
            res_lst.append(((ord(c) - 84) % 26) + 97)
        elif c.isupper():
            res_lst.append(((ord(c) - 52) % 26) + 65)
        else:
            res_lst.append(ord(c))
    return "".join([chr(x) for x in res_lst])

In [None]:
un_truc_long_√†_√©crire("Arire tbaan tvir lbh hc")

In [None]:
un_truc_long_√†_√©crire("Arire tbaan yrg lbh qbja")

C'est aussi pratique pour s√©parer des morceaux de code qui font des choses diff√©rentes

In [None]:
from collections import Counter

def most_common(lst, n):
    """Renvoie les n √©l√©ments les plus fr√©quents de lst"""
    counts = Counter(lst)
    sorted_by_freq = sorted(counts.keys(), key=counts.get, reverse=True)
    return sorted_by_freq[:n]

def keep_only_10_most_common(s):
    """Ne garder que les 10 √©l√©ments les plus communs de s"""
    keep = most_common(s, 10)
    res = []
    for c in s:
        if c in keep:
            res.append(c)
        else:
            res.append("_")
    return "".join(res)

keep_only_10_most_common(
    """Aujourd‚Äôhui, maman est morte. Ou peut-√™tre hier, je ne sais pas. J‚Äôai re√ßu un t√©l√©gramme de
    l‚Äôasile : ¬´ M√®re d√©c√©d√©e. Enterrement demain. Sentiments distingu√©s. ¬ª Cela ne veut rien dire.
    C‚Äô√©tait peut-√™tre hier."""
)

## Pour vivre heureux, cachons le code

Cette division du code en morceaux plus petits et autonomes s'appelle *s√©paration des
pr√©occupations*.

**Principe** : chaque fonction doit faire une chose et une seule en √©tant la plus g√©n√©rique
possible.

Par exemple, peu importe que je n'applique `most_common` que sur des cha√Ænes de caract√®res ici, elle
marcherait pour n'importe quel it√©rable

- Je ne m'occupe que d'une chose √† la fois
- Je ne m'encombre pas l'esprit avec des informations qui ne concernent pas cette chose
- Quand j'utilise ma fonction, je ne me soucie plus de comment elle a √©t√© √©crite (et
  l'impl√©mentation est donc facile √† changer)
- Accessoirement, je ne pollue pas l'*espace de nom* avec des variables qui ne serviront plus

On rejoint le concept d'API, dont on reparlera

# Les modules

1. Ouvrez votre √©diteur de texte pr√©f√©r√©
2. Cr√©ez un nouveau fichier (dans un dossier vide, pour la suite)
3. Enregistrez le sous le nom `libspam.py`
4. Voil√†, vous avez cr√©√© un module

## Qu'est-ce qu'un module ?

Techniquement, n'importe quel fichier portant l'extension `.py` et ne comprenant que du code
interpr√©table par Python est un module.

Jusque-l√† √ßa n'a pas l'air tr√®s int√©ressant.

1. Dans votre fichier `libspam.py`, ins√©rez le code suivant‚ÄØ:

   ```python
   def sing():
         print("spam, spam, lovely spam!")
   ```

2. Cr√©ez un fichier `spam.py` **dans le m√™me dossier** et ins√©rez-y‚ÄØ:

   ```python
   import libspam
   libspam.sing()
   ```

3. Ex√©cutez `spam.py` (`python spam.py`)

## Pourquoi ?

C'est le niveau suivant de s√©paration des pr√©occupations : du code autonome dans un fichier
diff√©rent

‚Üí‚ÄØNon seulement vous n'avez pas besoin de **penser** au code, mais vous n'avez m√™me pas √† le
**voir**

Vous pouvez m√™me garder les m√™mes modules d'un projet √† l'autre, plus de copier-coller brutal de
code entre vos projets‚ÄØ!

Mieux‚ÄØ: vous pouvez plus facilement partager du code avec d'autres et utiliser le leur (on y
reviendra)

# Utiliser des modules

Vous utilisez depuis longtemps des modules‚ÄØ: ceux de la biblioth√®que standard par exemple

In [None]:
import re

re.sub(r"[^a√†√¶e√©√®√™√´i√Æ√Øo√¥≈ìu√ª√ºy√ø]", "", "longtemps je me suis couch√© de bonne heure")

Du point de vue *interne* (dans votre code), un module est un *objet* qui appara√Æt dans votre code
gr√¢ce √† une invocation de `import`

In [None]:
import sys

type(sys)

C'est un objet essentiellement normal, qui poss√®de des propri√©t√©s et des m√©thodes, qui sont celles
d√©finies dans le fichier `.py` correspondant

In [None]:
dir(re)

Par convention, ici comme ailleurs, les membres √† usage priv√© (qui ne sont pas cens√©s √™tre utilis√©s
√† l'ext√©rieur du module et ne font donc pas partie de l'interface publique) commencent par un
underscore.

In [None]:
[m for m in dir(re) if m.startswith("_")]

Les membres entour√©s d'underscores (comme `__file__`), ou *dunders* (pour *double underscore*) sont
des membres trait√©s par le langage de fa√ßon particuli√®re.

In [None]:
re.__file__

Par exemple `__file__` n'est pas d√©fini dans `re.py`, mais est affect√© au moment de `import re`

# `import`

La commande `import` est l'une des plus importantes commandes de python. Quand elle est invoqu√©e
comme `import machin`, Python‚ÄØ:

1. Cherche dans les dossiers de modules un fichier nomm√© `machin.py`
2. Ex√©cute le code qu'il contient
3. Rend disponible les objets qui en r√©sultent en les leur donnant le nom `machin.<bidule>` o√π
   `<bidule>` est le nom de l'objet dans `machin`

Autrement dit, si vous avec `truc = 1` dans `machin.py`, quand vous importez `machin`, vous avec
`machin.truc` avec la valeur `1`.

## Importer des modules

**O√π** Python va chercher les modules et comment il les nomme est un sujet complexe et on ne
traitera pas tout, cependant

- Les modules qui se trouvent dans le m√™me dossier que votre script sont directement importables
- Les modules pr√©sents dans le `PYTHONPATH` sont directement importables

In [None]:
import sys
sys.path

On peut √©galement importer des modules qui se trouvent dans des sous-dossiers du dossier de script.

Si par exemple vous avez l'arborescence suivante

```text
.
‚îú‚îÄ‚îÄ script.py
‚îî‚îÄ‚îÄ spam
    ‚îú‚îÄ‚îÄ ham.py
    ‚îî‚îÄ‚îÄ __init__.py
```

Alors `ham.py` peut √™tre import√© dans `script.py` en utilisant la commande

```python
import spam.ham
```

Et sera disponible sous le nom `spam.ham`. Par exemple dans la biblioth√®que standard, vous trouverez
`sys.path` sur ce mod√®le (mais utilisez plut√¥t `pathlib`).

## Imports avanc√©s

Si vous n'aimez pas le nom d'un module, vous pouvez l'importer sous un autre nom avec `import ‚Ä¶ as
‚Ä¶`

In [None]:
import numpy as np

np.max([1,7,3])

Ce qui peut √™tre utile pour les noms √† rallonge

In [None]:
import matplotlib.pyplot as plt

Vous pouvez aussi n'importer que ce que vous int√©resse avec `from ‚Ä¶ import ‚Ä¶`

In [None]:
from re import sub
sub(r"[aeiou]", "üíì", "Plurital")

Ce qui concerne √† la fois les membres des modules et les sous-modules.

On peut aussi importer l'int√©gralit√© d'un module

In [None]:
from re import *
sub(r"[aeiou]", "üíì", "Plurital")

On le trouve souvent dans la nature, mais c'est en g√©n√©ral une **tr√®s mauvaise id√©e**:

- √áa rend tr√®s difficile de savoir d'o√π viennent les objets dans votre module
- En ajoutant les fonctions dans l'espace de nommage du script vous pouvez √©craser des fonctions
  existantes.

Et finalement‚ÄØ:

In [None]:
import contextlib
import io
with contextlib.redirect_stdout(io.StringIO()) as ham:
    import this
print(ham.getvalue().splitlines()[3])

## Un package

In [None]:
!tree operations_pack

Un package python peut contenir des modules, des r√©pertoires et sous-r√©pertoires, et bien souvent du
non-python : de la doc, des donn√©es pour les tests‚Ä¶

Le r√©pertoire principal et les r√©pertoires contenant des modules python doivent contenir un fichier
`__init__.py`

`__init__.py` peut √™tre vide, contenir du code d'initialisation ou contenir la variable `__all__`

In [None]:
import operations_pack.simple
operations_pack.simple.addition(2, 4)

In [None]:
from operations_pack import simple
simple.soustraction(4, 2)

`__all__` dans `__init__.py` d√©finit quels seront les modules qui seront import√©s avec `import *`

In [None]:
!cat operations_pack/__init__.py

In [None]:
from operations_pack import *
multi.multiplication(2,4)

# Pas de `main` en Python ?

Vous trouverez fr√©quemment le test suivant dans les scripts Python :

```python
if __name__ == "__main__":
    instruction1
    instruction2
```

ou

```python
def main():
    instruction

if __name__ == "__main__":
    main()
```

Cela √©vite que le code dans le bloc `if` ne soit ex√©cut√© lors de l'import du script : `__name__`
est une variable cr√©√©e automatiquement qui vaut `__main__` si et seulement si le script a √©t√© appel√©
en ligne de commande, le nom du script s'il a √©t√© import√©.

Accessoirement cela permet d'organiser son code et de le rendre plus lisible
Cela permet aussi d'importer les fonctions du script √† la mani√®re d'un module

Je vous ~~recommande vivement~~ demande de l'inclure dans tous vos scripts. On verra aussi d'autres
fa√ßons de g√©rer les interfaces en ligne de commande‚Ä¶

## O√π sont les modules et les packages ?

Pour que `import` fonctionne il faut que les modules soient dans le `PYTHONPATH``.

In [None]:
import sys
sys.path

`sys.path` est une liste, vous pouvez la modifier, **mais √©vitez √† moins d'avoir une tr√®s bonne
raison**.

In [None]:
sys.path.append("/home/bidule/mon/super/module/")
sys.path