bgrep

Le logiciel grep est peut-être l’un plus connu des développeur·euses : il est utilisé pour rechercher des motifs textuels (patterns) dans des fichiers, affichant chaque ligne de texte comportant le motif défini par l’utilisateur·rice. Cela en fait un instrument pratique pour parcourir un corpus de fichiers (i.e. de textes) à partir d’une question (le motif), de l’inspecter depuis un point de vue spécifique.

Sur la plupart des systèmes d’exploitation Linux, on trouve en outre les logiciels dérivés fgrep, egrep et rgrep : ils réalisent la même opération, mais à l’aide de diverses manières de décrire les motifs textuels. (Il y a aussi pgrep, ugrep…)

bgrep est un ajout à cet arsenal analytique. Mais contrairement à grep, fgrep, etc., bgrep ne permet pas de déterminer soi-même les motifs à rechercher : il cherche les « bruits » compilés par Jacques Henri Michot (et son avatar Barnabé B) dans Un ABC de la barbarie, ces « stéréotypes “médiatiques” – paroles gelées, poisons pour la pensée » comme « charges sociales », ou « forces de l’ordre ».

bgrep peut ainsi être décrit comme un prolongement (ou une inversion ?), voire comme une implémentation informatique de ce livre de poésie-critique brechtien (qu’il permet en un sens d’appliquer), autant, bien sûr, que comme un hommage.

Versions

bgrep est proposé en plusieurs versions :

Les deux versions sont conçues à partir d’une même exigence. Par respect du droit d’auteur, la liste des bruits ne doit pas être rendue accessible, sans quoi cette oeuvre serait une reproduction pirate. Pour la version disponible en téléchargement, n’est ainsi distribué que le fichier exécutable binaire, et non le code source ; pour la version web, la liste n’est tout simplement pas accessible par les personnes qui consulte le site web.

Exemple d’usage

Un exemple : afficher les titres des articles en français de Wikipedia qui contiennent un bruit. Exemple imparfait (il y a des faux positifs, par exemple l’article Liaisons dangereuse qui porte évidemment sur le livre), mais tout de même intéressant, puisqu’il permet de voir comment cette langue s’infiltre et influence la manière dont plus généralement on découpe le monde en objets, comment on nomme ses parties, donc comment on le décrit et, in fine comment on le comprend.

# Télécharger la liste des titres de tous les articles
# en français de Wikipedia
wget https://dumps.wikimedia.org/frwiki/20251201/frwiki-20251201-all-titles.gz

# Décompresser l'archive
# -> Remplacer les `_` par des espaces
# -> Afficher les lignes bruyantes
gunzip -c frwiki-20251201-all-titles.gz \
    | sed -r 's/_/ /g;s/^[0-9]* *//' \
    | bgrep