Bourne-Again shell

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne s'appuie pas, ou pas assez, sur des sources secondaires ou tertiaires (décembre 2023).

Pour améliorer la vérifiabilité de l'article ainsi que son intérêt encyclopédique, il est nécessaire, quand des sources primaires sont citées, de les associer à des analyses faites par des sources secondaires.

Bourne-Again shell Description de l'image Gnu-bash-logo.svg. Description de cette image, également commentée ci-après Exemple d’utilisation de Bash. Informations
Créateur Brian Fox (en)
Développé par Projet GNU
Première version 8 juin 1989
Dernière version 5.2.21 (9 novembre 2023)
Dépôt git.savannah.gnu.org/cgit/bash.git
Écrit en C
Système d'exploitation GNU/Linux, BSD, macOS et Microsoft Windows
Environnement X86-64 et i686 (d)
Formats lus Bash script (d)
Langues Anglais, français, grec, portugais brésilien, bulgare, catalan, chinois classique, chinois simplifié, croate, tchèque, danois, espéranto, estonien, finnois, galicien, géorgien, allemand, hongrois, indonésien, irlandais, italien, japonais, bokmål, lituanien, coréen, polonais, portugais, roumain, russe, serbe, slovaque, slovène, espagnol, suédois, turc, ukrainien, vietnamien et néerlandais
Type Paquet GNU
Interpréteur de commandes
Langage de programmation
Licence Licence publique générale GNU version 3 ou ultérieure
Documentation www.gnu.org/software/bash/manual
Site web www.gnu.org/software/bash

Bash (abréviation de Bourne-Again shell) est un interpréteur en ligne de commande de type script. C'est le shell Unix du projet GNU.

Fondé sur le Bourne shell, Bash lui apporte de nombreuses améliorations, provenant notamment du Korn shell et du C shell. Bash est un logiciel libre publié sous licence publique générale GNU. Il est l'interprète par défaut sur de nombreux Unix libres, notamment sur les systèmes GNU/Linux. C'était aussi le shell par défaut de Mac OS X, remplacé avec macOS Catalina (10.15) par zsh. Il a été d'abord porté sous Microsoft Windows par le projet Cygwin, et depuis Windows 10 constitue une option à part entière du système d'exploitation, nommée Windows Subsystem for Linux.

Histoire

« Bourne again » est un jeu de mots sur le Bourne shell. Littéralement, Bourne again signifie « Bourne encore », mais se prononce également presque comme born again, signifiant « né de nouveau » ou encore « réincarné ». Également, to bash signifie « frapper violemment » en anglais.

Brian Fox, a publié en 1988 la première implémentation de Bash pour le compte de la Free Software Foundation. Il a été relayé plus tard par Chet Ramey. Le Bourne shell originel, dont s'inspire Bash, fut écrit par Stephen Bourne en 1977. La version 3.0 date de juillet 2004, et la version 4.0 de février 2009.

Le 24 septembre 2014, une faille de sécurité majeure est rendue publique, permettant le piratage du Bash via des scripts CGI. Ses utilisateurs sont alors invités à le patcher pour s'en prémunir.

Usage

Comme tous les interpréteurs en ligne de commande de type script, Bash exécute quatre opérations fondamentales :

  1. Il fournit une liste de commandes permettant d'opérer sur l'ordinateur (lancement de programmes, copie de fichiers, etc.) ;
  2. Il permet de regrouper ces commandes dans un fichier unique appelé script ;
  3. Il vérifie la ligne de commande lors de son exécution ou lors d'une éventuelle procédure de vérification et renvoie un message d'erreur en cas d'erreur de syntaxe ;
  4. En cas de validation, chaque ligne de commande est interprétée, c'est-à-dire traduite dans un langage compréhensible par le système d'exploitation, qui l'exécute alors.

Les scripts sont de courts programmes généralement faciles à construire. Bash offre un service de gestion de flux, c'est-à-dire qu'il permet que le résultat d'un script (la sortie) soit transmis à un autre script (l'entrée). De cette façon, les scripts peuvent être « chaînés », chacun effectuant une seule tâche bien délimitée.

Les scripts peuvent être exécutés manuellement par l'utilisateur ou automatiquement par le système. Par exemple, dans la distribution GNU/Linux Ubuntu, le répertoire resume.d contient un certain nombre de scripts qui s'exécutent automatiquement lors du redémarrage du système, c'est-à-dire après la fin de la mise en veille de celui-ci. Ces scripts servent à relancer les différents programmes interrompus par la mise en veille.

Fonctionnement

Bash est un shell qui peut être utilisé soit en mode interactif, soit en mode batch :

Session en mode interactif

Une « session » est l'ensemble des actions effectuées par l'utilisateur d'un système informatique, entre le moment où il se connecte à celui-ci et le moment où il s'en déconnecte.

Bash est le plus souvent utilisé par défaut pour les ouvertures de sessions dans les distributions GNU/Linux. On le retrouvait également comme shell par défaut sous MacOS X, jusqu'à la version Catalina en 2019.

Fermeture en mode interactif

La fermeture de session se fera par la commande exit ou Ctrl+D (la marque de fin de fichier sous Unix : l'utilisateur ferme le flux de lecture de l'interpréteur).

Scripts exécutés lors du lancement de bash

readline et l'édition de la ligne de commande

Bash utilise la bibliothèque readline ce qui lui permet, comme le C shell, de compléter automatiquement (autocomplétion) les noms de commandes et de fichiers lors d'une frappe sur la touche Tabulation et d’accélérer considérablement le travail. Les touches Haut et Bas permettent de naviguer avec facilité dans l'historique des commandes.

Édition de la ligne de commande en mode vi ou Emacs

Il est également possible de choisir pour l'édition de la ligne de commande un comportement similaire à celui de l'éditeur de texte vi ou à celui de Emacs. Il faut alors utiliser les commandes set -o et set +o qui modifient les options du shell. Leur comportement est contre-intuitif car set -o active une option, tandis que set +o la désactive.

set -o emacs lance l'édition de ligne de commande en mode emacs et set -o vi en mode vi. Depuis la version 2.0, une nouvelle commande interne a été ajoutée pour la configuration du comportement du shell : shopt. Elle est destinée à remplacer la configuration des options par set. Le fonctionnement de shopt -o est semblable à set -o et celui de shopt +o à celui de set +o pour assurer la continuité avec set.

Interprétation et exécution des commandes

Pour interpréter une ligne, Bash la segmente en mots. Le premier mot d'une ligne est considéré comme un nom de commande. On place ensuite les « arguments », qu'on nomme aussi les « paramètres » de la commande, c'est-à-dire les données qu'elle va traiter, un fichier par exemple. Enfin on peut ajouter des « options » qui vont modifier le comportement standard de la commande. Ces options sont introduites par « - », le tiret court, puis par le nom de l'option, ou une simple lettre en guise de raccourci. On ne place pas d'espace entre le tiret et le nom de l'option.

Interprétation

Chaque interprétation d'une ligne respecte les contraintes suivantes :

Il existe plusieurs types de noms de commande associés à différents degrés de priorité. En suivant l'ordre décroissant des priorités, lors de l'interprétation de ce premier mot, on trouve :

Si Bash ne trouve aucune correspondance dans les alias, les commandes internes ou les commandes externes avec le premier mot de la ligne, il renvoie un message d'erreur en faisant précéder command not found du mot tapé en tête de ligne.

Exécution

Dans le cas d'une commande externe, le shell doit retrouver le programme correspondant à cette commande avant de pouvoir l'exécuter. Une recherche exhaustive, pour chaque commande, dans tout le système de fichiers prendrait beaucoup trop de temps et rendrait le système inutilisable dans la pratique. Seul un petit ensemble de répertoires est en fait consulté lors de la recherche du programme permettant l'exécution de la commande. Ces répertoires sont définis dans une variable d'environnement appelée « $PATH ». Si la commande n'est pas trouvée dans l'un des répertoires listés dans cette variable, « le PATH », l'exécution se solde par un message d'erreur du type command not found.

Contrairement à ce qui se passe sous Windows, pour des raisons de sécurité, les shells Unix, dont Bash, n'incluent pas implicitement le répertoire courant dans le PATH, mais il peut y être placé explicitement. Cela permet d'éviter qu'un individu n'installe dans le répertoire courant un programme malveillant qui, portant le même nom qu'une commande externe, pourrait s'exécuter à sa place si un utilisateur tapait cette commande.

Syntaxe

Les métacaractères du shell

Un métacaractère est un caractère qui possède une signification autre que sa signification littérale. « * » ne représente pas pour Bash le caractère étoile, il le lit comme représentant n'importe quelle suite de caractère ou une absence de caractère. Les métacaractères se divisent en deux classes, ceux qui se substituent à d'autres caractères et ceux qui permettent de protéger des caractères. Ces derniers, employés seuls comme dans le cas de l'anti-slash, ou par paires, forcent Bash à lire des caractères de façon littérale, c'est-à-dire que s'il est protégé, le caractère « * » perd son statut de métacaractère pour redevenir une « étoile ».

Il y a deux métacaractères de substitution :

  1. * : correspond à aucun caractère, n'importe quel caractère ou un ensemble de caractères ;
  2. ? : est équivalent à un caractère quelconque.

Il y a trois moyens pour protéger un caractère ou une chaîne de caractères :

  1. \ : empêche l'interprétation spéciale d'un métacaractère ;
  2. ` : les guillemets inversés (backquotes, touches AltGr+7 sur un clavier français) provoquent une interprétation de la chaîne de caractères incluse entre deux de ces caractères comme une commande. Exemple : for file in `ls` ;
  3. ' : tous les caractères inclus entre deux de ces caractères sont interprétés comme du texte.

Le caractère d'échappement : anti-slash « \ »

Anti-slash en fin de ligne

À la fin d'une ligne, un anti-slash indique que la commande continue à la ligne suivante. Cette fonction est particulièrement utile pour les grandes commandes afin de les rendre plus facilement lisibles.

Anti-slash pour former un des caractères spéciaux du C

Les chaînes ayant un format analogue à $'\n', dans lesquelles on note la présence de l'anti-slash, sont interprétées d'une façon particulière par Bash. On remarque que l'anti-slash est suivi d'une lettre et que le groupe est encadré par des apostrophes. Dans ce cas, il ne s'agit pas d'échapper la signification d'un métacaractère. C'est une façon d'indiquer à Bash que la combinaison de l'anti-slash et de la lettre représente un caractère spécial du langage C à interpréter selon les règles édictées par l'ANSI. Ainsi 'echo $'\a' provoquera un « bip ».

Le tableau qui suit donne la liste de ces caractères spéciaux :

Échappement
par antislash
Transformation par Bash
\a Bip
\b Espacement arrière
\e Échappement
\f Saut de page (le nom anglais de ce caractère est form feed)
\n Saut de ligne
\r Retour chariot
\t Caractère de tabulation horizontale
\v Caractère de tabulation verticale
\\ Anti-slash
\' Une apostrophe (le nom anglais de ce caractère est quote)
\nnn Le caractère 8 bits dont la valeur en octal est nnn
\xHH Le caractère 8 bits dont la valeur en hexadécimal est HH
\cx Le caractère contrôle-X

Voir ASCII

Anti-slash avant un des méta-caractères de Bash

Les méta-caractères, notamment « * » (étoile), ne sont pas interprétés par Bash en tant que littéraux, ce qui est gênant dans certains cas. Les commandes find, sed exemplifient ce point délicat. Si à l'aide de la commande find on souhaitait chercher dans le répertoire courant, représenté par « . », et ses sous-répertoires, tous les fichiers dont le nom commence par « my », on serait tenté d'écrire la ligne de commande suivante find . -name my* Mais la commande renverra Find: Les chemins doivent précéder l'expression.

En effet Bash va substituer à la chaîne « my* » la liste des fichiers contenus dans le répertoire courant, ce que find considère comme étant une liste de chemins, qui doivent être spécifiés en premier lieu, et non comme le nom des fichiers à rechercher.

Une des solutions consiste à utiliser un anti-slash avant le caractère « * » pour l'échapper et forcer Bash à l'interpréter comme un littéral. Ce qui donne find . -name my\*.

Une autre solution serait d'utiliser les guillemets. On pourrait par exemple écrire find . -name "my*"

Gestion de processus

Commandes Opérations Explications
A & Crée un nouveau processus en lançant la commande A (dépendant de la console), permettant d'entrer d'autres commandes dans la même console.
( A & ) Même chose que la commande ci-dessus, mais cette fois le processus créé est indépendant de la console.
A && B ET logique (&&) Exécute B, si A réussit.

B si A OK

A || B Exécute B uniquement si A échoue.

B si A KO

A `B` paramètres dynamiques A utilise les résultats de l'exécution de B
A $(B)

Gestion de flux

Chaque commande est associée à trois flux :

  1. l'entrée (ou « input » ou encore stdin) standard (entrée 0) ;
  2. la sortie (ou « output » ou encore stdout) standard (entrée 1) ;
  3. la sortie d'erreur standard (stderr) (entrée 2)

Éventuellement, des descripteurs de fichier supplémentaires peuvent être associés à une commande.

Méthode d'utilisation :

Commandes Opérations Explications
A > fichier sortie (>) Exécute la commande A et redirige sa sortie standard (stdout) dans fichier en écrasant son contenu ou en créant fichier si celui-ci n'existe pas
A >> fichier sortie (>>) Exécute la commande A et redirige sa sortie standard à la fin de fichier
A 2> fichier sortie (2>) Exécute la commande A et redirige sa sortie standard des erreurs (stderr) dans fichier en écrasant son contenu ou en créant fichier si celui-ci n'existe pas
A 2>> fichier sortie (2>>) Exécute la commande A et redirige sa sortie standard des erreurs à la fin de fichier
A 2>&1 sortie (2>&1) Exécute la commande A et redirige sa sortie standard des erreurs dans sa sortie standard
A < fichier entrée (<) Exécute la commande A en lui passant le contenu de fichier dans son entrée standard (stdin)
A | B sortie, entrée(|) Exécute A et envoie le contenu de sa sortie standard dans l'entrée standard de B

Redirection de l'entrée et des deux sorties

Utiliser

Variables du shell

Les variables sont référencées en les faisant précéder par le signe $ (exemple echo $HOME).

Quelques variables d'environnement : USER, PID, HOME, PATH et SHELL.

Substitution de commandes

Dans une ligne de commande, on remplace comme argument une commande par son résultat (au stdout) en l'entourant d'apostrophes inversées `nom commande` ou encore en utilisant $() ($(nom commande)).

Expression rationnelle

Les expressions rationnelles ou expressions régulières permettent de décrire des chaînes de caractères. On peut discerner deux catégories parmi ces derniers. Les littéraux, qui sont des caractères normaux traités comme tels, et les métacaractères qui sont des symboles ayant un sens pour une recherche. Il a déjà été question au-dessus des caractères * et ?. Il est possible d'affiner la description du motif que l'on recherche et de préciser son emplacement.

Ainsi ^ représente le début d'une ligne et $ la fin. Par exemple ^ter représente toutes les lignes commençant par ter et ter$ toutes celles se terminant par ter.

Des métacaractères représentent aussi des classes de caractères. Par exemple dans scince le contenu des crochets représente un OU logique. Sont représentées science et sciance. À l'aide des crochets, il est aussi possible de définir des intervalles, il faut ajouter un tiret. Il s'ensuit que équivaut à tous les chiffres de 0 à 9, à toutes les lettres minuscules et à toutes les lettres majuscules. À l'intérieur des crochets, plusieurs classes de caractères peuvent être combinées : par exemple, epsilon spécifie que epsilon peut être suivi d'un chiffre entre 0 et 9 ou d'une lettre majuscule.

Le ^ à l'intérieur des crochets signifie la négation. De la sorte (^ est le deuxième caractère) définit ni « e » ni « o ».

Les expressions entre crochets ne permettent pas de décrire une chaîne de caractères, elles ne correspondent qu'à un seul caractère. Pour décrire une chaîne, il faut utiliser les parenthèses, lesquelles constituent une sous-expression régulière. Le tube | indique alors les alternatives. lou(p|ch)er décrit aussi bien louper que loucher.

Raccourcis clavier en mode Emacs

Raccourcis clavier en mode vi

Le mode vi s'active par la commande set -o vi et se désactive par set +o vi. Au début d'une ligne on est en mode insertion, pour passer en mode commande il faut appuyer sur la touche échap.

Voici un résumé des commandes, pour un descriptif complet rendez-vous sur la page vi.

Déplacement :

Action :

En mode éditeur

Remplacement de motifs :

Une pression sur la touche "n" permet de répéter la recherche/substitution sur l'occurrence suivante, "N" permet de répéter/substituer sur l'occurrence précédente.


Répétition de commandes :

Édition de la ligne courante :

Voir aussi

Articles connexes

Liens externes

Notes et références

Notes
  1. Pour le saut de page, voir (en) Page break
  2. (en) find
Références
  1. « bash-5.2.21.tar.gz », 9 novembre 2023 (consulté le 9 novembre 2023)
  2. Patch Bash NOW: 'Shell Shock' bug blasts Linux, OS X systems wide open, The Register, 24 septembre 2014
  3. Quick Reference Bash