Herman Hollerith, autre précurseur des principes de l’informatique au sein d’une longue chaîne d’innovations

Publié par ACONIT (Association pour un Conservatoire de l'Informatique et de la Télématique), le 5 juin 2024   820

(en forme d’initiation à destination des plus jeunes)

(Xavier Hiron, ACONIT)

Illustration d'en-tête : La carte perforée mise au point par Herman Hollerith pour le recensement américain de 1890 (image wiki commons)

Commençons par une simple devinette : qui, parmi les lecteurs de cet article, saurait dire ce que recouvrent les lettres formant le sigle de la firme IBM ? Bien peu, au demeurant, surtout parmi les plus jeunes, qui spontanément pourraient identifier le I comme la marque possible du mot Informatique (mot qui, rappelons-le, n’a pas de correspondance exacte en anglais).

C’est justement le genre d’ambiguïté que le géant mondial du domaine a pu souhaiter favoriser quand, dès le début des années 1970, plutôt que de changer sa raison sociale (au mieux, Informatics Business Machine eût-il pu paraître cohérent ?), il préféra occulter sur ses documents à grand tirage son développé d’origine, pour ne garder que ces simples initiales. Or son intitulé complet, en l’occurrence International Business Machine, a ceci de révélateur qu’il renvoie aux fondements même et à la raison d'être de l’entreprise, qui s'élaborent à la charnière des XIXe et XXe siècles, alors que la science informatique n’existait pas encore. En effet, les développements de la mécanographie, formant une chaîne de traitement des informations, elle-même issue des innovations d’Herman Hollerith, s’attachèrent en première intention à faciliter la gestion des entreprises de commerce et des services publics.

La firme émane des inventions d’un jeune ingénieur surdoué, statisticien visionnaire, Herman Hollerith, qui répond en 1887 à un appel d’offre lancé par le gouvernement américain en vue d’améliorer le traitement du recensement décennal (c’est-à-dire ayant lieu tous les dix ans), lequel, pour la tranche antérieure, avait mis 9 années à être dépouillé manuellement. Or les Etats-Unis se trouvent à l’époque dans une situation de très fort accroissement démographique, du fait d’un afflux considérable de migrants sur le sol américain. Herman Hollerith, lui-même fils de migrants allemands et déjà rattaché au bureau fédéral du recensement, propose donc sa solution mécanisée. Il reprend le système des cartes perforées déjà développé par Charles Babbage au début du XIXe siècle pour sa machine analytique (l’ancêtre mécanique des ordinateurs), ne retenant, dans un premier temps, que sa fonction de support de données. A ces cartes, qui identifient chaque élément premier (les individus à recenser) et leurs caractéristiques, il adjoindra une machine électromécanique capable d’effectuer automatiquement des tris de difficultés variables : par sexe, tranche d’âge, activité socioprofessionnelle, etc. A ses débuts, la carte n’a cependant pas de format prédéfini et propose de simples choix d'occurrences, son objectif premier étant l’efficacité (voir l’illustration d’en-tête).

Mais préalablement à la réalisation de la trieuse qui fera le succès de son système, cette recherche d'efficacité va conduire Herman Hollerith à produire une invention particulière d’une autre nature. Sur la suggestion de son collègue John Shaw Billings, il invente une tabulatrice tout-à-fait étonnante, dont le principe n’est pas encore le tri par catégories, mais qui veut assurer le rôle de compteurs multi-sériels. C’est sur son principe qu’il faut nous arrêter un instant. Outre sa forme de bureau classique pourvu d'une alimentation électrique, elle a pour raison d’être de coupler un organe de lecture de cartes et un tableau de compilation des résultats. Dans le passage de l’un à l’autre réside probablement l’un des éléments fondateurs de la future informatique. De quoi s’agit-il ?

Herman Hollerith divise sa machine en deux actions complémentaires, que l’on peut qualifier de caractéristiques d’un calcul électromécanique. La première consiste à lire les données préinscrites sur les cartes perforées, en utilisant les perforations comme matrice d’une donnée. Pour ce faire, il réalise un bloc amovible contenant autant de picots métalliques qu’il y a d’emplacements possibles de perforations (en l’occurrence, sur les premières cartes dédiées au recensement américain, ceux-ci sont au nombre de 288). Par définition, lorsque l’emplacement est grevé d’une perforation, le picot poursuit sa descente vers un bac contenant du mercure liquide placé juste en dessous de la carte. Jouant sur la nature métallique des picots et du bain de mercure (dans les faits, un simple contact avec une plaque de métal conducteur suffit à obtenir un résultat identique), Herman Hollerith n’a plus qu’à mettre l’ensemble sous faible tension, et chaque picot traversant transforme alors la donnée initiale, matérialisée par l’absence du continuité du support (perforation), en un signal électrique. Lequel signal, générant une impulsion transmise par câblage à son compteur dédié, permet la lecture de l’incrément +1 sur ce dernier. Pour ce faire, les premières perforations présentaient un profil circulaire, et non pas rectangulaire, comme l’instaurera le format standard international établi ultérieurement.

La tabulatrice d’Hermann Hollerith associant un principe de lecture et un comptage

(photographie wiki commons)

Ce que produit Herman Hollerith en la matière est de deux ordres. D’abord, son concept consacre le fait qu’une donnée soit inscrite de manière pérenne sur un support tangible ; de ce fait, ce support et l’information qu’il contient deviennent réutilisables. Ceci permet leur archivage, ce qui fera d’ailleurs le succès de la mécanographie, technique nouvelle qui se mondialise à partir des années 1920 et restera très présente au sein des entreprises jusqu’au début des années 1980, en Europe notamment. L’autre élément clé est plus conceptuel ; introduisant une lointaine analogie – mais peut-être sans en avoir pleinement conscience, du moins à ses débuts – avec la structure binaire de l’algèbre booléenne, Herman Hollerith associe le traitement d’une donnée à celui d’un signal électrique inactif (0, ou absence de signal) ou actif (1, ou réception d’un signal), qu’il convertit alors, par l'intermédiaire d'un électroaimant, en une action mécanique.

Pour sa part, la forme très élaborée de l’algèbre binaire développée par Georges Boole au milieu du XIXe siècle ne consistait, lorsque celui-ci la décrivit, qu’en un travail purement théorique. Brillant logicien, on a même prêté à son système de pensée une portée purement symbolique. Il est vrai que ses multiples applications en téléphonie, puis en informatique, ne purent véritablement s’épanouir qu’un demi-siècle à un siècle après sa mort, alors que les relais (sorte de composants électromécaniques jouant le rôle d’un interrupteur – ou plus exactement, qui « distribue la puissance électrique en fonction d'une impulsion donnée par la partie commande ») puis les transistors (composants encore plus petits qui permettront l’élaboration des portes logiques) arrivèrent successivement sur le marché. Raison pour laquelle on ne parle ici que d'une simple analogie entre l'univers de l'ingénieur et celui du théoricien ; mais cette mise en parallèle permet de comprendre comment les finalités d'un système et celles d'un concept finirent par se rejoindre, pour contribuer à faire émerger dans la durée la science informatique.

Par ailleurs, si l'on voulait pousser plus loin l'analogie énoncée ci-dessus, certes toute théorique et qui ne peut s'envisager au niveau du concept qu'a posteriori, on pourrait imaginer qu'un opérateur passant régulièrement une carte à chaque intervalle de 10 secondes introduirait une notion proche d'une séquence d'horloge, élément essentiel des ordinateurs modernes dans la prise en compte des données, dans le cadre d'un traitement binaire élaboré. C'est en effet à une horloge interne que revient le rôle de déclencher périodiquement les impulsions des micro-signaux électriques qui caractériseront les données à traiter par les systèmes modernes (mais à des fréquences bien inférieures à la milliseconde).

Quoi qu’il en soit de ces évolutions que nous envisageons ici par anticipation, à des fins purement pédagogiques, Herman Hollerith réalise une association qui va ouvrir une nouvelle ère du traitement des données, association par laquelle la réalisation d’un signal joue le rôle de préfiguration d’une porte logique. Avec ce dispositif, nous nous trouvons à l’orée d’une nouvelle approche dont découlera toute l’électronique moderne. En effet, les premières réalisations de calculateurs électroniques de la première moitié du XXe siècle, à base de relais, diodes et de tubes, ne feront que prolonger ce concept d’un traitement de la donnée sous la forme d’un signal. Raison pour laquelle l’entreprise américaine IBM, directement issue des brevets pris au profit d’Hermann Hollerith sur les cartes perforées et les machines de mécanographie (IBM sera créée en 1911 à partir de la fusion de plusieurs entreprises, dont la Tabulating Machine Compagny fondée par Hollerith lui-même), gardera longtemps une longueur d’avance dans le développement des machines de bureau et calcul sur l’ensemble de ses concurrents internationaux. En 1928 notamment, IBM développera un format standard universel, sur une base alphanumérique à 80 colonnes et dessiné à la taille d’un billet d’un dollar de l’époque (ce qui se révèlera pratique pour diffuser à l'échelle mondiale une référence de gabarit adapté à toutes les formes d’utilisation, qu’elles soient commerciales, techniques ou scientifiques – émission des paies, gestion des stocks, calculs en laboratoire. Qui plus est, ces cartes perforées pourront aussi bien, et indépendamment, supporter des suites d’instructions machine, ce qui autorisera, dès qu’apparaîtront les premiers ordinateurs programmables (soit après 1950), le recours à de véritables jeux de programmes, préalablement à l’envoi de paquets (ou jobs) de données à traiter.

Modèle de carte perforée alphanumérique à 80 colonnes où chaque signe imprimé en haut de la carte est caractérisé par une à trois perforations réparties dans sa colonne

(photographie wiki commons)

L’histoire ne s’arrête pas là. En effet, face au succès de la mécanographie et à son implantation solide dans les entreprises et laboratoires de calcul, il fallut, par la suite, gérer les transitions vers des technologies beaucoup plus performantes. Comme nous l’avons signalé, l’on trouvait encore des stocks très importants de cartes perforées en activité dans le courant des années 1970, un peu partout dans le monde, alors que les processeurs avaient progressivement pris la place de l’électronique de base, dès le courant des années 1950. Ceci explique la longueur de ce biseau technologique dont, en France, les machines Bull Gamma 3 et Bull Gamma 30, par exemple, sont emblématiques. (Il existe de nombreux exemples équivalents au sein des productions d’IBM, mais qui paraissent moins significatifs). Le Gamma 3, surtout la version ET équipée d’un tambour magnétique jouant le rôle de mémoire vive, permettait d’accepter des paquets de cartes en programmation et en données, mais n’incluait pas l’archivage des résultats autrement que par le biais d’une imprimante (listings) ou la perforation d’un nouveau jeu de cartes. Le tambour magnétique autorisait le stockage temporaire d’une valeur (jusqu’à environ 800 ko) pour la réinjecter dans un calcul suivant immédiat. La panoplie des actions de ce calculateur électronique à tubes en était élargie, mais pas ses capacités de stockage qui restaient assujetties aux lots de cartes perforées inscrites par des opérateurs (souvent féminines à l’époque), préalablement aux opérations effectuées par les machines.

Avec le Gamma 30, d’une technologie effective datant de 1964-65, les traitements de la machine s’effectuent par le biais d’un jeu de circuits imprimés reliés entre eux par voie filaire ; mais surtout, grâce à ses mémoires à tores de ferrite, elle autorisait une mémoire vive de 20 000, voire 40 000 caractères. Ainsi pouvait-on obtenir un système hybride en lisant des données préexistantes sur cartes perforées, mais en les transférant elles-mêmes ou les acquisitions de résultats découlant de leurs traitements, sur des supports de bandes magnétiques, système qui prévalut durant une trentaine d’années environs avant que ne se généralisent les mémoires numériques intégrées aux stations elles-mêmes. Bref, par le biais de ces technologies de transition, la carte perforée perdura environ un siècle : pas si mal, pour un simple bout de carton fin de la taille d’un billet vert !

« L'Ordonnateur » Gamma 3 ET de Bull - en réalité, un calculateur électronique de transition, et de toute façon, le mot ordinateur n’existe pas encore en 1957 - présenté sur un salon lors de sa sortie

(crédit photographique Fédération des équipes Bull)


Pour aller plus loin, consulter les notices :  Herman Hollerith, mécanographie, carte perforée,  A l'origine de l'informatique, algèbre de Boole (pour commencer à entrer dans la technique), IBM (firme américaine) (pour l'aspect histoire sociale des entreprises).