Made-up Mind. A constructivist approach to artitricial intelligence

Note de lecture par LE MOIGNE Jean-Louis

Peut-être faut-il prêter attention à l'expérience modélisatrice originale qui semble se développer depuis peu dans le champs des sciences de la cognition et de l'intelligence artificielle, sous le nom du "paradigme constructiviste", se présentant comme une sorte de troisième voie entre les paradigmes "symbolistes" et "connexionnistes".

La thèse de G.L. Drescher a non seulement le mérite de nous proposer une présentation argumentée de cette "approche constructiviste de l'I.A.", mais aussi celui de s'efforcer de repérer ses liens et ses différences avec les ploblématiques "classiques" (ou présumées telles), nous aidant ainsi à la discuter dans son contexte.

Dès l'ouverture, G.L. Drucker (dont le Directeur de thèse fut Seymour Papert, le célèbre cybernéticien piagétien) nous précise qu'il intitule son approche "constructiviste" parce qu'il veut emprunter la "posture théorique de J. Piaget" dans le champ du développement cognitif du nourrisson et de l'enfant pour modéliser les comportements d'une intelligence en train d'apprendre empiriquement et d'inventer des concepts : ses références au constructivisme piagétien seront donc quasi exclusivement celles qu'inspirent le psychologue "clinicien" des années trente ("La naissance de l'intelligence chez l'enfant "; 1936, "La construction du réel chez l'enfant", 1937, "La genèse du nombre chez l'enfant", 1940), et peu ou pas celles qui inspirent l'épistémologue des années soixante et soixante dix : la continuité entre les deux est certes manifeste mais il n'est pas inutile de souligner que "le constructivisme" (doctrine épistémologique en "isme", dont la variante "dialectique" sera "L'épistémologie génétique", 1970, que priviligiera toujours J. Piaget) ne constituait pas une référence conceptuelle explicite dans les premières grandes oeuvres du psychologue du développement cognitif (à la différence de la célèbre dialectique de "l'assimilation-accomodation" des schèmes mentaux que G. Drescher ne cherchera pas en revanche à interpréter).

On peut dès lors craindre que ce manque d'assurance épistémologique initial ne compromette la solidité de l'édifice informatique que va construire l'auteur sous le nom du "Mécanisme des Schèmes" ("Schema Mechanism") : l'argument général est celui d'une "machine" fonctionnant selon les six "stades" du développement cognitif proposés par J. Piaget en 1936, capable donc de construire des "schèmes sensorimoteurs" pour son activité-même, et de les manipuler selon des quasi-règles de type "génétique" (au sens où l'on parle d'un algorithme génétique, m'a-t-il semblé) afin de permettre à cette "Machine de Drescher" d'apprendre par essais erreur et de reconnaître à l'occasion ce qu'elle vient d'inventer. On n'entrera pas ici dans la discussion vite technique (et incomplètement informée dans l'ouvrage) de la faisabilité et des performances observées et escomptées d'une telle Machine, sinon pour se féliciter que des voies nouvelles de modélisation des processus cognitifs soient en exploration : I'intelligence se construit dans ces tâtonnements !

Quelles qu'en soient les issues, la réflexion finale proposée par l'auteur pour "positionner" sa problématique par rapport aux voies "concurrentes" que l'on observe aujourd'hui en Intelligence Artificielle, retiendra certainement l'attention, même si les interprétations qu'il propose sembleront souvent discutables : les écoles de "l'action située" (ou de l'énaction), qu'il différencie des écoles "connexionistes" (réseaux neuronaux) ; I'école de l'exploration heuristique ("search" : le système SOAR, d'A. Newell) ; les écoles de l'apprentissage empirique ("case based") et rationel ; l'école de "l'auto-entretien" (type EURISKO), l'école de "la Société de l'esprit" (M. Minsky) et les écoles de l' "apprentissage sensori-moteur" (d'inspiration piagétienne ou darwinienne). Je crois pour ma part qu'il néglige trop les écoles "computo-symboliques" (ignorant même les nombreux travaux sur les processus cognitifs d'invention développés par H.A. Simon et ses collègues), et qu'il privilégie trop une lecture classiquement "cybernétique" de l'Intelligence (qui est celle de son maître, S. Papert), aux dépends d'une lecture systémique, plus ouverte, plus "récursive" et plus heuristique (en un mot : plus complexe !) telle que celle développée par H. Simon et A. Newell (ou J. Pitrat en France). Mais de telles discussions doivent s'entendre pour contribuer à de nouveaux développements et non pour récuser les efforts d'explorateurs de voies nouvelles. Peut-être G. Drescher aurait-il été plus avant s'il avait mieux assuré ses bases épistémologiques en lisant les grands textes épistémologiques de J. Piaget ou de H.A. Simon ? Mais il nous apporte au moins la preuve que les hypothèses ontologiques et déterministes que les connexionistes croient devoir imposer ne sont a priori pas nécessaires à nos entreprises modélisatrices de l'action intelligente ; en s'appuyant, fut-ce implicitement, sur les hypothèses interactionistes et téléologiques sous-jacentes aux constructivismes, il nous montre que l'on peut a priori progresser au moins aussi... intelligemment. Cet argument de "faisabilité" n'est-il pas bienvenu ?

J.L. Le Moigne.