Les Institutions de la sagesse collective

Plutôt que d’offrir une théorie de la sagesse collective, Adrian Vermeule examine ici ses implications institutionnelles. L’enjeu principal est, selon lui, de parvenir à agréger les jugements autant que les préférences au sein des institutions. Cet article, traduit par Solange Chavel, a été initialement publié dans le dossier “Sagesse collective”, Raison publique, n°12, 2010.

Ces dernières années ont vu paraître un grand nombre de travaux sur la sagesse et la folie des foules, sur les mécanismes de l’agrégation du jugement, sur les débats à plusieurs voix en théorie juridique et politique. Il faut désormais traduire ces idées au niveau des institutions : c’est ce que je me propose de faire ici. Après avoir clarifié les questions conceptuelles et les mécanismes de la sagesse collective, je dessinerai un cadre qui permettra d’en tirer profit au niveau institutionnel, en examinant les équilibres et variables institutionnels les plus importants.

Mon but est d’examiner les implications institutionnelles de la sagesse collective, et non la solidité intrinsèque des mécanismes qui l’engendrent. Ces mécanismes appellent à mon avis une forme de scepticisme ; ils sont dans certains cas tout à la fois mal définis et fragiles, et ne sont valides que dans des conditions très étroites1. Rien dans cet essai ne concerne la validité de cette thèse, que je mets entre parenthèses autant que possible. Ma question est autre : comment organiser, à partir des conditions rendant possible son émergence, les institutions qui engendrent la sagesse collective ? Et comment en tirer profit ?

La première section évalue différentes conceptions concurrentes de la sagesse, et de la sagesse collective. Je défends une approche réductionniste qui assimile la sagesse à la justesse épistémique, et la sagesse collective à la justesse épistémique collective. La deuxième section expose les mécanismes essentiels de la sagesse collective. La troisième section demande comment l’autorité législatrice doit être répartie entre les institutions, et comment ces institutions doivent être constituées, si le but social est de maximiser strictement la qualité épistémique de la prise de décision du gouvernement. Des considérations épistémiques suggèrent à mon avis de transférer cette autorité législatrice des Cours vers les parlements ; ces considérations permettent d’esquisser des réformes des tribunaux, avec par exemple la désignation de Juges de la Cour Suprême qui ne soient pas juristes de profession ; elles plaident aussi en faveur d’un accroissement du nombre des sièges au Parlement. La quatrième section demande comment la sagesse collective peut être non pas maximisée mais optimisée. J’examine comment doit s’établir le compromis de la sagesse collective et d’autres valeurs welfaristes, comme les coûts de la prise de décision, l’agrégation des préférences, et la légitimité perçue du système juridique.

Sagesse et sagesse collective

Question préliminaire : qu’est-ce que la sagesse ? Dans ce que je désigne comme la conception de référence, la sagesse est simplement synonyme de la justesse épistémique du jugement, ou de la capacité à atteindre la vérité ; la « sagesse des foules » est la justesse épistémique des foules. Différentes conceptions alternatives de la sagesse collective rejettent cependant ce point de vue. Je vais analyser ces conceptions rivales et suggérer qu’elles sont plus problématiques encore que la conception de référence. Faute de mieux, c’est donc cette dernière qui prévaut. Pour des raisons pragmatiques, c’est à mes yeux la conception qui nous permet le mieux d’analyser des questions de construction institutionnelle.

Chacune de ces conceptions se compose de deux parties : une description de la sagesse individuelle, et une description de la sagesse collective. La question reste ouverte de savoir si la version collective s’ensuit logiquement de la version individuelle. Comme nous le verrons, certaines conceptions de la sagesse au niveau des individus ne peuvent pas être traduites au niveau collectif sans provoquer une erreur de composition.

La conception de référence

Dans la conception la plus simple, la sagesse n’est qu’un autre nom du jugement, et le jugement consiste à accorder à tous les facteurs leur juste poids2 pour atteindre des conclusions épistémiquement correctes. La sagesse, autrement dit, est un jugement qui recherche la vérité. Cette conception est tout à fait agnostique quant au contenu des vérités pertinentes. Celles-ci peuvent être factuelles, causales, morales ou juridiques. Il est vrai que dans chacun de ces domaines, certains nient qu’il existe quelque vérité que ce soit. Certains postmodernes et défenseurs du « programme fort » de la sociologie des sciences semblent parfois nier qu’il existe des vérités factuelles ou causales, alors que les sceptiques moraux et juridiques de toutes sortes nient l’existence de vérités morales ou légales. Ces controverses affectent la taille du domaine au sein duquel la justesse épistémique peut être atteinte, mais ils ne remettent pas en cause la conception de référence elle-même. Quelles que soient les vérités en présence, une procédure de décision qui les recherche est juste dans cette mesure.

Dans cette description, une institution donnée peut avoir plus d’une fonction. Un parlement, par exemple, procède à la fois à un travail épistémique d’agrégation de jugements sur un fait objectif, et à un travail non épistémique d’agrégation de préférences. Il en résulte une question difficile de construction institutionnelle. Si une institution a à la fois des tâches épistémiques et non épistémiques, sa structure ne peut être choisie de manière à maximiser strictement une tâche ou l’autre ; le but doit être de trouver une combinaison optimale. Dans la troisième section, je mets cette question entre parenthèses en supposant que la tâche est seulement de maximiser le résultat épistémique, mais je propose quelques remarques pour la mise en place d’institutions multiformes dans la quatrième section. Si l’on définit la sagesse comme un jugement qui recherche le vrai, on confond sagesse et justesse. L’implication, que certains trouveront dérangeante, est qu’un algorithme peut être sage, parce qu’il donne à tous les facteurs de décision leur juste poids et produit donc des jugements très exacts3. Comme nous le verrons, d’autres conceptions de la sagesse soutiennent que celle-ci implique davantage qu’un jugement correct. Mais ces autres conceptions ne s’entendent pas sur la nature de cet élément supplémentaire. Alliées pour rejeter la conception de référence, elles s’affrontent sur son substitut.

Un avantage de la conception de référence est qu’elle se transpose directement du niveau individuel au niveau du groupe ; la sagesse collective est simplement la capacité épistémique collective à trouver la vérité4. Nous examinerons différents mécanismes qui permettent à un groupe de rechercher la vérité avec plus ou moins de succès que les individus qui le composent ; mais le passage au niveau collectif ne pose pas de problème conceptuel. Ce n’est pas le cas pour d’autres conceptions.

La sagesse comme rationalité impartiale

Jon Elster propose une conception de la sagesse collective qui articule deux éléments : (1) impartialité et (2) formation rationnelle de la croyance. Cette conception traite la sagesse individuelle comme un synonyme de la « raison » des moralistes français et de Hume. En ce sens, la raison s’oppose à la fois à l’intérêt et à la passion. De même, la sagesse collective décrit une prise de décision à la fois politiquement impartiale, dans le sens où elle prend en compte tous les intérêts en cause, et également rationnelle, dans le sens où les décideurs ne prennent pas leurs souhaits pour des réalités ou ne sont pas sujets à d’autres influences émotionnelles sur la cognition5.

Ce portrait d’un décideur à la fois bienveillant et rationnel est séduisant, et il saisit indubitablement la conception de la raison propre aux moralistes. Mais il se pourrait qu’il en demande trop à l’idée de sagesse, au moins en ce qui concerne les institutions. Elster en appelle implicitement à l’idée d’une unité des vertus, l’idée étant qu’un décideur sage ne doit pas seulement être rationnel, mais également motivé par l’intérêt commun. Mais pourquoi ajouter cette dernière précision ? On peut sans aucun doute qualifier de sage le chef d’un groupe criminel, même si sa sagesse est mise au service d’un groupe privé intéressé. Même si la sagesse est davantage ou autre chose que la recherche de la vérité, elle n’est pas nécessairement dirigée vers des fins publiques.

La sagesse comme vérité + cohérence

Christian List admet que la recherche de la vérité (ce qu’il appelle « correspondance ») est un élément de la sagesse, mais il y ajoute la « cohérence ». Il ne s’agit pas de conditions nécessaires de la sagesse, mais de deux desiderata distincts qui interagissent de manière complexe et peuvent se faire des concessions mutuelles l’une à l’autre. Les compromis peuvent être illustrés par la référence au « paradoxe doctrinal », lorsqu’une cour de justice composée de plusieurs membres doit voter sur un ensemble de propositions interdépendantes. Une majorité vote que p est vrai, une autre majorité vote que si p est vrai, alors q est vrai ; et pourtant une autre majorité encore vote que q est faux, alors que la vérité de q dépend des votes majoritaires précédents. Ce résultat, qui est incohérent à l’échelle du groupe, peut être évité en votant sur le jugement final ou sur la conclusion plutôt que sur chacune des propositions interconnectées. En votant seulement sur les conclusions, plutôt que sur les prémisses, on s’accorde avec la théorie du « minimalisme » judicatif6, qui engendre un consensus en permettant aux juges d’atteindre des « accords incomplètement théorisés »7. Mais comme le montre List, le vote sur les propositions antécédentes a des vertus épistémiques importantes ; par rapport au vote fondé sur des conclusions, elle améliore à la fois la fiabilité positive, ou la chance d’atteindre la vérité, et la fiabilité négative, c’est-à-dire la possibilité d’éviter l’erreur.

List n’explique cependant pas pourquoi la cohérence devrait être un élément de la sagesse collective. Pourquoi la cohérence à l’échelle du groupe est-elle une valeur8 ? Même si la cohérence est une propriété appréciable des jugements individuels, il n’est pas évident qu’il en aille de même pour les jugements collectifs. Si une cour composée de plusieurs membres était une personne, comme Hercule, le juge mythique de Ronald Dworkin9, cette structure de jugement qui produit le paradoxe doctrinal poserait un sérieux problème de cohérence. Mais une cour n’est pas une personne ; pourquoi devrait-on se préoccuper de la cohérence de ses jugements ?

Il existe plusieurs réponses, donc aucune n’est tout à fait satisfaisante. Premièrement, on peut supposer un lien entre la cohérence et la certitude juridique, ce qui est incontestablement un bénéfice systématique. L’intuition est que les parties qui doivent mettre en œuvre et appliquer les directives de la cour, ou prévoir les décisions futures de la cour, ont tout intérêt à disposer d’une théorie cohérente du comportement du groupe. Pourtant, la connexion entre cohérence et certitude est au mieux extrêmement contingente. La certitude résulte de l’étendue des conclusions de la cour, non de la profondeur théorique de ses prémisses. Dans un système de vote fondé sur les conclusions, l’éventail des règles décidées par la cour peut être extrêmement large, et permettre de prédire de nombreuses questions. Inversement, dans un système de vote fondé sur les prémisses, les conceptions très cohérentes de la cour peuvent être délimitées de manière étroite et laisser ouvertes de nombreuses questions, ce qui produit une grande incertitude.

Deuxièmement, supposons que la cour appartienne à une société où de nombreux citoyens considèrent « la Cour » comme une entité personnifiée. Même si cette opinion est irrationnelle, l’incohérence des jugements collectifs de la cour peut la discréditer, voire remettre en question sa légitimité sociologique. Mais cette possibilité semble tout à fait théorique. Cela suppose un public qui non seulement observe les jugements et s’en soucie, plutôt que des simples résultats, mais encore qui observe le schéma collectif de jugements sur un ensemble de propositions ou de cas. Comme l’explique List, plus cet ensemble de cas et de proposition croît, plus ces possibilités deviennent improbables.

Enfin, Ronald Dworkin est opposé aux systèmes des règles juridiques qui traitent des événements légaux similaires sur des fondements différents : il les accuse de manquer d’intégrité, c’est-à-dire qu’il « n’y a pas d’agent moral rationnel individuel dont le point de vue moral pourrait justifier l’ensemble entier des prescriptions considérées »10. L’avortement ne peut pas être possible seulement pour les femmes nées les jours pairs. Cependant, même si l’objection de Dworkin est correcte, elle n’est pas nécessairement liée au problème de la cohérence comme tel. L’objection touche plutôt le fait que, dans de tels systèmes juridiques, la règle juridique particulière en cause n’a pas de fondement rationnel concevable11. Même si Dworkin fait référence à un « ensemble de prescriptions », cette critique peut être formulée contre une règle singulière, et elle ne surgit pas seulement à propos de jugements interdépendants. La forme d’incohérence de groupe que discute List, au contraire, présuppose un ensemble connecté de propositions. Dworkin et List parlent de choses différentes.

Il n’est donc pas évident que la cohérence de groupe soit même désirable. Pour appliquer à tout le problème les termes de Dworkin, il se peut qu’il n’existe pas d’agent singulier possible dont le point de vue moral puisse justifier l’ensemble des règles ; mais si nous parlons d’un corps composé de plusieurs membres, en quoi serait-ce un problème ? Faute de meilleure réponse à cette question, la cohérence d’un ensemble de propositions n’est pas un élément de la sagesse collective, et il nous reste comme unique desideratum la correspondance, ou la tendance à chercher la vérité de la conclusion pragmatique du décideur collectif. Supposons que dans une cour composée de trois membres, une majorité vote qu’il existait un contrat, une autre majorité vote que s’il y avait un contrat alors il a été rompu et qu’une autre majorité vote que le contrat n’a pas été rompu, alors le défenseur gagne. D’un point de vue épistémique, nous ne devrions nous préoccuper que d’une seule chose : s’il existe une bonne réponse, le groupe doit la trouver. Si c’est le cas, il est inutile de demander davantage12.

La sagesse comme expérience

Les admirateurs de Burke défendent une conception de la sagesse comme expérience vécue. C’est une conception qui permet de mieux capturer l’usage ordinaire. Cela explique pourquoi, pour les individus, la sagesse est souvent associée à l’âge. D’après cette conception, la sagesse est davantage que la justesse épistémique ; un algorithme peut être juste, mais il ne peut être sage.

Des problèmes surgissent cependant lorsque la sagesse comme expérience vécue est transposée à l’échelon collectif. Quel est donc l’analogue collectif de la sagesse individuelle ? Les Burkéens ont tendance à supposer que cet analogue est la tradition : règles, normes, pratiques qui ont résisté à l’épreuve du temps. Mais, comme le soulignent Pascal et Bentham, cette idée repose sur une erreur de composition13. Dans le cas individuel, ceux qui sont nés plus tôt ont vécu plus longtemps et sont donc plus sages que les jeunes, tandis que dans le cas collectif, les générations nées plus tôt sont les générations de l’enfance de l’homme. L’expérience vécue favorise les générations les « plus jeunes » ou les plus récentes, qui ont accumulé plus de connaissance que les générations passées. Selon l’expression de Bentham, la « sagesse des ancêtres » est en fait la « sagesse du berceau »14.

Pragmatique

Je choisis la conception de référence pour des raisons pragmatiques. Les questions qui entourent le concept de sagesse et ses conceptions concurrentes, à la fois dans le cas individuel et collectif, sont multiples et complexes. La conception de référence est extrêmement simple ; elle ne rend pas compte des dimensions variées de la sagesse. Mais cette simplicité est également son principal atout. Presque tout le monde s’accorde à reconnaître que la justesse épistémique est au moins une partie de la sagesse. Et les conceptions rivales de la sagesse n’arrivent pas à se mettre d’accord sur l’élément qu’il convient d’ajouter. La multiplicité même des propositions (impartialité, cohérence théorique, expérience vécue, etc.) suggère qu’il vaut mieux prendre le plus petit dénominateur commun pour établir un discours qui intéresse chacune des parties, même s’il ne les satisfait pas entièrement. Enfin, la justesse épistémique passe directement de l’échelle individuelle à l’échelle collective, propriété qu’elle partage avec la sagesse comme rationalité impartiale, mais que les autres conceptions de la sagesse ne possèdent pas.

Mécanismes de la sagesse collective

Supposons que la sagesse se définisse comme justesse épistémique. Comment la prise de décision collective se rapporte-t-elle à la prise de décision individuelle ? Je présente une liste brève et sélective des mécanismes de la sagesse collective. Brève parce que la plupart de ces mécanismes sont bien connus, comme le théorème du jury de Condorcet ; sélective parce que je ne retiens que les mécanismes qui présentent des implications intéressantes pour la constitution des institutions et qui sont pertinents pour le propos des troisième et quatrième sections.

Agrégation statistique15

Les mécanismes de sagesse collective les plus connus reposent sur le principe statistique connu sous le nom de Loi des grands nombres. Lorsque la taille du groupe s’accroît, la fréquence espérée d’un événement et sa fréquence réelle convergent ; il devient de moins en moins probable que, par hasard, les résultats réels s’écartent des résultats espérés. Si une pièce a 0,6 chance de tomber sur face, il est possible que nous ayons plus de pile que de face après dix lancers, mais cela devient extrêmement improbable après mille lancers16.

La Loi des grands nombres est au fondement du théorème du jury de Condorcet. Le théorème établit, sous sa forme la plus simple, que lorsqu’un groupe vote sur un choix binaire, lorsqu’un des deux choix est vrai, et que les membres du groupe ont une chance même très faible d’avoir raison plutôt que tort, alors, lorsque le nombre des membres du groupe augmente, la probabilité qu’un vote majoritaire17 du groupe soit correct s’accroît. Sous certaines conditions, la probabilité que le groupe ait raison dépassera nécessairement celle d’un membre pris au hasard et pourrait même dépasser celle de son meilleur membre ; d’où l’association avec la sagesse collective.

Les conditions principales de cette définition sont que les électeurs traitent d’une question commune, votent sincèrement, sont plus susceptibles d’avoir raison que tort, et votent de manière indépendante. La première condition établit que les électeurs traitent tous de la même question ; la deuxième qu’ils cherchent à trouver la bonne réponse ; la troisième que les électeurs font mieux que le hasard ; la quatrième dit que les votes des électeurs sont statistiquement indépendants les uns des autres, même s’il n’est pas nécessaire qu’ils le soient causalement18. Cette dernière condition est cruciale ; elle suppose que la diversité épistémique est une compétence importante19. Sous des conditions raisonnables, la chance qu’une majorité désigne la bonne réponse varie en sens inverse de la corrélation des biais au sein du groupe décideur20. Lorsque les électeurs du groupe ont des biais qui ne sont pas corrélés, ou qui sont corrélés négativement, leurs erreurs vont vraisemblablement s’annuler réciproquement, et permettre l’expression du vote correct. En revanche, si les biais des électeurs sont corrélés, alors le « miracle de l’agrégation » risque de ne pas se produire21.

Le théorème peut être prolongé dans différentes directions. La condition de compétence peut être assouplie, pour se limiter à exiger que la compétence moyenne soit meilleure que le hasard22. L’ensemble des réponses possibles peut s’étendre à plus de deux, et dans ce cas c’est la réponse qui réunit le plus de votes qui sera vraisemblablement correcte (même si elle n’est pas nécessairement plus susceptible d’être correcte que toutes les réponses incorrectes combinées)23. On a enfin étendu le théorème pour montrer que, lorsque chaque électeur se demande simplement quel choix collectif est le plus à même de promouvoir son intérêt personnel, et réussit à faire cela mieux que le hasard, alors, plus le groupe est nombreux, plus la majorité est susceptible de choisir correctement l’option qui maximise effectivement les préférences de la majorité. Dans cet élargissement, il n’y a plus de question commune : chaque électeur se demande quelle option lui profite, et cette question peut recevoir différentes réponses selon les gens. La réponse n’est « correcte » qu’à la lumière des préférences des électeurs, et pas dans l’absolu.

On dit souvent que le théorème du jury exige une réponse correcte exogène, ce que semble contredire le dernier élargissement décrit. Mais la question est sémantique et non substantielle. La loi des grands nombres qui sous-tend le théorème du jury permet l’interprétation en termes de préférences ; plus le groupe est nombreux, moins il est plausible que la majorité vote par erreur contre ses intérêts. Il est possible de restreindre le nom de « théorème du jury de Condorcet » aux cas qui comportent des réponses correctes exogènes, mais rien dans la nature du mécanisme ne l’exige.

Agrégation des perspectives

Un autre type de modèles repose sur l’agrégation de perspectives différentes24. Ces modèles ne sont pas condorcétiens. Le cas ressemble davantage aux situations où chaque individu possède un signal imparfait sur la réponse correcte à une question commune : par exemple lorsque chaque membre de la foule doit deviner le nombre de haricots que contient une urne. Chaque individu possède une information à propos d’une partie de la réponse à la question, comme dans l’histoire des aveugles et de l’éléphant. Aucun des aveugles n’est capable de déduire la forme de l’éléphant complet en touchant simplement les jambes ou la trompe ; c’est pourquoi l’un pense que l’éléphant est un arbre, l’autre un serpent, etc. Pour parvenir à la vérité, les aveugles doivent faire une synthèse de leurs différentes perspectives.

En dépit de cette différence, l’agrégation perspective et l’agrégation statistique ont une propriété essentielle en commun. Dans chaque cas, les déterminants majeurs de la performance épistémique du groupe sont le nombre, la compétence (moyenne) et la diversité25. La compétence est une propriété des individus, mais la diversité est une propriété émergente du groupe. Le nombre restant constant, un groupe sera plus à même de voter pour la bonne réponse ou d’atteindre une synthèse pertinente des perspectives si les membres possèdent plus d’informations ou ont des perspectives plus variées. Le type pertinent de diversité est cognitive, mais la diversité cognitive peut être corrélée avec la diversité selon d’autres variables, comme la race, la classe ou la profession

Agrégation et évolution

Les mécanismes de sagesse collective cités ci-dessus ont deux caractéristiques principales : (1) ce sont des mécanismes intentionnels par lesquels chaque participant cherche à produire la décision collective correcte ; (2) ce sont des mécanismes synchrones par lesquels le groupe entier prend ses décisions à un instant donné. Chacune de ces deux conditions peut être assouplie. L’agrégation non intentionnelle synchrone, qui assouplit la première condition, est illustrée par le modèle économique néoclassique d’un marché parfait qui atteint instantanément l’équilibre, où tous les marchés qui améliorent l’optimum de Pareto sont effectués dans des transactions décentralisées. L’agrégation intentionnelle diachronique, qui assouplit la deuxième condition, implique des décideurs qui s’appuient délibérément sur l’information incorporée dans les décisions passées. Un exemple est la pratique judiciaire du précédent, que j’étudie dans la troisième section.

Les modèles évolutionnaires vont plus loin en relâchant les deux conditions à la fois. Ils sont nécessairement diachroniques ; plutôt que de comparer une foule qui vote simultanément à l’instant t à un individu à l’instant t, ils comparent le résultat d’une séquence de décisions avec le résultat obtenu par un individu qui prend une décision unique à un temps donné dans la séquence. De plus, ils ne présupposent pas que les membres du groupe cherchent intentionnellement une décision collective exacte. Ils offrent plutôt des mécanismes de main invisible26, où la sagesse collective surgit comme « le résultat de l’action humaine, mais pas de l’exécution d’un quelconque dessein humain »27.

Ainsi, un modèle évolutionnaire standard de loi et d’économie décrit les conditions sous lesquelles la common law évolue de manière efficace. C’est un modèle de main invisible, où le processus d’adjudication produit des règles efficaces même si telle n’est pas l’intention des juges individuels. Le mécanisme est, grossièrement, le suivant : lorsque des plaideurs potentiels décident soit de trancher le cas soit de remettre en question les précédents, et lorsque les enjeux sont équilibrés, les précédents qui imposent des pertes sèches seront plus souvent remis en question et seront donc plus facilement modifiés, ce qui fait évoluer la common law vers l’efficacité28. Mais rien dans ce modèle n’est spécifique à la common law. Un modèle de structure analogue montre les conditions sous lesquelles la législation évoluera vers l’efficacité, tandis que les groupes d’intérêts poussent les parlementaires à modifier les règles qui imposent des pertes sèches29. Inversement, la législation comme la common law seront inefficaces si les enjeux ne sont pas distribués symétriquement entre les groupes. Dans un tel cas, les groupes qui recherchent des rentes influencent les législateurs de manière à obtenir des bénéfices concentrés, tout en imposant de larges coûts diffus aux autres. La conséquence en est une perte de bien-être, mais c’est aussi le cas des litiges qui visent à l’obtention de rentes par le biais des tribunaux30.

La relation d’efficacité à la sagesse ou à la sagesse collective est simplement que les processus d’évolution légale par main invisible, lorsqu’ils se produisent, peuvent aider le système juridique à identifier avec précision les règles efficaces, même si aucun acteur dans le système n’a d’information suffisante pour le faire de manière indépendante. Le mécanisme de main invisible se substitue à l’action intentionnelle dirigée vers l’efficacité de la part des juges ; même si les juges n’ont pas l’information nécessaire pour produire des règles efficaces, ces règles émergent spontanément, tout comme, dans la perspective de Hayek, les mécanismes de la main invisible dans les marchés économiques explicites agrègent les informations dispersées sur la production et l’échange optimaux, information qui s’incarne dans les prix31.

Plus récemment, les économistes Nicola Gennaioli et Andrei Shleifer32 ont étudié des modèles évolutionnaires hybrides où la common law converge vers des règles qui sont efficaces en termes d’information, c’est-à-dire qu’elles incorporent toute l’information disponible. Dans le modèle de base, la common law évolue parce que les précédents sont évalués et distingués par des juges politiquement orientés, qui sont contraints de n’utiliser que des distinctions juridiquement pertinentes ; si un précédent établit que tous les chiens doivent être tenus en laisse, les juges peuvent établir que seuls les chiens susceptibles de mordre doivent l’être, mais ils ne peuvent pas établir que les chiens ne doivent être tenus en laisse que le mardi. Sous certaines conditions, le processus de distinction produit des règles qui incorporent toute l’information dont disposent les juges, même si aucun juge n’a la motivation d’adopter ces règles. Au contraire, lorsque les juges ont le droit de passer outre les cas plutôt que de distinguer entre eux, la common law risque de vaciller entre des vues opposées sans atteindre de convergence stable, et encore moins efficace du point de vue de l’information.

Délibération

Comment ces mécanismes s’articulent-ils aux processus de la délibération de groupe ? Les relations sont contingentes et causales, et non analytiques. Rien dans l’agrégation statistique, dans l’agrégation perspective ou dans l’agrégation évolutionnaire n’exige que la délibération ne les mette en œuvre. Selon les contextes, la délibération peut promouvoir ou faire obstacle à l’opération de ces mécanismes.

D’après les modèles de l’agrégation évolutionnaire esquissés ci-dessus, la délibération est d’ordinaire sans pertinence a priori. Les agents sont des boîtes noires qui réagissent mécaniquement aux décisions des autres, comme lorsque les juges des modèles classiques de droit et d’économie sont conçus sur le modèle d’algorithmes qui annulent les décisions avec une probabilité donnée. La délibération pourrait être construite dans de semblables modèles, mais on ne voit pas bien pour quelle raison ; tout l’intérêt de ces modèles est de montrer que les processus de main invisible peuvent produire de l’efficacité ou une information complète sans que les agents ne le fassent intentionnellement33.

Qu’en est-il de l’agrégation statistique et perspective ? On a pensé pendant un certain temps que la délibération empêcherait nécessairement l’opération du théorème du jury en produisant des biais corrélés et en compromettant l’hypothèse d’indépendance34. Dans ce cas, une procédure d’agrégation idéale devrait empêcher la discussion entre les électeurs avant le vote, comme le suggérait Rousseau35. Mais le théorème n’exige qu’une indépendance statistique, pas une indépendance causale36. L’opinion de certains électeurs peut être causalement influencée par l’opinion d’autres électeurs ; aussi longtemps que la corrélation positive n’est pas trop élevée (aussi longtemps que la délibération ne crée pas trop de pensée de groupe) l’agrégation statistique peut fonctionner, selon le degré précis de corrélation, la taille et la compétence du groupe. La leçon à tirer pour la mise en place d’institutions n’est pas que la délibération doit être bannie, mais que le groupe et ses procédures doivent être structurés de manière à préserver la diversité épistémique.

Même si la délibération ne mine pas nécessairement l’opération de l’agrégation statistique, pour la même raison elle n’est pas indispensable au mécanisme ; des groupes purement notionnels peuvent avoir d’assez bons résultats d’un point de vue condorcétien. La délibération n’est pas non plus nécessaire pour l’opération de l’agrégation perspective. Prenons l’idée aristotélicienne de la « sagesse de la multitude »37 d’après laquelle « la multitude est meilleur juge des œuvres de la musique et de celles des poètes ; les uns apprécient une partie, les autres une autre, et tous apprécient le tout »38. Bien que certains théoriciens semblent penser que cette idée a une connexion nécessaire avec la délibération39, ce n’est pas le cas. L’agrégation perspective peut avoir lieu si chaque participant révèle de manière unilatérale une partie de l’information dispersée dans le groupe, sans qu’une discussion n’ait lieu40. On peut bien sûr définir la délibération de manière suffisamment large pour englober ce cas, mais le bénéfice est maigre. En un mot, les différents mécanismes d’agrégation peuvent être ou non articulés avec la délibération, de différentes manières. Les b&énéfices et les coûts de la délibération, et leur interaction avec les mécanismes pertinents, sont des question contextuelles sur lesquelles il est difficile de se prononcer en général. Dans ce qui suit, je suppose généralement pour des raisons de simplicité que les agents ne délibèrent pas à moins que cela n’affecte l’analyse dans un contexte précis.

Maximiser la sagesse collective

Comment tirer profit de la conception de référence de la sagesse collective et des mécanismes qui la produisent pour mettre en place des institutions juridiques et répartir l’autorité juridique entre ces institutions ? En supposant que le but est de maximiser la qualité épistémique des lois (maximiser la mesure dans laquelle les lois dépendent de vérités, d’ordre factuel, causal, moral ou légal), comment doit-on structurer la formation des lois ? (La quatrième section assouplit cette hypothèse et examine les arbitrages possibles entre qualité épistémique et autres valeurs).

Je vais aborder les trois questions suivantes qui intéressent les juristes, en me concentrant sur le cas américain, pour minimiser mes propres erreurs. J’espère qu’au moins une partie de l’analyse peut être transposée mutatis mutandis à d’autres contextes.

(1) Étant données les institutions actuelles, comment devrait être répartie l’autorité de développer la common law constitutionnelle entre les Cours d’un côté et le processus de création de lois exécutif et législatif d’autre part ?

(2) Comment la Cour Suprême devrait-elle être organisée afin de maximiser la qualité épistémique de ses décisions ?

(3) Comment le Congrès devrait-il être organisé pour maximiser la qualité épistémique de ses décisions ?

Mes conclusions sont, grossièrement parlant, benthamiennes. Pour la première question, je suggère que la maximisation de la qualité épistémique exige une large réattribution de l’autorité juridique des Cours vers les parlements. Plus spécifiquement, les Cours devraient s’en remettre aux efforts du Congrès pour fixer légalement la signification des clauses constitutionnelles vagues, ambiguës ou programmatiques. Le régime qui en résulte est le suivant : les Cours délèguent, et les parlements obéissent au constitutionnalisme de common law. Quant à la deuxième question, je suggère qu’il faudrait désigner comme juges de la Cour Suprême au moins quelques non-juristes. Pour la troisième question, je suggère de manière très hypothétique que les membres du Congrès devraient être plus nombreux, légalement, pour atteindre la proportion de représentants qui prévaut dans les autres démocraties libérales.

Il faut garder à l’esprit quatre précisions tout au long de l’analyse. Premièrement, pour isoler les questions épistémiques, je suppose que tous les agents concernés cherchent la vérité de bonne foi ; par exemple, je suppose que les législateurs comme les juges cherchent en toute bonne foi à déterminer la constitutionalité des lois proposées ou existantes, en fonction de la théorie de la constitution qui est à la leur. Si j’assouplis cette hypothèse, c’est seulement pour durcir le jeu contre les thèses que j’essaie de défendre.

Deuxièmement, mon analyse n’aborde qu’un nombre limité de questions pertinentes ; même si je les discute pour illustrer le type d’analyse institutionnelle qui peut être menée au sein d’un cadre épistémique, je ne peux pas entreprendre l’ensemble du projet ici. Je vais par exemple demander quelle est la composition optimale de la Cour suprême du point de vue épistémique, sa taille restant fixe ; je vais au contraire demander quelle devrait être la taille du Congrès. Ces choix sont en partie arbitraires, mais je crois que les questions que je pose sont plus réalistes que de demander par exemple si une Cour de 100 membres serait une bonne chose. En tout cas, il est impossible d’éviter un certain degré d’arbitraire parce qu’on ne peut pas examiner toutes les variables en même temps ; il faut tenir constantes certaines propriétés des institutions pour étudier les autres.

Troisièmement, j’ignore dans cette section la présidence, sauf dans la mesure où le Président est le Législateur-en-Chef et participe donc au processus législatif. Les arguments principaux en faveur d’une autorité présidentielle unilatérale, sans partage avec le Congrès, ne sont pas épistémiques ; ils impliquent des biens concurrents comme la rapidité d’action. J’aborderai les compromis qui en résultent dans la quatrième section.

Enfin, plus largement, les tâches de mise en place des institutions et d’allocation de l’autorité législative devraient en principe être menées de front. Les conclusions sur un point doivent être ajustées de manière à atteindre une forme d’équilibre réfléchi, dans lequel les institutions sont dessinées de manière épistémiquement optimale, étant donné l’allocation de l’autorité législatrice, et où l’autorité est ajustée de manière épistémiquement optimale, étant donné les institutions. En fait, on est bien contraint de discuter ces questions l’une après l’autre, de manière partielle plutôt que globale, comme je vais le faire ici. Mais, à la fin de la discussion, j’examinerai rapidement certaines interactions entre les éléments distincts de l’analyse.

Common-Law Constitutionalism

Le constitutionnalisme de common law recouvre un ensemble de conceptions plutôt qu’une position nettement définie. Pour mon projet, une définition grossière mais suffisante pourrait être : le constitutionnalisme de common law soutient que la loi constitutionnelle doit être avant tout développée par les précédents juridiques, qui peuvent eux-mêmes s’appuyer sur des traditions sociales plus vastes. Le constitutionnalisme de common law a plusieurs cibles et antonymes. Un antonyme est ainsi l’originarisme, c’est-à-dire l’idée que la source principale de la loi constitutionnelle devrait être la compréhension publique originelle du texte constitutionnel. Un autre antonyme est une forme de perfectionnisme moral, où les juges développent chacun la loi constitutionnelle en fonction de leur compréhension morale. Il y existe une infinité de combinaisons et d’hybridations possibles. La théorie de l’adjudication de Dworkin, qui articule justification morale et cohérence avec le précédent, est un hybride de perfectionnisme est de constitutionnalisme de common law. La théorie d’Anthony Scalia, qui admet le précédent comme une contrainte qui pèse sur la compréhension originelle41, est un hybride de constitutionnalisme de common law et d’originarisme.

On peut donner plusieurs justifications du constitutionnalisme de common law, mais la seule qui soit pertinente pour notre propos est épistémique. La thèse est que le constitutionnalisme de common law incarne une forme latente de sagesse collective. Dans une version néo-burkéenne, les précédents constituent une sagesse collective qui surpasse ce que tout juge individuel pourrait engendrer par son raisonnement moral ; plusieurs têtes juridiques valent mieux qu’une.

Quels sont les mécanismes de la sagesse collective qui soutiennent les arguments épistémiques pour constitutionnalisme de common law ? Les théoriciens sont plutôt vagues sur ce point. On indique parfois les propriétés « évolutionnaires » du constitutionnalisme de common law ; cette idée peut se traduire soit par des modèles d’évolution vers l’efficacité, ou par des modèles d’évolution informationnelle décrits ci-dessus. Plus explicitement, on a pu soutenir que le constitutionnalisme de common law incorpore l’information détenue par de nombreux juges, au cours du temps, d’une manière qui répond au théorème du jury de Condorcet42. Dans cette conception, le précédent incarne l’information des juges passés. En s’appuyant sur cette information, les juges actuels peuvent faire aussi bien qu’un groupe électoral notionnel composé de tous les juges passés et présents qui examinent la question. Il est à mon avis tout à fait contestable que les mécanismes d’agrégation esquissés dans la deuxième section décrivent adéquatement le processus du constitutionnalisme de common law. J’ai discuté longuement de ces questions ailleurs43, et je vais donc m’en tenir à un point essentiel qui touche à la compétence épistémique comparée des institutions : même si le constitutionnalisme de common law incarne une forme de sagesse collective, le même mécanisme suggère que la législation fera aussi bien, voire mieux. De manière frappante, les mécanismes mêmes dont on dit qu’ils engendrent la sagesse latente du constitutionnalisme de common law sont ces mêmes mécanismes que les théoriciens démocratiques ont récemment invoqués à l’appui de la qualité épistémique de la législation44. À mon sens, les théoriciens de la démocratie ont la meilleure part de l’argument. Le constitutionnalisme de common law commet l’erreur de glisser d’une thèse (plusieurs têtes juridiques valent mieux qu’une) à une autre tout à fait différente : plusieurs têtes juridiques valent mieux que plusieurs têtes législatives.

Je commence par le théorème du jury. Dans un cas juridique décisif, imaginons qu’il existe une clause constitutionnelle ambiguë, une lignée de précédents de la Cour Suprême qui interprète la clause comme signifiant plutôt A que B, et une loi récente qui tente de « liquider » l’ambiguïté constitutionnelle en l’interprétant, explicitement ou implicitement, comme signifiant B plutôt que A. Supposons également qu’il existe une réponse correcte exogène à cette question, du point de vue d’un interprète infaillible comme l’Hercule de Dworkin. (Si le théorème du jury s’applique, l’analyse épistémique comparative ne dépend pas du contenu de la réponse pertinente ou de la nature du théorème qui l’engendre.) Quelle conception, juridique ou législative, a le plus de chances d’être correcte ?

La théorie constitutionnelle standard souligne l’expérience légale et l’impartialité politique des juges. La théorie standard dépeint implicitement des législateurs très biaisés et des juges qui le sont relativement peu. Dans un cadre condorcétien, l’expertise et l’impartialité des juges tend à accroître leur compétence moyenne, alors que les liens électoraux soumettent les législateurs à des forces politiques qui compromettent leur performance épistémique.

Même si nous nous concentrons exclusivement sur la compétence – je m’intéresserai dans un instant au nombre et à la diversité – il n’est pas clair que la compétence moyenne des juges dépasse celle des législateurs. Le problème est qu’il existe un compromis entre l’information et les biais : l’isolement politique même qui crée la neutralité juridique et accroît la compétence des juges tend également à priver les juges de certaines informations, et donc à diminuer leur compétence 45. Le système juridique emploie un processus contradictoire structuré par des contraintes strictes sur les contacts ex ante et l’indépendance de l’enquête, et tend à égaliser la production de l’information et ainsi à réduire biais et préjugés, mais au prix d’une moindre information totale. Inversement, l’investigation législative emploie un processus hybride relativement peu structuré, en partie contradictoire et en partie administratif et inquisitorial, qui produit plus d’information au total, au prix de biais et préjugés plus marqués.

Autrement dit, la tâche qui consiste à produire de l’information s’équilibre avec l’efficacité épistémique de son usage. Même si les forces politiques peuvent pousser les législateurs à employer l’information dont ils disposent de manière biaisée, ils peuvent du même coup avoir plus d’informations, de manière à compenser leur inefficacité épistémique. C’est précisément parce qu’ils sont moins isolés que les législateurs sont plus susceptibles de posséder des informations sur des conditions politiques, sociales et économiques changeantes et des valeurs publiques changeantes, qui sont toutes indispensables pour le constitutionnalisme de common law.

Mais pour faire pencher la balance contre la conception que je veux défendre, supposons que la compétence moyenne des juges soit bel et bien supérieure à celle des législateurs. Depuis une perspective condorcétienne, la compétence n’est cependant qu’un facteur et peut tout à fait être compensée par le nombre et la diversité, deux caractéristiques que les Parlements présentent plus que les Cours. La conception traditionnelle indique implicitement un élément du cadre condorcétien, et néglige le fait que d’autres éléments du cadre qui sont également importants pour le fonctionnement du théorème ont une valence très différente.

Effectif et précédent. La conception standard néglige le pouvoir mathématique de l’effectif parlementaire. Supposons que chaque juge ait une chance de 0,75 de trouver la réponse correcte, même dans les cas les plus délicats. Avec une règle de la majorité, la compétence du groupe est considérablement plus élevée et atteint 0,95. Cependant, dans une comparaison institutionnelle, le nombre va l’emporter. Si la compétence moyenne des législateurs est seulement de 0,6 et qu’il y a 201 législateurs – ce qui représente les deux tiers de notre actuelle chambre des représentants – la chance qu’une majorité de législateurs trouve la bonne réponse est extrêmement proche de 145. Les chiffres ne sont donnés qu’à titre d’exemple, mais ils permettent d’illustrer le pouvoir du nombre contre l’expertise des petits groupes.

Le constitutionnalisme de common law objecte que de tels exemples supposent une décision exceptionnelle, alors que la pratique du précédent permet aux juges actuels de s’appuyer sur les informations détenues par les juges du passé, ce qui a pour effet d’élargir l’effectif de la Cour. Les problèmes que pose cette suggestion sont légion ; j’en mentionnerai plusieurs, d’importance croissante. (1) Seule une douzaine de juges, au plus, ont examiné une question donnée, si bien que l’écart entre les effectifs judiciaire et législatif est trop grand pour être comblé par la pratique du précédent. (2) Les législateurs peuvent eux aussi lire les précédents juridiques à la recherche d’informations, ce qui a pour effet d’élargir également l’effectif législatif. (3) Le corps législatif s’appuie parfois lui aussi sur les précédents pour édifier de nouvelles lois, même si le procédé est moins formalisé que dans les Cours. Si le précédent juridique permet des décisions juridiques mieux informées, il en va de même pour les décisions législatives. (4) Si les juges du passé étaient eux-mêmes des constitutionnalistes de common law qui fondent leurs décisions sur le précédent, alors les précédents qu’ils ont engendrés n’étaient pas indépendants dans le sens requis par le théorème du jury ; ils n’ajoutent aucune information nouvelle à la séquence des décisions de la common law. À la limite, seule la première décision d’une série contient de l’information, et tout le reste n’en est que la conséquence46.

De ces quatre points, le dernier est le plus critique. Le paradoxe burkéen montre qu’une stratégie épistémique qui consiste à s’appuyer sur le précédent ou la tradition parce qu’elle incarne la sagesse collective n’est efficace que si les décideurs du passé n’étaient pas eux-mêmes burkéens, et ont donc contribué à l’ajout d’informations indépendantes dans le flux des décisions47. Le paradoxe burkéen est une échelle progressive, pas une question de tout ou rien. Peut-être certains juges, au cours de l’élaboration des précédents ou de la tradition ont-ils apporté des contributions indépendantes et d’autres non, auquel cas la valeur informationnelle de cette tradition doit être ajustée d’autant, mais pas annulée. En outre, les juges individuels peuvent adopter une approche intermédiaire, en accordant une déférence partielle mais pas totale aux conceptions passées. Cela permet d’atténuer le paradoxe, mais en nuançant la portée des bénéfices qu’apporte la tradition.

Il faut cependant remarquer que les points (3) et (4) se compensent l’un l’autre. Dans la mesure où les législatures s’appuient sur leurs propres précédents, elles sont également sujettes au paradoxe burkéen. Dans le contexte juridique comme législatif, il y a compensation : s’appuyer sur le précédent permet d’exploiter l’information passée, ce qui permet d’améliorer les décisions actuelles, mais n’ajoute rien au stock d’informations de l’institution pour l’avenir, stock qui est constamment déprécié à mesure que changent les circonstances. Il n’est pas clair si et sous quelles conditions, les corps législatifs ou les cours atteignent un équilibre optimal entre les bénéfices de court terme qu’il y a à s’appuyer sur les informations existantes et les bénéfices de long terme qu’il y a à produire des informations nouvelles. Mais il n’y a pas de raison de penser que l’équilibre juridique soit systématiquement préférable. Puisque les effectifs des corps législatifs sont bien plus nombreux, ils ont des avantages épistémiques nets sur le modèle condorcétien lorsque leur compétence est minimalement pertinente pour le cas traité. En revanche, l’usage du précédent par les corps législatifs aussi bien que par les cours a des effets ambigus : il ne peut donc pas compenser l’avantage inhérent de l’effectif législatif.

Diversité. La théorie standard, qui souligne la compétence des juges, néglige également le fait que, dans un large éventail de cas « la diversité prime sur la compétence »48. On a montré qu’en ajoutant à un groupe donné des membres dont la compétence est inférieure à la moyenne, on peut en fait améliorer la performance globale, à condition que leurs biais soient corrélés négativement, à un degré suffisant, avec ceux des experts49. Depuis une perspective condorcétienne, la conclusion contre-intuitive est que, dans des conditions plausibles, un groupe décideur qui est professionnellement varié obtiendra de meilleurs résultats qu’un groupe de spécialistes. La diversité professionnelle est liée à la diversité épistémique ; inversement, une source importante de biais corrélés est une formation professionnelle commune, qui accroît la compétence individuelle, mais qui peut également produire des tâches aveugles communes et une pensée de groupe. Les avocats en particulier semblent partager des caractéristiques distinctives par rapport à la fois à la population générale et à d’autres professions50.

La plupart des corps législatifs sont professionnellement bien plus diversifiés que les Cours de justice. Le Congrès, par exemple, est professionnellement bien plus divers que la Cour Suprême. Entre 1960 et 2004, près de 45 % des membres du Congrès étaient d’anciens juristes51 ; le reste était constitué d’anciens chefs d’entreprise, enseignants, médecins, militaires, etc. Tous les législateurs élus sont des professionnels de la politique, mais pour la plupart d’entre eux il s’agit d’une deuxième carrière, alors qu’être juge est le plus souvent une deuxième carrière au sein de la carrière juridique. Il y a continuité entre les juges et les avocats ou juristes, alors que le corps législatif est un endroit où différents types de profession se retrouvent.

Les législateurs s’en remettent parfois à d’autres législateurs, comme par exemple lorsque la tribune s’en remet à des comités spécialisés, ou lorsque l’appartenance aux partis fait que les législateurs votent en bloc. Ce type de délégation réduit l’indépendance épistémique et porte ainsi atteinte à la justesse des décisions du groupe, toutes choses égales par ailleurs. Mais les effets épistémiques globaux sont ambigus, parce que toutes les choses ne sont pas égales par ailleurs. La délégation de la décision à des leaders d’opinion réduit l’indépendance mais élève la performance générale du groupe pour peu que les leaders d’opinion aient une compétence moyenne suffisamment élevée52; c’est là tout l’intérêt de disposer d’un système de comités spécialisés, qui suppose qu’il existe des gains épistémiques nets à troquer l’indépendance contre la compétence. De plus, la délégation au sein d’un groupe et le vote en bloc sont chose courante également au sein des cours de justice. Les juges développent des spécialités informelles sur des sujets particuliers, et tendent à voter en bloc dans un ensemble important de situations.

Il est difficile de démontrer précisément comment ces différents facteurs s’articulent. Ce qui est clair, c’est que les corps législatifs sont plus nombreux et, globalement, plus divers que les cours de justice, et il est probable que ces facteurs surpassent la compétence moyenne supérieure des juges, à supposer qu’elle existe. À tout le moins, la théorie traditionnelle a tort de se concentrer exclusivement sur la compétence. Les corps législatifs n’obtiennent pas nécessairement de moins bons résultats : il est même possible qu’elles fassent mieux, au sein de ce cadre épistémique que convoque le cas condorcétien. Le même genre de remarque vaut si nous comprenons l’agrégation dans des termes perspectifs plutôt que statistiques. Alors que l’expertise juridique garantit une compétence élevée, le simple nombre des législateurs et leur diversité professionnelle plus marquée garantit que les corps législatifs disposent d’éléments d’information plus nombreux et dispersés qu’ils peuvent combiner et qui apportent des perspectives plus variées.

Peut-on développer sur un argument évolutif en faveur du constitutionnalisme de common law ? La théorie du constitutionnalisme de common law évoque l’évolution dans des termes plutôt vagues, ce qui rend difficile de formuler les questions pertinentes. Je vais cependant proposer une observation qui vaut pour tous les modèles évolutionnaires du jugement. Ces modèles ne disent rien par eux-mêmes du taux auquel le précédent implique efficacité ou précision d’information. Si l’environnement politique, social et économique change rapidement, alors l’optimum à localiser bouge en permanence ; le constitutionnalisme de common law peut fort bien se trouver fort loin de l’optimum, même s’il se dirige constamment vers lui.

Au contraire, dans un environnement en changement rapide, une législation inefficace ou mal informée pourrait être plus proche de l’optimum que n’est le constitutionnalisme de common law, même si celui-ci converge vers l’optimum53. Tout système de précédent dépend largement du chemin parcouru : il existe donc un coût positif pour les juges à se coordonner pour adopter une nouvelle règle54.

Si tous ces points sont justes, le problème général des justifications épistémiques du constitutionnalisme de common law est qu’elles sont auto-réfutantes comme théories du contrôle de constitutionnalité, c’est-à-dire du pouvoir des cours d’invalider certaines lois. Si le contrôle du constitutionnalisme de common law est une forme de perfectionnisme moral solipsiste de la part des juges individuels, il peut être utile de souligner que plusieurs têtes juridiques valent mieux qu’une. Mais, de la même façon, plusieurs têtes législatives valent mieux qu’une. Les mécanismes mêmes de la sagesse collective auxquels recourt le constitutionnalisme de common law suggèrent que le constitutionnalisme législatif présentera une qualité épistémique encore plus grande. Pour des raisons épistémiques, le meilleur régime serait un régime où les cours chargent le corps législatif de résoudre ou clarifier les clauses constitutionnelles et d’ajuster la constitution aux changements des circonstances au cours du temps. Le régime résultant serait un régime de délégation de la part des cours et de constitutionnalisme de common law des corps législatifs.

Une autre position possible est que le meilleur régime de tous serait un régime de compétence épistémique cumulée. Même si le corps législatif a un avantage épistémique sur la cour, on peut néanmoins soutenir qu’en ajoutant la cour, on améliore les capacités épistémiques globales du système. Donner un certain poids aux décisions juridiques permettrait de réduire la corrélation des biais, d’accroître la compétence moyenne des décideurs, et d’augmenter les effectifs.

Mais il n’est pas clair que ce système soit supérieur épistémiquement à un régime de cours déléguées. Les législateurs qui anticipent sur le contrôle de constitutionalité des juges peuvent, rationnellement, consacrer moins d’énergie à rassembler et analyser les informations, ce qui produit une forme de ticket gratuit épistémique, ou de risque moral : anticipant le fait que les juges vont voir leurs erreurs, les législateurs vont, pour cette même raison, en commettre davantage. Ce ticket gratuit épistémique peut même devenir réciproque, dans un cas de « après vous, Monsieur ». Législateurs et juges atteindront alors moins de réponses correctes que ne le ferait chacune de ces institutions séparément.

Plus important : l’approche cumulative n’est pas possible dans les cas les plus exigeants, qu’elle soit désirable ou non. Ces cas sont ceux où les cours chargées du contrôle constitutionnel décident s’il convient d’invalider (et pas seulement de compléter ou d’améliorer) l’action législative. Dans de tels cas, celui qui dessine les institutions doit choisir si c’est la position législative ou juridique qui doit prévaloir en dernière instance. Je suggère que, pour des raisons épistémiques, c’est la position législative qui est le plus susceptible d’être supérieure à la moyenne.

Cette suggestion générale ne constitue pas une proposition très précise, mais une première approximation : un cadre qui permet de développer des propositions. Elle laisse d’importants détails dans l’obscurité, comme la question de savoir combien il faut déléguer, ou s’il existe une variation matérielle de la compétence épistémique comparée à travers les différents domaines ou questions juridiques. Si l’on peut ressaisir cette variation dans une répartition plus subtile de l’autorité institutionnelle, il faut le faire. Mais l’opinion courante qui favorise le constitutionnalisme de common law par les juges est aussi un cadre souple et pas une règle de décision très précise. Ma thèse principale, à ce même niveau de généralité, est que les arguments épistémiques en faveur de la supériorité générale du constitionnalisme de common-law juridique sont auto-réfutants.

L’organisation de la Cour Suprême

Jusqu’à présent, j’ai considéré comme stables l’organisation actuelle des corps législatifs et judiciaires. Si j’assouplis cette condition surgissent des possibilités intéressantes. Je commence par un exemple juridique, qui porte sur la composition de la Cour Suprême. Je suggère que la Cour devrait comporter au moins un membre profane ou non-juriste55. Il n’y a pas là de barrière légale dans le cas américain ; aucune loi n’exige que les membres de la Cour soit des juristes, même si la pratique a été de ne nommer que des juristes. Au contraire, des non-juristes sont en poste dans le Conseil Constitutionnel français.

L’intuition fondamentale derrière cette proposition est que les gains épistémiques que représente l’introduction d’un ou plusieurs nonjuriste(s) excèdent les pertes épistémiques. Quels sont ces gains ? L’agenda de la Cour est très hétérogène : il comprend non seulement des cas où la loi est autarcique ou strictement auto-référentielle, mais également des cas où la loi incorpore des thèses factuelles, causales ou morales tirées d’autres disciplines et domaines de la vie. Considérons par exemple les questions scientifiques explicites ou implicites qui surgissent lorsque la Cour discute du réchauffement climatique, des questions financières dans de nombreux cas d’impôts ou de finances, des questions historiques pertinentes pour le jugement constitutionnel originariste, et des questions qui portent sur les conditions d’emprisonnement. Ces exemples impliquent des connaissances spécialisées non juridiques, mais il existe également un grand nombre de cas très importants où la Cour tranche sur des sujets qui ne sont pas l’objet de connaissance professionnelle spécialisée comme le « mystère de la vie humaine »56.

Dans cet environnement, ajouter des non-juristes produirait des bénéfices en termes à la fois de compétence et de diversité de groupe. Pour ce qui est de la compétence, les non-juristes seront en général meilleurs que les juristes lorsque les règles du droit constitutionnel reposent sur des connaissances spécialisées extrajuridiques, comme l’économie, l’écologie, la psychologie. Pour ce qui est de la diversité, ajouter des non-juristes peut améliorer la performance globale de la Cour même dans les cas extérieurs au domaine d’expérience du nonjuriste, en réduisant la corrélation des biais du groupe. Souvenons-nous qu’ajouter des décideurs dont la compétence est inférieure à la moyenne peut améliorer la performance du groupe, dans les conditions où « la diversité prime sur la compétence ». Parce que les juristes ont des biais corrélés, diversifier la composition professionnelle de la Cour produira des gains épistémiques.

Quels non-juristes convient-il d’ajouter : cela dépend de l’agenda de la Cour. Si la Cour est confrontée à un flux constant de cas complexes de droit des entreprises, un expert financier serait une bonne idée ; si les cas concernent la régulation des émissions de carbone, un spécialiste de l’environnement serait préférable. Et bien sûr, le choix optimal serait d’avoir plus d’un non-juriste. Cette sorte de nomination présente un double avantage : cela réduit la corrélation des biais et accroît la compétence moyenne de la Cour dans les cas pertinents. Au contraire, nommer un astrologue ne produirait qu’un bénéfice en termes de diversité, et serait un choix inférieur à la nomination d’un professionnel, expert d’un domaine pertinent. Il est vrai que c’est en partie la composition de la Cour qui détermine l’agenda, mais seulement en partie ; des événements extérieurs à la Cour, et l’ensemble des cas disponibles dessine également la figure de l’agenda.

Le coût tient au fait que les non-juristes commettront vraisemblablement plus de bévues dans les cas où la loi est purement autarcique et n’incorpore aucune connaissance extérieure spécialisée ou générale. C’est un coût réel, tout comme le sont les bénéfices ; le problème est qu’il est difficile d’établir leur part respective. Dans le doute, il me semble que c’est une mauvaise idée de construire l’institution en adoptant un cas extrême, c’est-à-dire en fournissant des juristes pour les neuf postes. Pour des raisons marginalistes, on peut supposer que le premier non-juriste sera plus bénéfique que coûteux. Ne choisir aucun non-juriste représente un choix fort contestable.

Pour ceux que cette proposition ne convainc pas, une version plus faible consiste simplement à soutenir que la Cour doit compter avoir au moins un membre doté d’une double compétence : des membres qui possèdent une expertise marquée dans une profession non juridique. Même cette proposition plus faible produirait un large changement. Même si une approche en termes de double compétence exige toujours que tous les membres soient des juristes, elle exige qu’ils ne soient pas seulement cela, à la différence de ce qui se passe dans la Cour Suprême actuelle.

Même si l’approche de la double compétence marque une amélioration, je crois que ce serait pourtant une bonne chose d’avoir des juges profanes. Du point de vue de la diversité épistémique, le problème de l’approche de la double compétence est qu’elle ne fait rien pour réduire la corrélation positive des biais juridiques. L’approche de la double compétence pose une question cruciale d’organisation : la double compétence devrait-elle être construite au niveau des individus ou au niveau général ? Un ensemble de juges constitué à la fois de juristes et de non-juristes aurait une double compétence en tant que groupe, même si aucun de ses membres ne doit avoir de double compétence individuellement. En construisant la double compétence au niveau du groupe, plutôt qu’au niveau des individus, on peut obtenir le même niveau de compétence avec une plus grande diversité cognitive.

L’organisation du Congrès

Dans ma discussion de l’organisation de la Cour, j’ai tenu constant le nombre de juges et suggéré de diversifier la composition. Dans le cas du Congrès je vais m’intéresser aux effets épistémiques d’une variation du nombre de législateurs. Ma suggestion fondamentale est que, pour des motifs épistémiques, il existe de bonnes raisons de penser que le Congrès est trop petit, même si plusieurs considérations importantes entrent en jeu57. Je commence par présenter les bénéfices épistémiques que représente l’accroissement du corps législatif. Le taux de représentation au Congrès a largement décru au cours de l’histoire américaine, en passant de 1 représentant pour 30 000 habitants en 1792 à 1 pour plus de 611 000 habitants récemment((E. Auriol & R. Gary-Bobo, « On the Optimal Number of Representatives », 2007, http://idei.fr/doc/wp/optimal_number.pdf, p. 3.))). Si l’on accroît le nombre de représentants, on augmente la somme totale d’informations que détient le corps législatif. D’un point de vue analytique, Madison suggérait que les représentants apportent avec eux des informations locales qu’ils peuvent articuler dans un point de vue synthétique des conditions nationales58. Dans une analyse condorcétienne, les nombres ont un pouvoir exponentiel qui pousse la performance du groupe vers le haut dès lors que la compétence moyenne est supérieure au hasard. Parce que cette croissance est exponentielle, l’augmentation du nombre produit une diminution des gains épistémiques marginaux ; mais le gain total peut demeurer appréciable, selon la quantité ajoutée et le niveau de compétence initial. Lorsque la compétence moyenne est de 0,51 et qu’il existe deux choix, passer de 101 électeurs à 601 augmente les résultats du groupe de 0,58 à 0,6959. Enfin et surtout, le nombre croissant de législateurs tend à accroître la diversité cognitive du groupe.

Il existe pourtant au moins trois facteurs qui contrebalancent ce fait. Premièrement, accroître le nombre des représentants peut avoir pour effet de diluer la compétence individuelle. Parce que les membres du Congrès actuel sont sélectionnés dans un ensemble bien plus large que les membres de 1789, si les élections tendent à désigner ceux qui possèdent une compétence épistémique supérieure à la moyenne, le taux décroissant devrait tendre à accroître la compétence épistémique moyenne du législateur moderne. De même, Madison déclarait (en écho à Condorcet) que « plus les représentants sont nombreux, plus la proportion de membres peu informés et peu compétents sera grande »60.

Deuxièmement, il existe un problème de ticket gratuit épistémique parmi les législateurs. Bentham soutenait que même si « un grand nombre permet une plus grande probabilité de prendre une bonne décision plutôt qu’une mauvaise », le problème est que « plus les électeurs sont nombreux [dans le corps législatif ] moins chaque vote a de poids et de valeur et plus son poids aux yeux de l’électeur est faible, moins il a de motivation pour s’assurer que son vote est conforme à la fin visée »61. Un groupe législatif plus large permet un collectif qui peut être capable de créer plus d’informations, mais qui exploite moins efficace cette possibilité. Mais si les législateurs apportent une grande quantité d’informations, au lieu de la créer pendant qu’ils sont en charge, cet effet se dissout ; rappelons-nous que l’idée de Madison sur les bénéfices épistémiques de la représentation se fondait sur le fait que les législateurs disposaient d’une connaissance préalable des conditions locales62.

Enfin, la question de l’effectif législatif est difficile à séparer de celle de l’organisation du Congrès. Dans les termes de Machiavel, dans les Discours sur Tite-Live, « une multitude sans tête est inutile » ; un groupe composé de centaines de législateurs doit être organisé hiérarchiquement pour réussir à faire quoi que ce soit. Les effets épistémiques de l’organisation législative sont colossaux, comme je l’ai déjà souligné. D’une part, un système de comités spécialisés accroît la compétence moyenne des membres du comité, et en déléguant aux comités, les membres de la chambre accroissent de faire leur propre compétence63. D’autre part, la délégation réduit le nombre de votes indépendants. Moins de votes indépendants avec une compétence moyenne accrue peut être une bonne ou une mauvaise chose, selon les cas particuliers64.

La conclusion qu’il faut tirer de ces considérations qui se compensent n’est pas claire dans l’abstrait ; il faut obtenir des preuves détaillées pour chaque corps législatif particulier. Mais on peut utiliser une stratégie indirecte pour déterminer le nombre optimal de représentants, en utilisant le ratio de représentation moyen des démocraties libérales comme un point de repère normatif. Selon ce critère, le Congrès devrait comporter plus de 800 membres, en additionnant la Chambre et le Sénat65. Le Congrès est une exception frappante dans le contexte international par le faible nombre de ses membres, ce qui implique qu’il faudrait accroître le nombre de sièges.

Mais cette stratégie indirecte suppose qu’il existe quelque mécanisme (intentionnel ou dû à l’évolution) qui fait converger les démocraties libérales vers une taille du corps législatif optimale du point de vue épistémique. Mais s’il s’agit là d’une question ouverte, il faut souligner ce fait frappant que, dans les démocraties libérales, la taille d’un corps législatif composé d’une seule chambre, ou de la chambre basse dans un corps législatif bicaméral tend fortement vers la racine cubique de la population nationale66. Il peut s’agir d’un simple fait statistique, mais ce peut être aussi le résultat des efforts de ceux qui dessinent la constitution pour trouver un compromis entre les coûts et les bénéfices de la taille : on élargit le corps législatif jusqu’au point où les coûts et bénéfices marginaux du siège supplémentaire sont équivalents. Je reviendrai sur cette question dans la section suivante.

Interactions

Pour montrer comment la sagesse collective peut être traduite au niveau institutionnel, j’ai suggéré que le constitutionnalisme de common law devrait, pour des raisons épistémiques, être le domaine des législatures et pas des cours de justice ; que la Cour Suprême devrait comprendre au moins un non-juriste ; et qu’il se pourrait que le Congrès soit trop petit, même si ces questions sont complexes. Comme je l’ai dit, l’idéal serait d’ajuster ces thèses dans un équilibre réflexif, en combinant organisation des institutions et allocation de l’autorité législative pour trouver un optimum épistémique général. Même si je ne vais pas tenter cette tâche redoutable ici, je vais discuter rapidement comment ces thèses interagissent.

La thèse sur le constitutionnalisme de common law et sur des juges non-juristes est un substitut. Si les corps législatifs excellent sur les terrains mêmes proposés par les défenses épistémiques du constitutionnalisme de common law, c’est en partie en raison de leur plus grande diversité, qui prime souvent sur la compétence. Accroître la diversité épistémique de la Cour ne ferait qu’affaiblir l’argument. Mais la relation de substitution ne signifie pas que nous devons choisir entre les deux thèses. Il se pourrait que l’optimum épistémique exige un équilibre, par lequel une part de l’autorité constitutionnelle est transférée à la législature tandis qu’une part de la diversité épistémique est introduite dans la Cour.

Au contraire, l’argument épistémique pour augmenter les membres du Congrès est un complément mais pas un substitut de l’argument sur le constitutionnalisme de common law. Si le Congrès était plus nombreux et varié, et donc meilleur du point de vue épistémique, l’argument pour la juridiction législative sur le constitutionnalisme de common law serait d’autant plus fort. En outre, avec la nuance coût/bénéfice que je vais développer dans la section suivante, il est désirable d’accroître la compétence épistémique absolue tant du Congrès que des cours, quel que soit le calcul de la compétence épistémique relative à un instant donné.

Optimiser la sagesse collective

Dans la troisième section, j’ai supposé pour des raisons de simplicité que le but social est de maximiser la qualité épistémique de l’élaboration des lois. Si l’on relâche cette hypothèse, on peut alors demander comment le but de maximiser la qualité épistémique se compare aux autres buts sociaux. Dans cette perspective, la qualité épistémique devrait être optimisée et non maximisée. Si le bien-être agrégé67 devait être amélioré en sacrifiant à la marge quelque qualité épistémique pour gagner dans d’autres domaines, le système juridique devrait le permettre.

Sagesse collective et coûts d’erreur asymétriques

Dessiner les institutions de manière à maximiser la simple probabilité d’arriver à la bonne réponse est une mauvaise idée si cela coûte plus se tromper dans une direction plutôt que dans l’autre. Dans les termes de List, la bonne règle de décision devra maximiser non pas la somme des fiabilités positives et négatives (la chance d’éviter les erreurs de type I et type II), mais plutôt une somme pondérée par les coûts de l’erreur. Le vote majoritaire maximise la somme des fiabilités positives et négatives, mais une majorité qualifiée ou « supermajorité » est plus fiable ; elle tend à bloquer les changements qui ne sont pas vraiment bons, même si elle bloque également des changements qui le sont.

Il est évident que les règles de la majorité qualifiée ont des coûts collatéraux. Par exemple, elles doivent soit favoriser le statu quo, soit risquer l’indétermination, si aucune des propositions n’atteint la supermajorité exigée. Ou encore, les règles de la majorité qualifiée empêchent plus de changements nocifs, mais font que ceux qui passent sont plus durables. Dans une perspective de long terme, la règle de la majorité simple rend plus aisée une coalition de législateurs qui renversera à l’avenir les mauvaises décisions prises précédemment68. Mais il peut exister des situations particulières qui rendent ces coûts supportables pour bloquer plus de mauvais changements ; c’est ici le taux social des révisions au cours du temps qui est critique.

Même si les solutions adéquates peuvent varier suivant les contextes, les implications générales pour les institutions sont claires. Dans les corps législatifs, les règles du vote à la majorité qualifiée sont nombreuses et peuvent être défendues en termes de leur fiabilité épistémique négative. Le contrôle juridique de constitutionalité des lois, qui est comparable en pratique à une règle de supermajorité au sein de la législature, a été défendu sur la base du fait que le coût de permettre une législation non constitutionnelle est supérieur aux coûts de l’invalidation erronée d’une loi69. Ailleurs, Karen Croxson et d’autres ont commencé à étudier des points similaires à propos des mécanismes épistémiques, comme les marchés de prédiction dans les entreprises70. Le fonctionnement d’un marché de prédiction, ou de n’importe quel mécanisme épistémique, peut avoir de bonnes raisons de maximiser non seulement l’exactitude épistémique du mécanisme, mais également son exactitude pondérée.

Sagesse collective et coûts de la prise de décision

Le but de maximiser la qualité épistémique doit être systématiquement comparé aux coûts de la prise de décision. La diversité épistémique ou cognitive tend à être corrélée avec d’autres différences qui rendent l’action collective plus coûteuse. Les membres d’un groupe épistémiquement divers peuvent avoir peu d’opinions communes, ce qui élève les coûts de la compréhension mutuelle ; ils peuvent ne pas parler la même langue, ce qui élève les coûts de la communication. À la limite, la maximisation de la diversité épistémique peut produire non pas la sagesse collective, mais une Tour de Babel.

Lorsque se produit cette sorte de compromis surgit un problème d’optimisation évident. Accroître la diversité épistémique accroît la qualité épistémique des décisions, mais élève également les coûts de la décision, et le risque que le groupe n’arrive pas à atteindre de décision du tout. Les analyses de Buchanan et Tullock sur la taille optimale de l’assemblée représentative71, qui balance externalités et coûts de décision, a donc un analogue épistémique évident. Comme le disait Madison, pour déterminer la taille d’une assemblée, celui qui dessine la constitution doit considérer non seulement les bénéfices d’une « consultation libre et de la discussion » qui viennent de membres nombreux, mais également les coûts de « la confusion et l’excès d’une multitude »72.

Il existe des données qui suggèrent, même s’il est difficile de le prouver, que ceux qui dessinent la constitution raisonnent bel et bien de cette façon. J’ai mentionné plus haut la découverte que la taille législative tend à rejoindre la racine cubique de la population nationale. S’il existe un mécanisme qui fait de cette régularité un phénomène attesté, plutôt qu’un artefact statistique, c’est que ceux qui font la constitution réalisent consciemment un compromis entre les bénéfices de la taille législative contre les coûts73. Certains des bénéfices et des coûts sont épistémiques, mais d’autres comprennent les coûts de la prise de décision et (j’y reviens dans un instant) l’efficacité dans l’agrégation des préférences plutôt qu’une agrégation précise des jugements. Idéalement, celui qui dessine la constitution devra prendre en compte toutes ces considérations.

Sagesse collective et action exécutive

Un cas particulier important de compromis entre la qualité épistémique et les coûts de la décision concerne le compromis entre les qualités épistémiques de la délibération législative et la vitesse et puissance relatives de l’action exécutive. Même si l’exécutif, comme le Congrès, est un « nous », pas un « ça », la prise de décision exécutive est en moyenne plus centralisée, hiérarchique et rapide que la prise de décision juridique. Lorsque le Président agit en tant que Législateur-en-Chef, ses capacités ajoutent simplement à la qualité épistémique du Congrès à la marge. Au contraire, lorsque la question est de savoir comment répartir d’autorité exclusive de décision entre le Congrès et le Président, une approche fondée sur la compétence épistémique cumulée est impossible. On doit comparer les répartitions possibles et optimiser à la lumière des risques que la prise de décision exécutive soit mal informée ou irréfléchie et que la prise de décision législative soit lente, faible ou incohérente. Je ne chercherai pas à répondre ici à ces questions ; le sujet est déjà parcouru par une énorme littérature74.

Sagesse collective et dommages expressifs

Dans certains cas, le but de maximiser la qualité épistémique rencontre des engagements expressifs et de profondes hypothèses normatives du système juridique. Considérons la question, très débattue ces derniers temps en théorie juridique américaine, de savoir si les cours américaines devraient consulter la loi des juridictions étrangères pour modeler les règles juridiques. Un argument puissant en faveur de cette pratique repose sur une forme d’analyse coût/bénéfice épistémique75. Pour ce qui est des bénéfices, l’argument invoque le théorème du jury pour suggérer que les cours étrangères peuvent être vues comme un groupe électeur notionnel dont le jugement majoritaire va converger sur les réponses légales correctes aux problèmes communs. D’un autre côté, le système juridique américain rencontrerait des coûts de décision plus élevés s’il devait consulter la loi de nombreuses juridictions étrangères. Jusque-là, des esprits raisonnables peuvent être en désaccord sur le point où les bénéfices excèdent les coûts.

Il existe cependant un autre problème qui apparaît clairement lorsque nous nous demandons quelles juridictions étrangères précisément devraient être comprises dans le groupe électeur notionnel. Si l’on écarte la question des coûts croissants de la prise de décision, le groupe de référence devrait-il inclure seulement les démocraties libérales classiques, ou bien également la Corée du nord et le Zimbabwe ? Les raisons strictement épistémiques plaident pour l’inclusion de ces nations. Les distorsions politiques évidentes dans les systèmes politiques et juridiques de ces pays peuvent être vues comme des violations de la condition de sincérité du théorème du jury, soit comme des facteurs qui réduisent la compétence épistémique moyenne des juges pertinents. Mais contre ce point, l’inclusion de nations non libérales et non démocratiques permettrait certainement de réduire largement la corrélation des préjugés au sein du groupe notionnel. La diversité épistémique revient de plus belle.

Mais il y a là quelque chose d’erroné. La raison évidente pour ne pas inclure ces nations est que le faire reviendrait à violer des engagements normatifs et expressifs profonds du système juridique américain. Quel que soit le calcul épistémique, les cours américaines n’offriront et ne peuvent offrir une forme de reconnaissance tacite des pratiques des régimes despotiques. L’exemple souligne que ni la diversité épistémique ni la qualité épistémique ne doivent être maximisées à tout prix ; elles doivent être comparées avec des considérations normatives non épistémiques sur la composition des groupes décideurs pertinents. Je ne peux offrir aucun aperçu général sur la forme de ces contraintes normatives et expressives qui pèsent sur les considérations épistémiques : je peux seulement plaider en mitigation que les questions pertinentes sont trop hétérogènes et empiriques. Mais l’existence de ces contraintes ne fait aucun doute.

Les institutions polyvalentes

J’ai mentionné dans la première section le fait que certaines institutions ont plusieurs buts ou tâches : elles sont parfois engagées dans des tâches épistémiques qui supposent l’agrégation des jugements, parfois dans des tâches non épistémiques qui supposent l’agrégation des préférences. Le problème qui en résulte pour les institutions est que la structure qui maximise la performance pour la première tâche n’est pas nécessairement optimale pour la seconde. Pour des institutions polyvalentes, la structure optimale doit donc trouver un compromis correct.

Considérons le compromis entre information et préjugé qui affecte les institutions juridiques. L’isolement politique des juges, grâce à des protections légales de leur salaire, de leur inamovibilité et de solides normes d’indépendance judiciaire, améliore la performance épistémique du juge en réduisant les distorsions politiques. Lorsque le travail juridique consiste à trouver les bonnes réponses aux questions juridiques ou factuelles, l’isolement politique permet aux juges de mettre en œuvre « les manières du chercheur »76. D’autre part, ce même isolement fait que les juges sont de piètres représentants démocratiques et synthétisent mal les préférences politiques, dans des domaines où la loi constitutionnelle exige de fait l’agrégation des préférences. Une manière possible de régler ce problème est de nommer juges des hommes politiques77, ce qui modifierait les habitudes de chercheurs des autres juges grâce à une compréhension instinctive des préférences du public. Mais cette solution joue contre les dimensions strictement épistémiques de la mission du tribunal, parce que le juge-politicien serait moins bon techniquement. La question est de déterminer comment le compromis doit être établi ; dans une cour suprême composée de plusieurs membres, il semble tout à fait plausible qu’au moins un membre puisse être un homme politique plutôt qu’un technicien du droit. Là encore, le modèle est le Conseil Constitutionnel français, qui comprend d’anciens présidents de la République et d’autres hommes d’états.

Les idées ont un cycle de vie qui commence par une phase de génération et évolue vers une phase d’exploitation. Ces dernières années, des théoriciens de différentes disciplines ont engendré de nombreuses idées nouvelles à propos de la sagesse collective. Ma suggestion d’ensemble est qu’il est temps de passer à la phase d’exploitation, et de tirer profit des conceptions et mécanismes de la sagesse collective sur les problèmes institutionnels concrets. Ces mécanismes seront-ils utiles et dans quelle mesure ? La question est ouverte. Cependant, les applications que j’ai proposées peuvent au moins indiquer quelques problèmes majeurs et leurs solutions possibles.

Traduit de l’anglais par Solange Chavel

 

==================

NOTES

  1. Adrian Vermeule, « Many Minds Arguments in Legal Theory », Journal of Legal Analysis, 2009, vol. 1, n° 1.[]
  2. Jon Elster, Sour Grapes: Studies in the Subversion of Rationality, Cambridge, Cambridge University Press, 1983, p. 16.[]
  3. Pour la supériorité de simples algorithmes sur le jugement expert, voir R. Dawes, D. Faust & P. Meehl, « Clinical versus Actuarial Judgement » , Science, 1979, n° 243, p. 1668-1674. Pour leur supériorité même sur des questions de jugement politique complexe, voir P. Tetlock, Expert Political Judgment, Princeton, Princeton University Press, 2005, p. 76-77.[]
  4. Je crois que ce point rejoint la suggestion de Daniel Andler : « [la sagesse des foules] se caractérise mieux comme une intelligence collective sagement dessinée » (Daniel Andler, « What Has Collective Wisdom to Do With Wisdom? », colloque « Collective Wisdom: Principles and Mechanisms », Collège de France, mai 2008, p. 2.[]
  5. Elster observe que les émotions peuvent également promouvoir une prise de décision rationnelle (Alchemies of the Mind: Rationality and Emotions, New York, Cambridge University Press, 1999, p. 283) et peuvent motiver des actions désirables dans la vie quotidienne comme en politique. Voir également Antonio Damasio, Descartes’ Error: Emotion, Reason and the Human Brain, New York, Putnam, 1994, p. 173-174 et J. Rubenfeld, Freedom and Time, New Haven, Yale University Press, 2001, p. 129.[]
  6. Cass Sunstein, One Case at a Time, Cambridge, Harvard University Press, 1999. Jon Elster a soulevé cette question dans la discussion de l’article de List.[]
  7. Cass Sunstein, « Practical Reason and Incompletely Theorized Agreements », dans E. Ullman-Margalit (dir.), Reasoning Practically, New York, Oxford University Press, 2000.[]
  8. Marmor (« Should We Value Legislative Integrity? », dans R. Bauman & T. Kahana (dir.), The Least Examined Branch. The Role of Legislatures in the Constitutional State, Cambridge, Cambridge University Press, 2006) discute cette question en limitant ses arguments sceptiques au vote législatif plutôt qu’au vote judiciaire. La suggestion du texte est qu’il y a des raisons d’être sceptique sur la question de savoir si la cohérence à l’échelle du groupe est une valeur, dans tout cops de décision collectif. De même, Kornhauser (« Aggregate Rationality in Adjudication and Legislation », Politics, Philosophy and Economics, 2008, vol. 7, p. 5-28) affirme que la « rationalité agrégée » est trop exigeante pour les tribunaux ou les parlements.[]
  9. Ronald Dworkin, Taking Rules Seriously, Cambridge, Harvard University Press, 1977, p. 105-130.[]
  10. Marmor, « Should We Value Legislative Integrity? », art. cit., p. 127.[]
  11. Ibid.[]
  12. Kornhauser, « Aggregate Rationality », art. cit.[]
  13. Pascal, « Préface au traité du vide » (1651) dans De l’Esprit géométrique et autres textes, Paris, GF-Flammarion, 1993 ; J. Bentham, The Book of Fallacies, London, John and H.L. Hunt, 1824, p. 69-79[]
  14. Ibid., p. 71[]
  15. La distinction entre agrégations statistique et perspective vient de Lu Hong & Scott Page, « Microfoundations of Collective Wisdom », article disponible sur le site de Raison publique (https://www.raison-publique.fr/).[]
  16. C’est une illustration classique. Notons cependant qu’elle suppose un modèle particulier de probabilité qui n’est pas inhérent à l’opération du théorème du jury (P. Edelman, « On Legal Intepretations of the Condorcet Jury Theorem », Journal of Legal Studies, 2002, n° 31, p. 327-347, p. 329).[]
  17. Le théorème du jury peut être étendu à la majorité qualifiée (« supermajorité »), mais avec des restrictions. On a montré qu’une majorité qualifiée maximise la probabilité de prendre une décision correcte, si la majorité requise dépend, entre autres, des gains relatifs que représentent le rejet et l’approbation des projets (R. Ben-Yashar & S. Nitzan, « The Optimal Decision Rule for Fixed-Size Committees in Dichotomous Choice Situations: The General Result », International Economic Review, 1997, vol. 38, p. 175-186). Si les coûts de l’erreur sont symétriques, que la compétence des individus est uniforme, et qu’il n’y a pas de raison de penser a priori qu’une réponse est plus vraisemblable que l’autre, alors la règle de la majorité simple est optimale (ibid., p. 183). Je reviens dans la quatrième section sur la question des règles du vote avec coûts d’erreur asymétriques. Le résultat principal ne vaut que si le statu quo est censé prévaloir lorsqu’aucune proposition n’atteint la majorité qualifiée exigée. C’est évidemment une condition démocratiquement suspecte. Si la préférence de statu quo est abandonnée, on obtient un résultat plus faible : « pour des électorats suffisamment larges […] si la compétence moyenne des électeurs est plus grande que la fraction des votes nécessaires pour passer », une décision de groupe est plus susceptible d’être correcte que la décision d’un individu singulier choisi au hasard (M. Fey, « A Note on the Condorcet Jury Theorem with Supermajority Voting Rules », Social Choice and Welfare, 2003, n° 20, p. 27-32, p. 28). C’est une condition plutôt exigeante ; si le groupe décideur utilise une règle de la majorité des deux tiers, par exemple, alors la compétence moyenne doit être d’au moins 0,67. Rien de ce que j’affirme ici ne concerne la question de savoir si la règle de vote est la majorité simple ou qualifiée, et je parlerai donc de « majorité » tout simplement.[]
  18. David Estlund, « Opinion Leaders, Independence, and the Condorcet Jury Theorem », Theory and Decision, 1994, vol. 36, p. 131-162.[]
  19. Stuart Page, The Difference, Princeton, Princeton University Press, 2007.[]
  20. K. Ladha, « The Condorcet Jury Theorem, Free Speech, and Correlated Votes », American Journal of Political Science, 1992, vol. 36, p. 617-634, p. 632[]
  21. Bryan Caplan, The Myth of the Rational Voter, Princeton, Princeton University Press, 2007.[]
  22. À condition que la distribution de la compétence soit symétrique autour de la médiane. Voir Bernard Grofman et al., « Thirteen Theorems in Search of the Truth », Theory and Decision, 1983, vol. 15, p. 261-278, p. 273-274.[]
  23. C. List & R. Goodin, « Epistemic Democracy: Generalizing the Condorcet Jury Theorem », The Journal of Political Philosophy, 2001, vol. 9, p. 277-306, p. 285.[]
  24. Page, The Difference, op. cit., p. 185-188.[]
  25. Hong & Page, « Microfoundations of Collective Wisdom », art. cit.[]
  26. Robert Nozick, « Invisible-Hand Explanations », The American Economic Review, 1994, vol. 84, p. 314-318 ; E. Ulmann-Margalit, « The Invisible Hand and the Cunning of Reason », Social Research, 1997, vol. 64, p. 181-198.[]
  27. A. Ferguson, An Essay on the History of Civil Society, New York, Georg Olms Verlag, 2000, p. 187[]
  28. P. Rubin, « Why is the Common Law Efficient? », Journal of Legal Studies, 1977, vol. 6, p. 51-63.[]
  29. Gary Becker, « Public Policy, Pressure Groups, and Dead Weight Loss », Journal of Public Economics, 1985, vol. 28, p. 329-347.[]
  30. E. Elhauge, « Does Interest Group Theory Justify more Intrusive Judicial Review? », Yale Law Journal, 1991, vol. 101, p. 31-110, p. 66.[]
  31. Friedrich Hayek, « The Use of Knowledge in Society », Individualism and Economic Order, Chicago, University of Chicago Press, 1948.[]
  32. « The Evolution of Common Law », Journal of Political Economy, 2007, vol. 115, p. 43-68.[]
  33. Pour une critique de ce point de vue, voir David Estlund, J. Waldron et al., « Democratic Theory and the Public Interest: Condorcet and Rousseau Revisited », American Political Science Review, 1989, vol. 83, p. 1317-1340, p. 1320.[]
  34. B. Grofman & S. Feld, « Rousseau’s General Will: A Condorcetian Perspective », American Political Science Review, 1988, vol. 82, p. 567-576, p. 569.[]
  35. Jean-Jacques Rousseau, Du Contrat social (1762), dans Œuvres, Paris, Gallimard « Pléiade », 1978.[]
  36. David Estlund, Democratic Authority: A Philosophical Framework, Princeton, Princeton University Press, 2008, p. 225.[]
  37. J. Waldron, « The Wisdom of the Multitude: Some Reflections on Book 3, Chapter 11 of Aristotle’s Politics », Political Theory, 1995, vol. 23, p. 563-584 []
  38. Aristote, Politiques, livre III.[]
  39. C’est le cas de Waldron lui-même (ibid., p. 568-570). L’hypothèse de Waldron vient peut-être d’une exégèse confuse d’Aristote, qui suppose lui-même un lien avec la délibération, avec la structure analytique du mécanisme de l’agrégation perspective que discute Aristote, mécanisme qui n’est pas intrinsèquement délibératif.[]
  40. Page (The Difference, op. cit.) en donne un exemple[]
  41. Scalia se décrit personnellement comme un « originaliste doux » (« Originalism: The Lesser Evil », University of Cincinnati Law Review, 1989, vol. 57, p. 849-865, p. 864).[]
  42. Cass Sunstein, « Burkean Minimalism », University of Michigan Law Review, 2006, vol. 105, p. 353-408, p. 372 et A Constitution of Many Minds, Princeton, Princeton University Press, 2009.[]
  43. Adrian Vermeule, « Common Law Constitutionalism and the Limits of Reason », Columbia Law Review, 2007, vol. 107, p. 1482-1532[]
  44. David Estlund, Democratic Authority: A Philosophical Framework, Princeton, Princeton University Press, 2008 et Hélène Landemore « La raison démocratique », dans ce numéro.[]
  45. Christian List & R. Goodin, « Epistemic Democracy: Generalizing the Condorcet Jury Theorem », The Journal of Political Philosophy, 2001, vol. 9, p. 277-306, p. 287.[]
  46. S. Bikchandandi et al, « Learning from the Behavior of Others: Conformity, Fads, and Informational Cascades », The Journal of Economic Perspectives, 1998, vol. 12, p. 151-170, p. 162.[]
  47. Moore (« The Dead Hand of Constitutional Tradition », Harvard Journal of Law and Public Policy, 1996, vol. 19, p. 263-273, p. 269) établit un point semblable. Assurément, si les décideurs étaient absolument rationnels, la meilleure stratégie consisterait simplement à articuler son information actuelle avec l’information que contient le précédent ou la tradition, pour donner à chaque source d’information le poids qui lui revient. Mais la conception burkéenne elle-même suppose que des décideurs imparfaits, avec une capacité cognitive limitée, ne peuvent se comporter ainsi ; ils sont contraints de substituer la tradition à une raison indépendante, dans une plus ou moins grande mesure, plutôt que de simplement ajouter l’une à l’autre. Je suis cette hypothèse afin de rester dans la ligne de la logique burkéenne ; je crois également que l’hypothèse est juste, même si je n’ai pas besoin de défendre ici cette croyance.[]
  48. Scott Page, The Difference, Princeton, Princeton University Press, 2007[]
  49. K. Ladha, « The Condorcet Jury Theorem, Free Speech, and Correlated Votes », American Journal of Political Science, 1992, vol. 36, p. 617-34.p. 629[]
  50. S. Daicoff, Lawyer, Know Thyself: A Psychological Analysis of Personality Strengths and Weaknesses, Washington, American Psychological Association, 2004.[]
  51. C. Kraus & T. Suarez, « Is There a Doctor in the House? … or the Senate? Physicians in the U.S. Congress 1960-2004 », Journal of the American Medical Association, 2004, vol. 292, p. 2125-2129.[]
  52. David Estlund et al, « Democratic Theory and the Public Interest: Condorcet and Rousseau Revisited », American Political Science Review, 1989, vol. 83, p. 1317- 1340, p. 1318.[]
  53. G. Ponzetto & P. Fernandez, « Case Law vs. Statute Law: An Evolutionary Comparison », 2008, Journal of Legal Studies, vol. 38, http://www.people.fas/.[]
  54. Sur ce point, et d’autres questions sur le précédent, voir O. Hathaway, « Path Dependence in Law: The Course and Pattern of Legal Change in a Common Law System », Iowa Law Review, 2001, vol. 86, p. 601-665.[]
  55. Adrian Vermeule, « Should We Have Lay Justices? », Stanford Law Review, 2007, vol. 59, p. 1569-1612, p. 1569.[]
  56. Planned Parenthood vs. Casey, 505 U.S. 833, 851, 1992.[]
  57. David Estlund, « Democracy Counts: Should Rulers be Numerous? », 2008, texte pour le colloque sur la Sagesse Collective, Collège de France, p. 15-22, voir également son texte dans ce numéro de Raison publique.[]
  58. The Federalist Papers, n° 56.[]
  59. Christian List & R. Goodin, « Epistemic Democracy: Generalizing the Condorcet Jury Theorem », The Journal of Philosophy, 2001, vol. 9, p. 277-306, p. 287.[]
  60. The Federalist Papers, n° 58.[]
  61. Jeremy Bentham, « Lettre d’un Anglois à M. le C. de M. sur l’objet soumis aux notables de 1788 », cité par Estlund, « Democracy Counts », art. cit., p. 16.[]
  62. Elster, « The Optimal Design », art. cit, p. 20-21 propose un argument complet pour montrer que la représentation procure à l’assemblée une connaissance des intérêts locaux.[]
  63. K. Krehbiel, Information and Legislative Organization, Ann Arbor, University of Michigan Press, 1991, p. 61-104.[]
  64. David Estlund, « Opinion Leaders, Independence, and the Condorcet Jury Theorem », Theory and Decision, 1994, vol. 36, p. 131-162, p. 158-159.[]
  65. Auriol & Gary-Bobo, « On the Optimal Number of Representants », art. cit., p. 4.[]
  66. D. Lutz, Principles of Constitutional Design, Cambridge, Cambridge University Press, 2006, p. 227-234.[]
  67. Même si je formule ce point en termes welfaristes, une remarque semblable pourrait être faite dans d’autres idiomes moraux. Tout critère de bonnes institutions qui admet une pluralité de biens, y compris mais pas seulement la qualité épistémique, doit affronter la question de savoir comment articuler, arranger ou faire des compromis entre ces biens lorsqu’ils entrent en conflit.[]
  68. A. McGann, The Logic of Democracy, Ann Arbor, University of Michigan Press, 2006, p. 202.[]
  69. F. Cross, « Institutions and Enforcement of the Bill of Rights », Cornell Law Review, 2000, vol. 85, p. 1529-1608, p. 1576 ; R. Fallon Jr., « The Core of an Uneasy Case for Judicial Review », Harvard Law Review, 2008, vol. 121, p. 1693-1736, p. 1714.[]
  70. K. Croxson, I. Jewitt & C. Leaver, « Information Mechanisms for Decision Making: Evaluating Performance », inédit, 2008.[]
  71. J. Buchanan & G. Tullock, The Calculus of Consent, Indianapolis, Liberty Fund, 1999, p. 113-114.[]
  72. The Federalist Papers, n° 55[]
  73. Lutz, Principles of Constitutional Design, op. cit., p. 229-230.[]
  74. Voir Eric Posner & Adrian Vermeule, Terror in the Balance, New York, Oxford University Press, 2007, pour un point de vue possible…[]
  75. Eric Posner & Cass Sunstein, « The Law of Other States », Stanford Law Review, 2006, vol. 59, p. 131-179, p. 142[]
  76. A. Bickel, The Least Dangerous Branch: The Supreme Court at the Bar of Politics, Indianapolis, Bobbs-Merrill, 1962, p. 25-26.[]
  77. T. Peretti, « Where Have All the Politicians Gone? Recruiting for the Modern Court », Judicature, 2007, vol. 91, p. 112-122, p. 122.[]

Adrian Vermeule est Ralph S. Tyler Professor of Law à la Harvard Law School. Il a notamment écrit The Constitution of Risk (Cambridge University Press, 2014) et Law's Abnegation: From Law's Empire to the Administrative State (Harvard University Press, 2016).