Skip to main content
Questions et réponses avec Roger Melko

Roger Melko est membre du corps professoral associé de l’Institut Périmètre et professeur de physique à l’Université de Waterloo. Son principal champ de recherche est la matière quantique : avec ses étudiants, il étudie comment de grands ensembles de particules interagissent pour donner lieu à de nouveaux comportements surprenants, comme la supraconductivité. 

Mais à mesure que le nombre de particules dans un système quantique augmente, la physique devient plus complexe et plus difficile à prédire.

C’est pourquoi, bien avant que le grand public ne prenne conscience de l’intelligence artificielle avec le lancement de ChatGPT en 2022, Melko et ses collègues de l’Institut Vecteur pour l’intelligence artificielle de Toronto étudiaient déjà comment les « réseaux neuronaux » pouvaient être utiles pour l’étude des phases de la matière.

En 2018, Roger Melko a lancé le Laboratoire d’intelligence quantique de l’Institut Périmètre (PIQuIL) afin d’explorer comment l’intelligence artificielle (IA) pouvait être appliquée à des problèmes de la physique quantique.

Aujourd’hui, PIQuIL se porte très bien et a noué des partenariats avec des entreprises émergentes à l’avant-garde de la recherche en informatique quantique et en intelligence artificielle, notamment 1QBit et Haiqu Inc., deux entreprises de logiciels en informatique quantique, ainsi que le concepteur de puces Irréversible. Des chercheurs de PIQuIL ont également lancé leurs propres jeunes pousses, comme l’entreprise canadienne yiyaniQ, qui offre des solutions quantiques à des sociétés financières.

Roger Melko, a leading researcher exploring how artificial intelligence is transforming quantum physics.

La plus récente initiative, codirigée par Melko avec Crystal Senko et Rajibul Islam à l’Institut d’informatique quantique de l’Université de Waterloo, s’appelle Open Quantum Design. Il s’agit d’un organisme sans but lucratif voué au développement d’un ordinateur quantique libre et ouvert, afin de favoriser la collaboration entre le milieu universitaire, l’industrie et les gouvernements, et de générer des percées en informatique quantique grâce à l’IA.

En 2024, Melko et son collègue du Vector Institute, Juan Carrasquilla (aujourd’hui à l’ETH Zurich), ont publié un article de perspective dans Nature Computational Science décrivant comment la structure algorithmique utilisée par les grands modèles de langage (GML) peut également servir à faire progresser l’informatique quantique.

Melko est devenu une référence dans l’application de l’intelligence artificielle à la physique théorique. Nous nous sommes entretenus avec lui pour discuter de la manière dont l’IA transforme la façon dont nous faisons de la physique.

“Le champ des applications en physique est pratiquement illimité. Il n’est contraint que par notre imagination.”
— Roger Melko

La conversation suivante a été révisée pour en améliorer la clarté et la longueur :

Question : À quel moment les physiciens ont-ils commencé à utiliser l’IA, et comment est-elle utilisée aujourd’hui en physique ?

Il y a plus de dix ans, la puissance de ce que nous appelions alors l’apprentissage profond est devenue évidente. Par exemple, AlexNet, un programme d’apprentissage automatique créé par le chercheur torontois Geoffrey Hinton, a été lancé en 2012.

Les physiciens ont commencé à prendre conscience de la puissance de ces algorithmes d’apprentissage profond et à les intégrer à leurs méthodes de travail. C’est à ce moment‑là que nous nous sommes engagés dans ce domaine, et que nous avons lancé le Laboratoire d’intelligence quantique de l’Institut Périmètre (PIQuIL) en 2018.

Une autre percée majeure s’est produite en 2020, lorsque des chercheurs d’OpenAI dirigés par Jared Kaplan ont publié un article montrant que les grands modèles de langage pouvaient faire des prédictions fondées sur des lois d’échelle. Ils ont démontré que certains types de modèles, que nous appelons aujourd’hui grands modèles de langage, pouvaient voir leurs performances s’améliorer de manière prévisible en augmentant leur taille. La mise à l’échelle reposait sur trois éléments : la taille du modèle, la quantité de données utilisées pour l’entraîner et la puissance de calcul nécessaire à l’entraînement.

Des percées antérieures, comme l’apprentissage profond et la découverte des lois d’échelle, ont donné lieu à d’autres moments charnières, notamment le développement subséquent des modèles ChatGPT.

Aujourd’hui, je dirais que les applications de l’IA en physique sont pratiquement illimitées. On les observe dans tous les domaines : la physique des hautes énergies, les relevés astronomiques, les données issues des télescopes, la physique de la matière condensée, la science des matériaux et l’informatique quantique. J’irais même jusqu’à dire qu’aucun domaine de la physique n’est désormais épargné par l’IA.

Question : Quels types d’IA sont utilisés en physique aujourd’hui ?

On peut distinguer plusieurs grandes catégories. Il y a dix ans, on parlait surtout d’apprentissage supervisé, non supervisé et par renforcement. Les chercheurs canadiens ont joué un rôle important dans le développement de toutes ces approches.

Toutefois, avec l’arrivée des grands modèles de langage (GML), cette classification s’est estompée, puisqu’il s’agit d’un paradigme qui combine plusieurs de ces concepts. Le principe fondamental des GML modernes est que, lorsqu’ils traitent des séquences de mots — ou ce que l’on appelle des « jetons » —, les modèles entraînés sont capables de prédire le prochain élément de la séquence.

Il existe différents types d’IA, mais je dirais que les GML dominent aujourd’hui la conversation en physique.

Question : Quel rôle l’Institut Périmètre a‑t‑il joué dans le développement de l’IA pour la physique ?

L’Institut Périmètre a joué un rôle très important dans de nombreux domaines. Un exemple concret est celui des modèles de flux normalisants, un type de modèle génératif non supervisé utilisé pour les simulations. Ces modèles se sont révélés très utiles, notamment pour simuler des théories de champs sur réseau comme la chromodynamique quantique, une théorie fondamentale décrivant l’interaction des quarks et des gluons.

Il existe une histoire intéressante sur la manière dont Michael Albergo, de l’Université de New York, alors chercheur invité à PIQuIL, et Phiala Shanahan, ancienne boursière Simons Emily Noether à l’Institut Périmètre (aujourd’hui au MIT), se sont rencontrés presque par hasard à l’Institut Périmètre et ont contribué à faire émerger tout un nouveau champ de la physique, fondé sur l’utilisation de flux génératifs d’IA.

Ils se sont simplement croisés au Bistro de l’Institut Périmètre, ont entamé la conversation et donné quelques séminaires ; et soudainement, tout un nouveau champ de recherche est né. Récemment, lors de voyages de recherche — notamment au MIT et au Kavli Institute for Theoretical Physics —, j’ai été surpris de constater à quel point de nombreux chercheurs travaillent aujourd’hui sur les flux normalisants appliqués à la théorie des champs sur réseau.

Question : Quelles sont les plus récentes avancées au Laboratoire d’intelligence quantique de l’Institut Périmètre (PIQuIL) ?

PIQuIL demeure très actif. Voilà maintenant huit ans que le laboratoire existe, et nous restons à l’avant‑garde de l’intelligence artificielle, de l’informatique quantique et de la recherche en matière quantique condensée.

Des entreprises émergentes ont établi une résidence à PIQuIL et y ont été lancées. Le laboratoire constitue un excellent milieu de formation : nos étudiants à la maîtrise, nos doctorants et même nos stagiaires postdoctoraux ont poursuivi des carrières dans l’industrie grâce à leur passage chez nous.

Notre principale réussite des deux dernières années est le lancement d’Open Quantum Design. À mon avis, il s’agit d’une initiative extrêmement réussie. C’est une fondation à code source ouvert, structurée comme un organisme sans but lucratif, dont la mission est de livrer un ordinateur quantique dont la conception est développée de manière démocratique par une vaste communauté. Open Quantum Design a connu deux années très actives depuis sa création à PIQuIL.

Question : Comment l’Institut Périmètre peut‑il contribuer au développement de l’IA ?

L’Institut Périmètre est l’un des rares endroits au monde où il est possible de réfléchir en profondeur à l’IA et aux raisons pour lesquelles elle fonctionne comme elle le fait.

Il existe encore des théories à développer pour mieux comprendre les fondements de l’intelligence artificielle. Les percées survenues en 2020, qui ont mis en lumière les lois d’échelle à la base des GML, ne sont toujours pas entièrement comprises. Pourtant, ces lois d’échelle — qui offrent une manière prévisible de faire croître les GML afin que leur performance s’améliore de façon continue — sont extrêmement cruciales pour l’industrie. Elles ont changé le monde. À l’Institut Périmètre et au sein de PIQuIL, nous avons le privilège de pouvoir réfléchir aux concepts théoriques qui pourraient expliquer ces lois d’échelle, ce qui pourrait mener à des façons de les améliorer. Cela pourrait également ouvrir la voie à des paradigmes entièrement nouveaux en intelligence artificielle à l’avenir.

En fait, je soupçonne qu’à mesure que l’Institut Périmètre poursuivra son expansion, le développement des fondements théoriques de l’intelligence artificielle — tant pour l’IA d’aujourd’hui que pour les modèles de demain — deviendra de plus en plus important.

Question : La plupart des gens associent les grands modèles de langage comme ChatGPT à la rédaction de textes ou de poésie. Comment cela peut‑il être appliqué à la physique ?

Dans les grands modèles de langage, l’IA prédit le prochain mot — ou « jeton » — d’une séquence. Par exemple, si l’on commence par « Une poule sur un mur », quels seront les mots suivants ? Si le modèle a assimilé suffisamment de données pendant son entraînement, il répondra « qui picote du pain dur ». Les GML sont donc extrêmement performants pour compléter des phrases : ils apprennent essentiellement une distribution de probabilités sous‑jacente aux séquences de mots.

Alors comment appliquer cela à la physique? Il suffit de transposer cette idée à des séquences pertinentes. Par exemple, je travaille sur des séquences de qubits — des bits quantiques — et sur les résultats de leurs mesures. À l’Université de Waterloo, nous disposons d’un ordinateur quantique constitué d’une rangée d’atomes, chacun représentant un qubit. Lorsque je mesure cet ensemble, à quoi ressemblera la séquence des résultats ? Elle pourrait être bas, bas, haut, bas, et ainsi de suite. Une IA fondée sur un modèle de type GML serait alors capable de « terminer la phrase » et de prédire le résultat le plus probable pour la suite de la séquence, en fonction des autres qubits.

Question : Mais l’IA peut‑elle réellement raisonner et trouver des solutions que les humains n’ont pas encore découvertes ? Ou se contente‑t‑elle d’imiter ce que nous lui fournissons ?

À un niveau fondamental, tout repose sur des probabilités. Les IA sont très douées pour utiliser des probabilités afin de reproduire des phrases humaines. Cela dit, avant l’avènement des GML, peu de gens croyaient que le langage lui‑même pouvait être probabiliste.

Lorsqu’on construit des agents d’IA au‑dessus de ces modèles probabilistes de base, la question du raisonnement se pose réellement. On peut par exemple échantillonner un modèle de base plusieurs fois, obtenir différentes phrases, puis demander à un agent de plus haut niveau de les comparer et de sélectionner la meilleure. On peut imaginer cela comme un oignon à plusieurs couches : la base est probabiliste, mais on ajoute ensuite des couches supplémentaires. À ce stade‑là, on entre véritablement dans une réflexion philosophique sur ce que l’on considère comme du raisonnement. Là‑dessus, j’avoue que cela dépasse un peu mon domaine de compétence.

Question : L’IA pourrait‑elle proposer une nouvelle solution à des problèmes comme la gravité quantique ? Une réponse à laquelle nous n’aurions jamais pensé ?

Je crois que c’est possible. Toutefois, il se peut aussi que l’IA propose une réponse que nous ne comprenons pas entièrement, ou pour laquelle nous n’avons pas encore l’intuition nécessaire. Une IA repose sur une multitude d’interactions microscopiques : des réseaux neuronaux, des pondérations, des biais. L’un de mes étudiants faisait remarquer que l’IA exploite elle‑même la complexité et l’émergence comme ressources. Il est donc possible que, pour certains problèmes non résolus en physique, il existe des explications complexes et émergentes pour lesquelles l’IA serait particulièrement bien adaptée, même si ces réponses ne sont pas intuitives pour nous, humains.

Question : Quelles sont les limites de l’utilisation de l’IA en physique ? Par exemple, le problème de la « boîte noire », où l’IA produit une réponse sans que l’on comprenne comment elle y est arrivée.

C’est une question majeure. Comment interpréter ce qui se passe à l’intérieur d’une IA ? C’est difficile, et peut‑être fondamentalement hors de notre portée. Nous ne comprenons pas entièrement le fonctionnement du cerveau humain, avec toutes ses connexions, et il est possible qu’il en soit de même pour les innombrables connexions internes d’un système d’IA.

La vraie question est donc de savoir si cette opacité limitera notre capacité à utiliser l’IA en physique. Cela exige sans doute une façon différente de réfléchir à la pratique de la physique et à l’utilisation de l’IA dans ce domaine. Tout comme nous pouvons faire du calcul alors qu’un chien ne le peut pas, certaines tâches pourraient être mieux accomplies par l’intelligence artificielle que par nous.

Question : Comment l’IA et l’informatique quantique vont‑elles interagir ?

J’y ai beaucoup réfléchi. Je pense que, presque par nécessité, les ordinateurs quantiques devront être intégrés à des systèmes d’intelligence artificielle au niveau de leur contrôle, car ce sont les dispositifs les plus complexes que nous ayons jamais construits.

De la même façon que de grandes expériences, comme les accélérateurs de particules du CERN, utilisent l’IA pour traiter les données et modéliser les interactions, les ordinateurs quantiques auront besoin d’IA simplement pour atteindre une échelle utile.

Par ailleurs, les ordinateurs quantiques produisent eux‑mêmes une abondance de données intéressantes. En revenant à l’idée d’utiliser des modèles de type GML pour prédire des séquences de qubits, on peut imaginer entraîner des modèles d’IA afin qu’ils deviennent des « jumeaux numériques » de l’ordinateur quantique.

Nous entrons ainsi dans un cycle très intéressant de co‑conception : l’IA aide à construire des ordinateurs quantiques, et les ordinateurs quantiques produisent des données qui servent à entraîner l’IA. Ces modèles peuvent ensuite prédire et caractériser le comportement des dispositifs, voire anticiper celui des futurs ordinateurs quantiques.

Il est presque inévitable que ce cycle se poursuive et que l’IA et l’informatique quantique deviennent étroitement intégrées.

Question : En regardant vers l’avenir, comment l’IA transformera‑t‑elle la pratique de la physique ?

Elle l’a déjà transformée. J’étais récemment en visite académique à Oxford, et à l’heure du lunch, les physiciens discutent systématiquement de l’IA : de son influence sur la rédaction des articles, sur la façon de faire des calculs, sur la formation des étudiants aux cycles supérieurs. Nous parlons de l’utilisation de ChatGPT, de la création de nos propres modèles fondés sur les données de laboratoire. L’IA a déjà modifié toutes les facettes de notre travail, et il ne fait aucun doute qu’elle continuera de transformer la manière dont nous faisons de la physique.

Il s’agit du premier texte d’une série consacrée à l’avenir de la physique. Restez à l’affût de la suite !

À propos de l’IP

L'Institut Périmètre est le plus grand centre de recherche en physique théorique au monde. Fondé en 1999, cet institut indépendant vise à favoriser les percées dans la compréhension fondamentale de notre univers, des plus infimes particules au cosmos tout entier. Les recherches effectuées à l’Institut Périmètre reposent sur l'idée que la science fondamentale fait progresser le savoir humain et catalyse l'innovation, et que la physique théorique d'aujourd'hui est la technologie de demain. Situé dans la région de Waterloo, cet établissement sans but lucratif met de l'avant un partenariat public-privé unique en son genre avec entre autres les gouvernements de l'Ontario et du Canada. Il facilite la recherche de pointe, forme la prochaine génération de pionniers de la science et communique le pouvoir de la physique grâce à des programmes primés d'éducation et de vulgarisation.

Pour de plus amples renseignements, veuillez vous adresser à :
Communications et engagement du public
Relations avec les médias