{"id":2354,"date":"2025-09-03T11:08:54","date_gmt":"2025-09-03T09:08:54","guid":{"rendered":"https:\/\/blog.u-bourgogne.fr\/chaire-smart-city\/?page_id=2354"},"modified":"2025-09-03T11:08:54","modified_gmt":"2025-09-03T09:08:54","slug":"axe-4-creer-les-connaissances-du-futur-pour-innover-demain-des-fondements-theoriques-au-developpement-de-lia","status":"publish","type":"page","link":"https:\/\/blog.ube.fr\/chaire-smart-city\/axe-4-creer-les-connaissances-du-futur-pour-innover-demain-des-fondements-theoriques-au-developpement-de-lia\/","title":{"rendered":"Axe 4 : Cr\u00e9er les connaissances du futur pour innover demain &#8211; Des fondements th\u00e9oriques au d\u00e9veloppement de l&rsquo;IA"},"content":{"rendered":"<p><strong>Contexte<\/strong><br \/>\nCet axe du p\u00f4le IA met en avant les contributions de l\u2019UBE et les d\u00e9fis qu\u2019elle souhaite relever, des<br \/>\nfondements th\u00e9oriques au d\u00e9veloppement de l\u2019IA, en s\u2019appuyant sur ses comp\u00e9tences en<br \/>\nmath\u00e9matiques, informatique, psychologie cognitive, etc. Ces d\u00e9fis portent sur la gestion des donn\u00e9es<br \/>\net des connaissances, sur les outils math\u00e9matiques derri\u00e8re les mod\u00e8les et les algorithmes, sur le<br \/>\nd\u00e9veloppement de nouvelles architectures et nouveaux paradigmes, ainsi que sur l\u2019utilisation de l\u2019IA<br \/>\ndans les sciences physiques.<\/p>\n<p><strong>D\u00e9fi 1. Donn\u00e9es et connaissances pour l\u2019IA (\u201cAI ready data and knowledge\u201d)<\/strong><br \/>\nCe d\u00e9fi s\u2019int\u00e9resse \u00e0 la gestion des donn\u00e9es et des connaissances pour leur usage dans des m\u00e9thodes,<br \/>\nalgorithmes ou mod\u00e8les d\u2019IA. Relever ce d\u00e9fi passe par l\u2019acquisition, la qualification et la mise \u00e0<br \/>\ndisposition de jeux de donn\u00e9es, par la gestion efficace de ces donn\u00e9es, par leur repr\u00e9sentation et<br \/>\nint\u00e9gration avec des connaissances, et enfin par la conception de m\u00e9canismes de raisonnement.<br \/>\nL\u2019acquisition de donn\u00e9es sous diff\u00e9rentes formes &#8211; via l\u2019usage de donn\u00e9es ouvertes, le crawling de<br \/>\nnouvelles donn\u00e9es, l\u2019apport de donn\u00e9es \u00ab m\u00e9tier \u00bb non structur\u00e9es &#8211; vient compl\u00e9ter les jeux de<br \/>\ndonn\u00e9es (structur\u00e9es ou semi-structur\u00e9es) disponibles. Des op\u00e9rations de qualification, consolidation<br \/>\net nettoyage de ces jeux de donn\u00e9es sp\u00e9cifiquement adapt\u00e9s aux applications d&rsquo;IA doivent \u00eatre<br \/>\nappliqu\u00e9es, en prenant en compte les probl\u00e8mes d\u2019\u00e9thique ou de biais dans les donn\u00e9es. Ces<br \/>\nop\u00e9rations peuvent favoriser le partage et la publication de jeux de donn\u00e9es.<br \/>\nSelon le type de donn\u00e9es \u00e0 manipuler, diff\u00e9rents mod\u00e8les peuvent \u00eatre privil\u00e9gi\u00e9s, comme des<br \/>\nmod\u00e8les relationnels, des mod\u00e8les No-SQL, des mod\u00e8les de graphes ou des bases de donn\u00e9es de<br \/>\ns\u00e9ries temporelles. La gestion efficace des donn\u00e9es multi-mod\u00e8les est une probl\u00e9matique complexe.<br \/>\nLa mise en \u0153uvre de polystores pour stocker les donn\u00e9es en ad\u00e9quation avec des pipelines d\u2019analyse<br \/>\net avec des m\u00e9thodes d\u2019interrogation efficaces est un d\u00e9fi important et peut n\u00e9cessiter des<br \/>\narchitectures particuli\u00e8res pour des donn\u00e9es massives.<br \/>\nLa compr\u00e9hension des donn\u00e9es et des r\u00e9sultats des analyses peut \u00eatre am\u00e9lior\u00e9e en mod\u00e9lisant les<br \/>\nconnaissances \u00e0 un plus haut niveau d\u2019abstraction pour expliciter la s\u00e9mantique des donn\u00e9es. Ces<br \/>\napproches d\u00e9velopp\u00e9es en IA symbolique s\u2019appuient sur des repr\u00e9sentations formelles logiques pour<br \/>\nmod\u00e9liser les connaissances : graphes de connaissances comme Google KG, bases de connaissances<br \/>\nontologiques, syst\u00e8mes de r\u00e8gles ou autres repr\u00e9sentations. La mise en \u0153uvre de solutions d\u2019analyse<br \/>\nhybrides d\u2019IA symbolique et d\u2019IA num\u00e9rique est un d\u00e9fi prometteur qui int\u00e8gre les donn\u00e9es et les<br \/>\nconnaissances pour enrichir les analyses et leur compr\u00e9hension.<br \/>\nPlusieurs m\u00e9canismes de raisonnement peuvent \u00eatre appliqu\u00e9s \u00e0 diff\u00e9rents niveaux d\u2019abstraction et<br \/>\npour diff\u00e9rentes finalit\u00e9s. L\u2019IA symbolique qui s\u2019appuie sur une sp\u00e9cification formelle des<br \/>\nconnaissances peut permettre la mise en place de m\u00e9canismes de raisonnement pour le contr\u00f4le de<br \/>\nla coh\u00e9rence des donn\u00e9es ou l\u2019application de r\u00e8gles (de contr\u00f4le, m\u00e9tiers, li\u00e9es \u00e0 la qualit\u00e9 des<br \/>\ndonn\u00e9es, \u00e0 la compr\u00e9hension des r\u00e9sultats). Il s\u2019agit ici de concevoir des proc\u00e9dures de raisonnement<br \/>\nefficaces adapt\u00e9es aux mod\u00e8les complexes de connaissances pouvant contenir de nombreuses r\u00e8gles,<br \/>\navec une expressivit\u00e9 \u00e9lev\u00e9e.<\/p>\n<p><strong>D\u00e9fi 2. Fondements th\u00e9oriques des mod\u00e8les et des algorithmes<\/strong><br \/>\nCe d\u00e9fi se concentre sur le d\u00e9veloppement d&rsquo;outils qui permettent d&rsquo;analyser les mod\u00e8les et<br \/>\nalgorithmes existants, d\u2019en am\u00e9liorer les performances et d&rsquo;en fournir de nouveaux. Les outils<br \/>\nd\u00e9velopp\u00e9s au sein de l\u2019UBE appartiennent \u00e0 de nombreux domaines des math\u00e9matiques et de<br \/>\nl\u2019informatique.<br \/>\nEn informatique, la manipulation de donn\u00e9es massives et h\u00e9t\u00e9rog\u00e8nes (sous forme de graphes,<br \/>\nmatrices ou vecteurs, denses ou parcimonieuses, etc.) requiert d&rsquo;optimiser les mod\u00e8les de stockage<br \/>\net les structures de donn\u00e9es g\u00e9r\u00e9es en m\u00e9moire pour am\u00e9liorer les performances des algorithmes<br \/>\n(voir d\u00e9fi 1). En statistique, la prise en compte de donn\u00e9es en dimension infinie (sous forme de courbes<br \/>\nou de trajectoires) n\u00e9cessite d&rsquo;adapter les m\u00e9thodes classiques au cadre novateur de la statistique<br \/>\ndes donn\u00e9es fonctionnelles.<br \/>\nA l\u2019interface entre la statistique et l\u2019optimisation, les estimateurs p\u00e9nalis\u00e9s (ou probl\u00e8mes inverses<br \/>\nr\u00e9gularis\u00e9s) qui induisent de la parcimonie g\u00e9n\u00e9ralis\u00e9e (et donc de l&rsquo;interpr\u00e9tabilit\u00e9) doivent<br \/>\nb\u00e9n\u00e9ficier d&rsquo;algorithmes suffisamment performants, qui permettent en particulier de s\u00e9lectionner<br \/>\nautomatiquement les param\u00e8tres de p\u00e9nalisation (ou de r\u00e9gularisation). Les estimateurs robustes<br \/>\ndoivent quant \u00e0 eux b\u00e9n\u00e9ficier d&rsquo;algorithmes permettant leur mise \u00e0 jour en ligne y compris en grande<br \/>\ndimension.<br \/>\nEn optimisation, o\u00f9 les algorithmes (stochastiques) sont au c\u0153ur de l&rsquo;entra\u00eenement des mod\u00e8les de<br \/>\nMachine Learning et de Deep Learning, il est indispensable d&rsquo;\u00e9tudier, m\u00eame en dehors de ce cadre,<br \/>\nleur convergence, leur extension \u00e0 des probl\u00e8mes non convexes, leur relaxation de type champ<br \/>\nmoyen, leurs acc\u00e9l\u00e9rations, etc. En probabilit\u00e9s, les m\u00e9thodes de type \u00ab bandit multi-bras \u00bb peuvent<br \/>\npermettre de r\u00e9gler automatiquement les param\u00e8tres d&rsquo;algorithmes (en particulier stochastiques).<br \/>\nEn th\u00e9orie du contr\u00f4le, la contr\u00f4labilit\u00e9 des r\u00e9seaux de neurones est li\u00e9e \u00e0 leur propri\u00e9t\u00e9<br \/>\nd&rsquo;approximation universelle (qui est une des justifications th\u00e9oriques de leur utilisation) et l&rsquo;enjeu est<br \/>\nd&rsquo;apporter des algorithmes r\u00e9alisant cette contr\u00f4labilit\u00e9. En syst\u00e8mes dynamiques, se pose la question<br \/>\nde l&rsquo;extension de l&rsquo;approximation universelle \u00e0 ce cadre par des \u00e9quations diff\u00e9rentielles neuronales<br \/>\n(Neural ODEs). En th\u00e9orie des jeux, la mod\u00e9lisation de l&rsquo;apprentissage f\u00e9d\u00e9r\u00e9 (Federated Learning)<br \/>\npar des jeux potentiels ouvre de nombreuses perspectives.<\/p>\n<p><strong>D\u00e9fi 3. D\u00e9veloppement de nouvelles IA<\/strong><br \/>\nCe d\u00e9fi consiste \u00e0 explorer et \u00e0 d\u00e9velopper au sein de l\u2019UBE de nouvelles architectures et de nouveaux<br \/>\nparadigmes d&rsquo;IA pour r\u00e9soudre des probl\u00e8mes sp\u00e9cifiques tels que la consommation raisonn\u00e9e<br \/>\nd\u2019\u00e9nergie, la protection de la vie priv\u00e9e ou l\u2019entrainement de mod\u00e8les d\u2019IA avec peu ou pas de donn\u00e9es<br \/>\nannot\u00e9es.<br \/>\nL\u2019IA frugale doit permettre une meilleure prise en compte des d\u00e9fis environnementaux et rendre les<br \/>\ninnovations en IA plus soutenables. La r\u00e9duction de la pr\u00e9cision num\u00e9rique des poids d&rsquo;un r\u00e9seau de<br \/>\nneurones (quantification) ou la suppression des connexions les moins importantes dans le mod\u00e8le<br \/>\n(\u00e9lagage ou pruning) participent \u00e0 la r\u00e9duction de la taille des mod\u00e8les. Par ailleurs, de nouveaux<br \/>\nmod\u00e8les d\u2019IA neuro-inspir\u00e9s se basent sur des r\u00e9seaux de neurones impulsionnels (Spiking Neural<br \/>\nNetwork ou SNN), qui permettent de r\u00e9duire drastiquement la complexit\u00e9 calculatoire et sont<br \/>\nembarquables sur des processeurs basse consommation.<br \/>\nL\u2019IA f\u00e9d\u00e9r\u00e9e, o\u00f9 les mod\u00e8les d&rsquo;IA sont entrain\u00e9s sur des donn\u00e9es distribu\u00e9es, garantit la protection de<br \/>\nla vie priv\u00e9e puisque les donn\u00e9es n\u2019ont plus besoin d\u2019\u00eatre d\u00e9plac\u00e9es vers un emplacement central. De<br \/>\nnouvelles architectures permettent en outre une personnalisation des mod\u00e8les d\u2019IA pour chaque<br \/>\nutilisateur ou groupe d&rsquo;utilisateurs, en les adaptant \u00e0 leurs besoins sp\u00e9cifiques sans compromettre<br \/>\nleur vie priv\u00e9e.<br \/>\nL&rsquo;entra\u00eenement des mod\u00e8les est une \u00e9tape cruciale, surtout avec insuffisamment de donn\u00e9es<br \/>\nannot\u00e9es (indispensables \u00e0 l&rsquo;apprentissage supervis\u00e9 traditionnel). De nouveaux paradigmes<br \/>\nd&rsquo;entra\u00eenement cherchent \u00e0 exploiter les donn\u00e9es non \u00e9tiquet\u00e9es disponibles et l&rsquo;expertise des<br \/>\nsp\u00e9cialistes du domaine pour d\u00e9velopper des mod\u00e8les d&rsquo;IA robustes et performants. Diverses<br \/>\nstrat\u00e9gies d&rsquo;apprentissage &#8211; pr\u00e9-entra\u00eenement, transfert, apprentissage semi-supervis\u00e9 et faiblement<br \/>\nsupervis\u00e9, renforcement avec feedback d&rsquo;experts, apprentissage auto-supervis\u00e9 avec la conception de<br \/>\nt\u00e2ches pr\u00e9textes &#8211; permettent de se passer de l\u2019\u00e9tape d\u2019annotation des donn\u00e9es. La g\u00e9n\u00e9ration de<br \/>\ndonn\u00e9es synth\u00e9tiques, via des mod\u00e8les d\u2019IA g\u00e9n\u00e9rative ou des mod\u00e8les de langage de grande taille<br \/>\n(LLM), est \u00e9galement employ\u00e9e pour pr\u00e9-entra\u00eener des mod\u00e8les performants avec insuffisamment de<br \/>\ndonn\u00e9es annot\u00e9es. Les principaux d\u00e9fis de ces nouveaux paradigmes d&rsquo;entra\u00eenement (qui permettent<br \/>\nensuite d&rsquo;utiliser de grands mod\u00e8les d\u2019IA) r\u00e9sident dans l&rsquo;int\u00e9gration efficace de la r\u00e9troaction des<br \/>\nexperts pour affiner le mod\u00e8le, dans la r\u00e9duction du domain gap entre donn\u00e9es synth\u00e9tiques et r\u00e9elles<br \/>\net dans l&rsquo;utilisation conjointe de ces strat\u00e9gies d\u2019apprentissage avanc\u00e9es qui rend l\u2019\u00e9tape<br \/>\nd&rsquo;entra\u00eenement particuli\u00e8rement instable.<\/p>\n<p><strong>D\u00e9fi 4. L&rsquo;IA pour les sciences physiques et chimiques<\/strong><br \/>\nCe d\u00e9fi porte sur l\u2019utilisation de l\u2019IA dans les sciences physiques \u00e0 l\u2019UBE, o\u00f9 elle transforme \u00e0 la fois les<br \/>\nm\u00e9thodologies scientifiques fondamentales et les applications pratiques dans des domaines vari\u00e9s de<br \/>\nphysique et de chimie.<br \/>\nL\u2019IA contribue \u00e0 la mod\u00e9lisation des connaissances m\u00e9tier en collaborant avec des experts pour<br \/>\nformaliser leurs savoirs implicites sous forme de mod\u00e8les explicites, comme les ontologies, enrichis<br \/>\npar des r\u00e8gles logiques. Elle exploite \u00e9galement des bases de connaissances existantes, telles que<br \/>\nBio2RDF ou GeneAI, et int\u00e8gre des processus avanc\u00e9s de nettoyage et de qualification des donn\u00e9es<br \/>\nbrutes, souvent h\u00e9t\u00e9rog\u00e8nes et multivari\u00e9es.<br \/>\nL\u2019IA joue un r\u00f4le important dans de nombreux domaines en physique : les r\u00e9seaux de neurones pour<br \/>\nla nanophotonique, les lasers intelligents et les algorithmes g\u00e9n\u00e9tiques, le design de guides d\u2019ondes,<br \/>\nl\u2019optique non-lin\u00e9aire ultra-rapide, etc. Des m\u00e9thodes de Machine Learning sont aussi utilis\u00e9es pour<br \/>\nles technologies quantiques et la spectroscopie mol\u00e9culaire, avec pour objectif principal soit<br \/>\nd\u2019identifier des param\u00e8tres de contr\u00f4le pour les syst\u00e8mes dynamiques en boucle ouverte ou ferm\u00e9e,<br \/>\nsoit de caract\u00e9riser et mesurer des param\u00e8tres \u00e0 partir des donn\u00e9es g\u00e9n\u00e9r\u00e9es.<br \/>\nL\u2019IA intervient \u00e9galement dans des domaines innovants en chimie, comme la synth\u00e8se assist\u00e9e de<br \/>\nmol\u00e9cules par activation de certaines liaisons. Elle est \u00e9galement utilis\u00e9e pour la segmentation<br \/>\nautomatique d\u2019images issues de microscopies afin d\u2019extraire des descripteurs de forme de<br \/>\nnanoparticules ou de nanocomposites, en vue de d\u00e9velopper des mod\u00e8les pr\u00e9dictifs pour la synth\u00e8se<br \/>\nde ces mat\u00e9riaux.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Contexte Cet axe du p\u00f4le IA met en avant les contributions de l\u2019UBE et les d\u00e9fis qu\u2019elle souhaite relever, des fondements th\u00e9oriques au d\u00e9veloppement de l\u2019IA, en s\u2019appuyant sur ses comp\u00e9tences en math\u00e9matiques, informatique, psychologie cognitive, etc. Ces d\u00e9fis portent sur la gestion des donn\u00e9es et des connaissances, sur les outils math\u00e9matiques derri\u00e8re les mod\u00e8les&hellip;<\/p>\n<p class=\"more-link-p\"><a class=\"btn btn-primary\" href=\"https:\/\/blog.ube.fr\/chaire-smart-city\/axe-4-creer-les-connaissances-du-futur-pour-innover-demain-des-fondements-theoriques-au-developpement-de-lia\/\">Voir plus &rarr;<\/a><\/p>\n","protected":false},"author":7968,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_exactmetrics_skip_tracking":false,"footnotes":""},"class_list":["post-2354","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/blog.ube.fr\/chaire-smart-city\/wp-json\/wp\/v2\/pages\/2354","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.ube.fr\/chaire-smart-city\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/blog.ube.fr\/chaire-smart-city\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/blog.ube.fr\/chaire-smart-city\/wp-json\/wp\/v2\/users\/7968"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.ube.fr\/chaire-smart-city\/wp-json\/wp\/v2\/comments?post=2354"}],"version-history":[{"count":1,"href":"https:\/\/blog.ube.fr\/chaire-smart-city\/wp-json\/wp\/v2\/pages\/2354\/revisions"}],"predecessor-version":[{"id":2355,"href":"https:\/\/blog.ube.fr\/chaire-smart-city\/wp-json\/wp\/v2\/pages\/2354\/revisions\/2355"}],"wp:attachment":[{"href":"https:\/\/blog.ube.fr\/chaire-smart-city\/wp-json\/wp\/v2\/media?parent=2354"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}