AG 2024 de CapDigital : débat sur l’Avenir du Numérique et de l’IA

AG 2024 de CapDigital : débat sur l’Avenir du Numérique et de l’IA

J’étais dernièrement, dans le cadre de l’Assemblée Générale 2024 de nos amis de Cap Digital invité à prendre part à un grand débat autour de l’avenir du numérique à l’heure des IA génératives. Je suis aussi revenu à cette occasion sur mes convictions en ce qui concerne l’innovation, son financement et l’avenir de la Tech en France et en Europe. LINAGORA a toujours été profondément engagée dans la promotion d’un écosystème numérique ouvert et souverain et à titre personnel, j’ai bien évidemment aussi toujours porté cette même vision avec passion et détermination.

“En France, on passe notre vie à essayer de créer des champions du numérique français, à l’instar de la façon dont les États-Unis ont créé les champions numériques, mais on se trompe[…] On n’a pas besoin de ces géants du numérique en Europe”

Qu’est qu’une IA réellement Open Source?

La définition de ce que nous appelons une IA générative ouverte est pour nous très stricte et précise. Nous parlons d’IA réellement Open Source, car nous assistons aujourd’hui à beaucoup d’Open Source washing, où des entreprises utilisent le terme sans en respecter les principes fondamentaux.

« Une IA vraiment Open Source doit être sans aucune restriction d’usage, avec des méthodes d’entraînement et des datasets publics et accessibles. »

Pour qu’une IA soit réellement Open Source, il faut que l’ensemble des méthodes d’entraînement soit publique et partagé. De plus, il faut fournir les datasets qui ont permis l’entraînement de l’IA. Et pas simplement se contenter d’indiquer quels sont les datasets, mais bel et bien de les fournir, et bien évidemment, sous une licence qui permette un réentraînement du modèle fondation.

Oui ma position est un peu radicale, je l’assume et c’est normal, LINAGORA est un acteur pionnier du logiciel libre, et c’est la vocation de notre entreprise que de créer les voies et les moyens d’une réelle souveraineté numérique en Europe. Nous parlons depuis toujours de troisième voie numérique.

Un Combat pour la Souveraineté Numérique de l’Europe

« Nous sommes convaincus que pour faire de l’IA souveraine, il faut avoir une IA réellement Open Source. »

Encore une fois, LINAGORA, en tant qu’acteur pionnier du logiciel libre, se positionne fermement en faveur d’une souveraineté numérique européenne. Nous avons une mission claire : offrir une alternative crédible aux géants du numérique. Et pour ce faire, nous croyons qu’il est essentiel de développer un écosystème diversifié, avec une multitude de petites et moyennes entreprises, pour renforcer notre indépendance technologique.

« Nous ne devons pas cracher dans la soupe, mais plutôt célébrer les réussites tout en cultivant une biodiversité numérique. »

LUCIE : l’IA générative réellement Open Source développée par la Communauté OpenLLM

Grâce à des initiatives telles que notre projet d’IA fondation nommé LUCIE, développé au sein de la communauté OpenLLM-France, nous démontrons qu’il est possible de créer des IA génératives réellement open source. Ce projet bénéficie du soutien des supercalculateurs français comme Jean Zay, permettant des avancées significatives.

« Fin septembre, nous aurons une première IA réellement open source qui répond aux critères les plus stricts que nous avons définis. »

Les modèles d’IA Open Source ont aussi un modèle économique durable

Il est crucial de ne pas opposer Open Source et modèles propriétaires. Les deux peuvent coexister et répondre aux besoins variés des entreprises. Cependant, il est également vital de soutenir les modèles Open Source pour garantir une diversité d’acteurs et d’approches dans le domaine de l’IA.

« La question n’est pas seulement économique, mais aussi civilisationnelle : quels modèles de société et de culture voulons-nous porter à travers nos technologies ? »

La question de la préservation des langues est centrale. Prenons l’exemple du français, le français c’est quand même 0,2 % de LLAMA, 0,18 % pour l’allemand, c’est dramatique, ça veut dire que 90 % de la façon dont les datas ont été utilisées pour entraîner LLAMA sont des datas de langue anglaise. Il y a une sous-représentation de l’ensemble de nos langues dans ces modèles, et c’est pour ça que c’est dramatique. Ces modèles ne portent pas nos valeurs, notre culture.

En tant qu’entrepreneur et défenseur du logiciel libre, je suis convaincu que notre approche rigoureuse et notre engagement envers l’open source sont essentiels pour assurer une souveraineté numérique durable et équitable. Chez LINAGORA, nous resterons fidèles à notre mission, en espérant inspirer d’autres à rejoindre ce mouvement pour un futur numérique plus ouvert et souverain.

Ensemble, continuons à construire un avenir numérique où innovation rime avec liberté et indépendance.