L’intelligence artificielle (IA) est en constante évolution, et les laboratoires de recherche à travers le monde sont en train de développer de nouveaux modèles pour améliorer les capacités de l’IA. Récemment, le laboratoire indien Sarvam a dévoilé une nouvelle génération de modèles de langage, qui promettent de révolutionner le domaine de l’IA. Dans cet article, nous allons explorer les détails de ces nouveaux modèles et leur impact potentiel sur l’industrie.

Les Nouveaux Modèles de Sarvam

Sarvam a dévoilé une nouvelle génération de modèles de langage, qui incluent des modèles à 30 milliards et 105 milliards de paramètres, ainsi que des modèles de texte à parole et de parole à texte. Ces modèles utilisent une architecture de mixture d’experts, qui active seulement une fraction de leurs paramètres à la fois, ce qui réduit considérablement les coûts de calcul. Les modèles sont conçus pour supporter des applications en temps réel, telles que les assistants vocaux et les systèmes de chat en langues indiennes. Les modèles ont été formés à partir de zéro, plutôt que d’être affinés sur des systèmes open-source existants, et ont été entraînés sur des trillions de jetons de texte en langues indiennes.

Les Plans de Sarvam pour l’Avenir

Sarvam a annoncé qu’il allait ouvrir les modèles à 30 milliards et 105 milliards de paramètres, bien qu’il n’ait pas spécifié si les données de formation ou le code de formation complet seraient également rendus publics. Le laboratoire a également dévoilé des plans pour construire des systèmes d’IA spécialisés, notamment des modèles axés sur la programmation et des outils d’entreprise sous le nom de Sarvam pour Work, ainsi qu’une plateforme d’agent de conversation appelée Samvaad. Sarvam a souligné qu’il allait prendre une approche mesurée pour développer ses modèles, en se concentrant sur les applications réelles plutôt que sur la taille brute des modèles. Le co-fondateur de Sarvam, Pratyush Kumar, a déclaré que le laboratoire voulait être « attentif à la manière dont nous développons les modèles », et qu’il ne voulait pas « développer les modèles de manière aveugle ».

Le Contexte et les Implications

Le lancement de ces nouveaux modèles de Sarvam s’inscrit dans le contexte d’une poussée de l’Inde pour réduire sa dépendance aux plateformes d’IA étrangères et développer des modèles adaptés aux langues et aux cas d’utilisation locaux. Le gouvernement indien a lancé l’IndiaAI Mission pour soutenir le développement de l’IA dans le pays, et Sarvam a bénéficié de l’infrastructure et du soutien technique fournis dans le cadre de cette initiative. Les nouveaux modèles de Sarvam ont le potentiel de révolutionner l’industrie de l’IA en Inde et au-delà, en offrant des solutions plus efficaces et plus abordables pour les applications de l’IA. Avec son approche mesurée et son focus sur les applications réelles, Sarvam est bien positionné pour devenir un acteur majeur dans le domaine de l’IA.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *