Déployez instantanément l’IA générative avec NVIDIA NIM

Accédez à de nouveaux modèles d’IA créés par la communauté avec une API optimisée et accélérée par NVIDIA, puis déployez vos applications n’importe où grâce aux microservices NVIDIA NIM pour l'inférence.

Essayer Voir la vidéo

Tester maintenant

Expérimentez nos modèles ouverts dès maintenant

Intégrations

L’IA accélérée n’est plus qu’à une portée d’API

Mettez en œuvre rapidement vos projets avec des API aux performances reconnues.

Compatibilité totale avec des bibliothèques populaires

Use NVIDIA APIs from your existing tools and applications with as little as three lines of code.

Créez avec vos outils de prédilection

Travaillez avec vos frameworks de programmation de LLM favoris, tels que Langchain et LlamaIndex, et déployez facilement vos applications.

Learn More About Building With These Tools and NVIDIA NIM

Obtenez des informations à partir des données d'entreprise

Les données alimentent les applications d'entreprise. Connectez des agents d'IA à des données d'entreprise en toute évolutivité grâce à un moteur de requêtes optimisé par l'IA qui utilise la génération augmentée par récupération (RAG) pour répondre aux attentes des employés en leur donnant accès à des ressources institutionnelles de manière instantanée et pertinente.

NVIDIA Blueprints

Accédez à tout ce dont vous avez besoin pour créer des applications d'IA générative à haute valeur ajoutée. Chaque modèle comprend des microservices de NVIDIA NIM et de ses partenaires, un ou plusieurs agents d'IA, un exemple de code, des instructions de personnalisation et un graphique Helm pour le déploiement.

Essayer maintenant

Exécution multiplateformes

Accélérez votre déploiement de l'IA avec NVIDIA NIM

Composant de l'environnement logiciel NVIDIA AI Enterprise, NVIDIA NIM regroupe un ensemble de microservices pour l'inférence d’une grande simplicité d’utilisation vous permettant d’accélérer le déploiement des modèles de fondation sur n’importe quel Cloud ou Data Center tout en préservant la sécurité de vos données.

Déployer

Accelerate Your AI Deployment With NVIDIA NIM

En savoir plus sur NVIDIA NIM

Découvrir comment déployer NIM en cinq minutes

Déployez NIM

Déployez NIM pour votre modèle avec une seule commande. Vous pouvez également exécuter NIM avec des modèles ayant fait l'objet d'un réglage de précision.

Exécutez vos algorithmes d'inférence

Procédez à la mise en service de NIM en utilisant un moteur d’exécution sélectionné en fonction de votre infrastructure accélérée par NVIDIA.

Optimisez votre application

Les développeurs peuvent intégrer des points de terminaison NIM auto-hébergés en ayant recours à quelques lignes de code seulement.

Deploy

Run

Build

docker run nvcr.io/nim/publisher_name/model_name

 
 curl -X 'POST' \ 
  'http://0.0.0.0:8000/v1/completions' \ 
  -H 'accept: application/json' \ 
  -H 'Content-Type: application/json' \ 
  -d '{ 
  "model" : "model_name", 
  "prompt" : "Once upon a time", 
  "max_tokens" : 64 
 }' 

 
 import openai 
 client = openai.OpenAI( 
  base_url = "YOUR_LOCAL_ENDPOINT_URL", 
  api_key="YOUR_LOCAL_API_KEY" 
 ) 
 chat_completion = client.chat.completions.create( 
  model="model_name", 
  messages=[{"role" : "user" , "content" : "Write me a love song" }], 
  temperature=0.7 
 ) 

Lancement en local ou à l'échelle avec Kubernetes

Déployez en toute transparence des microservices d'IA conteneurisés sur n'importe quelle infrastructure NVIDIA accélérée, que ce soit sur un appareil unique ou via des Data Centers.

Déployez vos applications en toute confiance

Appuyez-vous sur des environnements d'exécution adaptés à la production avec des mises à jour de sécurité disponibles en continu, et exécutez vos applications commerciales avec des API stables tout en bénéficiant d’une assistance technique pour les entreprises.

Réduisez les coûts et votre empreinte carbone

Réduisez les coûts d’exploitation relatifs aux modèles en production, grâce à des environnements d’exécution d’IA continuellement optimisés pour fournir une faible latence et un rendement élevé sur une infrastructure accélérée par NVIDIA.

Débit

NVIDIA NIM fournit une latence et un débit immédiatement optimisés pour maximiser la génération de jetons, prendre en charge une grande densité d'utilisateurs aux heures de pointe et améliorer la réactivité de manière significative.

Configuration : Llama3.1-8B-instruct, 1x H100SXM ; 1 000 jetons d'entrée pour 1 000 jetons de sortie. Demandes simultanées : 200. Avec NIM : FP8 pour un débit de 6 354 jetons/s ; TTFT : 0,4 s, ITL : 31 ms. Sans NIM : FP8 pour un débit de 2 265 jetons/s ; TTFT : 1,1 s, ITL : 85 ms.

Personnalisation

Adaptez les microservices NIM aux besoins spécifiques de votre secteur

Réglage fin avec NVIDIA NeMo

NVIDIA NeMo™ est une plateforme de bout en bout dédiée au développement multifactoriel d’une IA générative sur mesure, qui comprend des outils pour l’entraînement, la personnalisation, la génération augmentée par récupération (RAG), le guardrailing, la conservation des données et le pré-entraînement des modèles, offrant ainsi aux entreprises une méthode simple, rentable et rapide pour adopter l’IA générative.

Lire l'article technique

Suivre les didacticiels

Découvrez NVIDIA NIM à l’œuvre

Parlez aux données de votre chaîne logistique avec NVIDIA NIM

Accélérez le déploiement logiciel avec la RAG basée sur les événements

Agents d'IA générative pour la Santé en temps réel et à disponibilité constante

Les humains numériques transforment l'industrie

Microservices d'IA générative pour le dépistage virtuel

Acheter des Solutions

Lancez vos projets

Commencez le prototypage gratuitement

Commencez avec des API sans serveur gérées par NVIDIA, d'une grande simplicité d'utilisation.

Accédez à une infrastructure d'IA entièrement accélérée.
Assurez-vous que vos données ne sont pas utilisées pour l'entraînement de modèles.
Commencez gratuitement avec 1 000 crédits d'inférence.

Téléchargez et déployez

Exécutez NVIDIA NIM pour faire évoluer des modèles d'IA optimisés dans le Cloud ou le Data Center de votre choix.

Assurez-vous que les données ne quittent jamais votre enclave sécurisée.
Opérez une transition fluide des points de terminaison Cloud aux API auto-hébergées sans modification de code.
Utilisez une licence NVIDIA AI Enterprise pour la production, ou commencez gratuitement avec le Programme NVIDIA Développeurs.

Commencer

Créer des modèles d'IA générative personnalisés avec NVIDIA AI Foundry

Accédez à des modèles de fondation, à des logiciels d'entreprise, à des capacités de calcul accéléré et à une expertise avancée en IA pour concevoir, optimiser et déployer des modèles sur mesure pour vos applications d'entreprise.

Commencer

Cas d'utilisation

Innovez librement

Prenez connaissance d'exemples soigneusement sélectionnés pour découvrir comment les API de NVIDIA peuvent prendre en charge des cas d’utilisation spécifiques à chaque secteur et accélérer le développement de l’IA.

Entités numériques

Donnez vie à des personnages de jeux vidéo ou créez des avatars virtuels interactifs pour améliorer le service à la clientèle, permettant ainsi à votre application d'interagir avec les utilisateurs de manière plus percutante.

Génération de contenu

Générez du contenu sur mesure, pertinent et précis, basé sur l’expertise et les propriétés intellectuelles de votre entreprise.

Génération biomoléculaire

Les modèles biomoléculaires génératifs et l'importante puissance de calcul des GPU de NVIDIA permettent d’explorer efficacement l’espace chimique, de manière à générer rapidement divers ensembles de petites molécules pour étudier des propriétés ou des cibles pharmacologiques spécifiques.

Écosystème

Faites passer vos initiatives d'IA au niveau supérieur

Rejoignez nos partenaires de renom pour développer vos applications d’IA avec des modèles, des kits d’outils, des bases de données vectorielles,
des frameworks et une infrastructure de pointe reposant sur un écosystème leader du secteur.

Ressources

Lancez, améliorez et faites évoluer vos projets

LaunchPad

Lancez votre projet d'IA en suivant un atelier pratique

Expérimentez la puissance phénoménale de l'IA en utilisant des solutions de bout en bout via des ateliers pratiques guidés portant sur des sujets tels que les chatbots basés sur la RAG, la recherche pharmaceutique et l’optimisation d’itinéraires.

Accédez àLaunchPad

Deep Learning Institute

Améliorez votre expertise en IA

Que vous soyez un particulier cherchant à personnaliser son programme de formation ou une entreprise souhaitant acquérir de nouvelles compétences, le NVIDIA DLI vous donne accès à des cours sur l’IA générative, la Data Science et bien plus encore.

Formez-vous avec le DLI

AI Workbench

Commencez modestement, puis prenez de l'envergure

NVIDIA AI Workbench permet aux développeurs d’exécuter en toute flexibilité des modèles enrichis par des API sur des conteneurs accélérés par GPU en local ou à distance, ce qui permet de mettre en œuvre des workflows de projet à haut degré d’interactivité, de l’expérimentation au prototypage jusqu'à la preuve de concept.

En savoir plus sur AI Workbench

Actualités

Suivez l'actualité de NVIDIA NIM

Consultez les communiqués de presse les plus récents de NVIDIA pour prendre connaissance de l’impact de NIM et de l’IA générative vis-à-vis de différents domaines, partenaires, clients et bien plus encore.

Documentation

Consultez notre documentation technique pour commencer à prototyper et à développer vos applications d’IA d’entreprise avec les API de NVIDIA.

Doc sur les API de NVIDIA Doc sur NVIDIA NIM