Inference De Modele - Search News

Model Vault : Cohere adapte ses modes de déploiement « privés » à l'IA agentique

Le fournisseur de LLM canadien a annoncé Model Vault, une plateforme SaaS dédiée sous la forme d’un cloud privé virtuel isolé ...

Zonebourse

NVIDIA lance des plates-formes d'inférence pour les grands modèles de langage et les charges de travail d'IA générative.

NVIDIA a lancé quatre plates-formes d'inférence optimisées pour un ensemble varié d'applications d'IA générative qui émergent rapidement, aidant les développeurs à créer rapidement des applications ...

LeMagIT

IA générative : pourquoi l’inférence sur CPU prend de l’ampleur

Quand il est question d’IA générative et de grands modèles de langage, difficile de ne pas évoquer Nvidia. Le concepteur fabless d’accélérateurs de calcul est devenu la coqueluche des marchés ...

Le Monde Informatique

Inférence IA : 5 leviers pour optimiser les coûts, sécuriser les déploiements et stimuler l'innovation

Evoquer l'intelligence artificielle revient souvent à porter l'attention sur l'entraînement d'énormes modèles de deep learning, mobilisant des milliers de GPU pendant plusieurs semaines. Pourtant, la ...

journaldunet.com

De l'inférence à l'entrainement, AWS muscle ses outils dédiés à l'IA générative à re:Invent 2024

Swami Sivasubramanian, VP AI et Ddta d'AWS, annonce l'arrivée de nouvelles fonctionnalités pour entraîner et inférer plus facilement les modèles d'IA générative tout en réduisant (encore) les coûts.

ChannelBiz sur NetMediaEurope

OpenShift AI 2.20 : Red Hat déploie un catalogue de modèles IA validés

À l’occasion du Red Hat Summit 2025, l’éditeur open source met en avant son Red Hat AI Inference Server, de nouveaux modèles validés par des tiers, et l’intégration des API Llama Stack (Meta) et MCP ...

Intelligence artificielle : Microsoft défie Nvidia avec Maia 200, sa puce spécialisée pour l’inférence

Bientôt, les data centers de Microsoft seront majoritairement équipés de ses propres puces pour l’intelligence artificielle, ...

Zonebourse

Red Hat ouvre la voie à l'IA générative pour tous les modèles et tous les accélérateurs dans le cloud hybride avec Red Hat AI.

Red Hat, Inc. a annoncé Red Hat AI Inference Server, une étape importante vers la démocratisation de l'IA générative (gen AI) dans le cloud hybride. Nouvelle offre de Red Hat AI, ce serveur ...

Show inaccessible results