Leçons de Netomi pour déployer des systèmes intelligents dans l’entreprise

Leçons de Netomi pour l’échelle des systèmes agentiques dans l’entreprise

Les entreprises s’attendent à ce que les agents IA gèrent des flux de travail complexes de manière fiable, respectent les politiques par défaut, fonctionnent sous une charge importante et justifient leurs actions.

Netomi construit des systèmes qui répondent à ces exigences élevées, servant des clients du Fortune 500 comme United Airlines et DraftKings. Leur plateforme associe GPT‑4.1 pour une utilisation rapide et fiable des outils avec GPT‑5.2 pour une planification plus approfondie en plusieurs étapes, fonctionnant tous deux au sein d’une couche d’exécution gouvernée conçue pour maintenir des actions prévisibles dans des conditions de production réelles.

Leçon 1 : Construire pour la complexité du monde réel

Une seule demande d’entreprise ne correspond que rarement à une seule API. Les flux de travail réels s’étendent sur des moteurs de réservation, des bases de données de fidélité, des systèmes CRM, des logiques de politique, des paiements et des sources de connaissances. Les données sont souvent incomplètes, conflictuelles ou sensibles au temps. Les systèmes qui dépendent de flux fragiles s’effondrent sous cette variabilité.

Netomi a conçu son Agentic OS de sorte que les modèles OpenAI se situent au centre d’un pipeline d’orchestration gouverné, construit pour ce niveau d’ambiguïté. La plateforme utilise GPT‑4.1 pour un raisonnement rapide et fiable, essentiel pour les flux de travail en temps réel, et GPT‑5.2 lorsqu’une planification ou un raisonnement plus profond est nécessaire.

“Notre objectif était d’orchestrer les nombreux systèmes qu’un agent humain jonglerait normalement et de le faire en toute sécurité à la vitesse de la machine.”

Pour garantir un comportement d’agent cohérent à travers des tâches longues et complexes, Netomi suit les modèles de prompting agentiques recommandés par OpenAI :

Rappels de persistance pour aider GPT‑5.2 à maintenir le raisonnement à travers des flux de travail longs et multi-étapes.
Attentes explicites d’utilisation des outils, supprimant les réponses hallucinatoires en dirigeant GPT‑4.1 à appeler des outils pour des informations autorisées lors des opérations transactionnelles.
Planification structurée, utilisant le raisonnement plus profond de GPT‑5.2 pour esquisser et exécuter des tâches en plusieurs étapes.
Décisions multimédias riches pilotées par l’agent, s’appuyant sur GPT‑5.2 pour détecter et signaler quand un appel d’outil doit renvoyer des images, vidéos, formulaires ou d’autres éléments multimodaux.

Ces modèles aident le système à mapper de manière fiable des demandes non structurées à des flux de travail en plusieurs étapes.

Leçon 2 : Paralléliser tout pour répondre aux attentes de latence de l’entreprise

Dans des moments de forte pression — comme le rebooking pendant une tempête ou la résolution d’un problème de facturation — les utilisateurs abandonneront tout système qui hésite. La latence définit la confiance.

La plupart des systèmes IA échouent parce qu’ils exécutent des tâches de manière séquentielle : classer → récupérer → valider → appeler des outils → générer une sortie. Netomi a conçu son système pour la concurrence, tirant parti du comportement de streaming à faible latence et de stabilité des appels d’outils de GPT‑4.1.

Cette architecture assure que le système total, pas seulement le modèle, reste en dessous des seuils de latence critiques.

Leçon 3 : Faire de la gouvernance une partie intrinsèque de l’exécution

L’IA d’entreprise doit être digne de confiance par conception, avec la gouvernance tissée directement dans l’exécution. Lorsque la confiance dans l’intention tombe en dessous d’un seuil, les mécanismes de gouvernance de Netomi entrent en jeu pour déterminer comment la demande est traitée.

Au niveau technique, la couche de gouvernance gère :

Validation de schéma, validant chaque appel d’outil contre des arguments attendus avant exécution.
Application de politique qui applique des filtres de sujet, des restrictions de marque et des vérifications de conformité pendant le raisonnement et l’utilisation des outils.
Protection des données sensibles pour détecter et masquer les données sensibles lors du prétraitement.

Dans des domaines hautement réglementés comme l’assurance dentaire, ce type de gouvernance est non négociable.

Une feuille de route pour construire des systèmes agentiques qui fonctionnent pour l’entreprise

Le parcours de Netomi montre ce qu’il faut pour gagner la confiance des entreprises : construire pour la complexité, paralléliser pour répondre aux exigences de latence et intégrer la gouvernance dans chaque flux de travail. Les modèles OpenAI forment le socle de raisonnement, tandis que l’ingénierie des systèmes de Netomi garantit que l’intelligence est opérationnellement sûre, vérifiable et prête pour des environnements Fortune 500.