Où tourne l'IA ? (l'infrastructure)
Comprendre où se passe réellement le calcul d'une IA, et ce que « cloud », « sur site » et « coût à l'usage » changent pour vos données et votre budget.
Quand vous posez une question à ChatGPT depuis votre poste, le calcul ne se fait pas sur votre ordinateur. Votre demande part dans un centre de données (« datacenter ») situé parfois à des milliers de kilomètres, où des machines très puissantes calculent la réponse et vous la renvoient. Comprendre ce trajet, c'est mieux maîtriser ses données et ses coûts.
Le calcul ne se passe pas sur votre poste
Un modèle d'IA moderne est bien trop lourd pour tourner sur un PC de bureau. Il vit sur des serveurs spécialisés, que l'on loue (cloud) ou que l'on installe chez soi. Votre poste ne fait qu'envoyer la question et afficher la réponse.
Cloud ou « sur site » : où vivent vos données ?
C'est la question la plus importante pour un industriel. Deux grandes options coexistent, avec un arbitrage entre facilité d'un côté, contrôle de l'autre.
- Disponible tout de suite, sans matériel à acheter
- On paie à l'usage ; la puissance s'adapte au besoin
- Maintenu et mis à jour par le fournisseur
- Mais vos données sortent de vos murs
- Dépendance à la connexion et au prestataire
- Vos données restent chez vous
- Contrôle et souveraineté renforcés
- Fonctionne même sans accès Internet
- Mais investissement matériel élevé
- Demande des compétences pour l'installer et l'entretenir
Pourquoi l'IA réclame autant de puissance
Entraîner et faire tourner un modèle demande des cartes graphiques (GPU) coûteuses et gourmandes en électricité. C'est pour cela que l'IA lourde se concentre dans de grands datacenters : peu d'entreprises peuvent s'offrir cette puissance en interne. Cette consommation a aussi un coût écologique réel, à garder en tête.
Le coût à l'usage : payer à la requête
Contrairement à un logiciel acheté une fois pour toutes, l'IA dans le cloud se paie souvent à l'usage : plus on l'utilise, plus la facture grimpe. La facturation se fait en général au « token » — un fragment de mot. Un usage massif et non encadré peut donc coûter cher, sans qu'on s'en aperçoive tout de suite.
L'IA embarquée : quand le modèle vient au terrain
Tout ne part pas forcément dans le cloud. Des modèles plus légers peuvent tourner au plus près du terrain — sur une machine, une caméra, un automate. On parle d'IA « embarquée » ou « edge ». Avantages : réponse quasi instantanée, fonctionnement sans connexion, et données qui ne quittent pas l'atelier.
