Sur un appareil contraint, l’inférence se heurte à la mémoire, l’énergie et la latence. Les modèles à espace d’états traitent les signaux continus à coût mémoire constant, là où les Transformer décrochent.
Sur un appareil embarqué, l’inférence n’est jamais gratuite. Trois murs se dressent. La mémoire disponible, le budget énergétique et la latence acceptable. Un modèle qui ignore ces limites ne quitte jamais le banc de test.
Pourquoi le Transformer décroche
Le Transformer paie l’attention. Son coût mémoire croît avec la longueur du contexte, car chaque token regarde tous les autres. Sur un signal continu qui ne s’arrête pas, le contexte grandit sans fin. La mémoire explose et la latence suit. L’architecture est mal adaptée au flux permanent.
Sur l’edge, ce coût croissant est rédhibitoire. On ne peut pas réserver une mémoire qui dépend d’un historique illimité. Il faut un coût borné, prévisible, indépendant de la durée du signal.
Le coût constant des SSM
Les modèles à espace d’états traitent la séquence par un état récurrent de taille fixe. Le coût mémoire reste constant quelle que soit la longueur, tout en gardant une bonne tenue du contexte long. C’est exactement le profil d’un signal continu sur appareil contraint.
L’enjeu se déplace alors vers l’intégration. Quantification des poids, gestion de la fenêtre d’état, synchronisation avec la chaîne d’acquisition. Le principe à retenir. Pour un signal continu sur l’edge, un état de taille fixe bat une attention qui grossit sans limite.