Quand 90 % d’un signal est absent, la reconstruction devient un problème d’inférence structurelle. Tokenisation courte, encodage positionnel 4D et inférence edge rendent l’approche viable.
Certains capteurs ne livrent qu’une fraction du signal attendu. Mesures éparses, fenêtres trouées, échantillons rares. Reconstruire un signal dont 90 % manque n’est pas du débruitage. C’est inférer la structure sous-jacente à partir de très peu de points observés.
Tokeniser court, encoder l’espace
On découpe le signal en tokens courts. Des segments brefs limitent la dérive et gardent une granularité fine sur les zones rares où chaque échantillon compte. Le modèle apprend des motifs locaux réutilisables plutôt qu’une longue séquence fragile.
L’encodage positionnel est en quatre dimensions. La position d’un échantillon ne se réduit pas à un index temporel. Elle porte sa place dans l’espace et dans le temps. Ce repère 4D permet au foundation model de raisonner sur la géométrie réelle de l’acquisition, pas sur un simple rang.
L’argument edge
Le modèle doit tourner près du capteur. La quantization réduit les poids en entiers courts sans perte notable sur cette tâche. L’empreinte mémoire chute et l’inférence CPU devient possible, sans accélérateur dédié.
Cela change l’économie du déploiement. Pas de GPU embarqué, pas de dépendance réseau pour chaque inférence. Le principe à retenir. Un foundation model bien tokenisé et bien quantifié reconstruit un signal très lacunaire au plus près de la mesure.