L'estimation d'une fonction de régression par un modèle paramétrique en présence d'une variable explicative bruitée conduit à une estimation biaisée et non consistante si on ne prend pas en compte l'incertitude en entrée du modèle. Des solutions existent pour la prise en compte de cette incertitude dans le cadre des modèles linéaires et non linéaires classiques. Cependant, elles ne sont pas adaptées aux réseaux de neurones. En utilisant l'approximation variationnelle gaussienne combinée à une modélisation jointe de la variable explicative entachée d'erreur et de la variable dépendante, nous proposons une approche permettant de prendre en compte l'incertitude en entrée du réseau tout en préservant une simplicité d'entraînement similaire à celle du cas standard d'un apprentissage sur des entrées non bruitées. De plus cet apprentissage peut se faire en mode distribué. Nous validons notre approche sur des données simulées ayant des caractéristiques similaires aux données réelles de datation par le carbone 14 en archéologie qui ont motivé ce travail.