És un procés equivalent al de l’aprenentatge de les xarxes neuronals que regeixen el comportament del robot. Pot seguir diferents mètodes: l' aprenentatge directe , que es limita a seguir les instruccions d’un programa; l' aprenentatge supervisat , en què el robot parteix d’una informació classificada i opta per la solució adequada en cada cas en funció dels senyals de realimentació que vagi rebent; l' aprenentatge no supervisat , en el qual la informació inicial no està classificada i el robot ha d’utilitzar mètodes estadístics per a decidir quina ha d’utilitzar en cada cas; l' aprenentatge per reforçament , en què la informació depèn íntegrament de la realimentació; o l' aprenentatge per transducció , similar al supervisat, però basat en l’estadística i no en la realimentació.