Aby sztuczna inteligencja mogła rozpoznawać i odróżniać obiekty, musi najpierw zostać „wytrenowana”. Tak zwana konwolucyjna sieć neuronowa (CNN) składa się z kilku kolejnych warstw, które w fazie treningowej uczą się rozpoznawać różne cechy obrazu i przekazywać te informacje do kolejnej warstwy w sekwencji. Podczas gdy pierwsze warstwy rozpoznają raczej prymitywne cechy, takie jak proste linie, kolory i krzywe, kolejne warstwy specjalizują się w bardziej złożonych kształtach
If artificial intelligence is to recognise and distinguish between objects, it needs to be “trained” first. The so-called convolutional neural network (CNN) consists of several subsequent layers, which learn to recognise different features of image at the training stage and provide this information to the subsequent layer in a sequence. While the first layers recognise rather primitive features such as straight lines, colours and curves, the subsequent layers are specialised in more complex shapes.