Ein Problem bei der Bildklassifizierung ist, dass ein Modell bei Eingabedaten, die aus der gleichen Verteilung stammen wie die für das Modelltraining verfügbaren Daten, gut abschneidet, aber bei Daten, die außerhalb der Verteilung liegen (out-of-distribution, OOD), viel schlechter abschneidet. In diesem Papier wird die erste OOD-Erkennungsarchitektur namens OODformer vorgeschlagen, die die Kontextualisierungsfähigkeiten eines Transformators nutzt.