Align-RUDDER - Learning From Few Demonstrations by Reward Redistribution.

Vihang P. Patil, Markus Hofmarcher, Marius-Constantin Dinu, Matthias Dorfer, Patrick M. Blies, Johannes Brandstetter, Jose A. Arjona-Medina, Sepp Hochreiter

Publikation: Andere BeiträgeSonstiger BeitragBegutachtung

OriginalspracheEnglisch
Bandabs/2009.14108
PublikationsstatusVeröffentlicht - 2020
Extern publiziertJa

Dieses zitieren