English | Russian |
reward-modulated | размеренно-поощряющий (напр., обучение с подкреплением с помощью размеренно-поощряющей модели синаптической пластичности, зависимой от времени импульса Alex_Odeychuk) |
reward shaping | доводка вознаграждения (в обучении с подкреплением уточнение функции вознаграждения на основе знания предметной области Valeriy_Yatsenkov) |
reward-to-go | предстоящее вознаграждение (вознаграждение, ожидаемое за выполнение следующего действия в алгоритмах принятия решений Valeriy_Yatsenkov) |
RL through reward-modulated STDP | обучение с подкреплением с помощью размеренно-поощряющей модели синаптической пластичности, зависимой от времени импульса (Alex_Odeychuk) |
sparse reward | разреженное вознаграждение (в обучении с подкреплением, когда лишь одно или несколько состояний системы приносят ненулевое вознаграждение Valeriy_Yatsenkov) |