文章基本信息

标题：Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma
本地全文：下载
作者：André Luiz Carvalho Ottoni ; Erivelton Geraldo Nepomuceno ; Marcos Santos de Oliveira 等
期刊名称：Revista Brasileira de Computação Aplicada
电子版ISSN：2176-6649
出版年度：2016
卷号：8
期号：2
页码：44-59
DOI：10.5335/rbca.v8i2.5249
语种：Portuguese
出版社：Universidade de Passo Fundo (UPF)
摘要：Nos algoritmos de aprendizado por reforço, a taxa de aprendizado (alpha) e o fator de desconto (gamma) podem ser definidos entre qualquer valor no intervalo entre 0 e 1. Assim, adotando os conceitos de regressão logística, é proposta uma metodologia estatística para a análise da influência da variação de \alpha e \gamma nos algoritmos Q-learning e SARSA. Como estudo de caso, o aprendizado por reforço foi aplicado em experimentos de navegação autônoma. A análise de resultados mostrou que simples variações em \alpha e \gamma podem interferir diretamente no desempenho do aprendizado por reforço.
关键词：Aprendizado por Reforço;Navegação Autônoma;Regressão Logística.