文章基本信息

标题：行動則の獲得状況を考慮した自己組織化マップによる状態空間構成法
本地全文：下载
作者：斉藤史哲 ; 長谷川修
期刊名称：知能と情報
印刷版ISSN：1347-7986
电子版ISSN：1881-7203
出版年度：2008
卷号：20
期号：3
页码：369-378
DOI：10.3156/jsoft.20.369
出版社：Japan Society for Fuzzy Theory and Intelligent Informatics
摘要：
強化学習エージェントの状態空間構成に自己組織化マップ（Self-Organizing Map：SOM）などの競合学習を行うニューラルネットを用いる方法が近年多く報告されている．これらの方法では強化学習器に Q-learningなどの環境同定型の強化学習を用いることが前提とされており，Profit Sharingにおける状態空間構成にSOMを使用したときは行動規則の学習の速さをSOMの学習が追従できない．そこで本研究では，SOMを Profit Sharingによる強化学習エージェントの状態空間構成に利用した場合においても，SOMがProfit Sharingの学習の速さを追従可能とするための“相互学習残参照型近傍関数”を提案し，その有効性をシミュレーションタスクでの実験により示す．
关键词：自己組織化マップ; 強化学習; Profit Sharing; 近傍関数; 状態空間構成