マルチエージェント部分観測可能マルコフ決定過程は,不確実性が存在するマルチエージェントシステムをモデル化する手法の1つとして有名である.既存の解探索手法であるSPIDERは,エージェント間の相互作用の局所性を利用することによって大域的最適なプランを構築する.SPIDERを用いることで,エージェント間の相互作用が疎であるとき,最適なポリシーの計算時間はエージェント数の多項式オーダとなる.しかし,個々のエージェントのポリシーのサイズはポリシーの長さの指数オーダとなる.そこで本論文では,エージェントの定期的な通信を考慮し,ポリシーのサイズを削減する手法を提案する.エージェントは通信によって他のエージェントと行動履歴や観測履歴を交換すると仮定する.通信後,交換された情報をもとに更新した信念状態を新たな初期状態として用いることで,個々のポリシーの組合せ爆発を避けることができる.実験結果により,短期間ごとに通信を行えば,より長期間のポリシーを構築できることを示した.