確率システム論
2021.07.12
第1部 基礎編【1〜9章】
第2部 応用編【10〜14章】
1. はじめに
本書の構成
準備
2. 確率と統計
確率分布モデル
統計量
統計的推論
3. 確率システム
確率過程
線形確率システム解析
4. 確率制御
最適制御
- 因果性とフィードバック制御
- 動的計画法
- 【オプション】随伴法
線形最適制御
- 線形二次レギュレータ
- 【オプション】リスク鋭敏型制御
5. 状態推定
状態推定
- 統計的推論としての定式化
- 線形システムの可観測性と最尤初期状態推定
逐次推定
- 線形システムの逐次予測
- 線形二次ガウシアン制御
- カルマンフィルタ
軌道のMAP推定と最適制御の双対性
6. 最適制御(無限時間区間)
減衰係数
- 線形システムの安定性
- 無限区間最適制御
- 価値反復法
無限区間線形最適制御
- 無限区間線形二次レギュレータ
- 【オプション】最適H2制御
7. 統計的学習
【オプション】事前分布
間数回帰
特徴量抽出
8. システム同定
最小二乗法
スペクトル法
- 正準相関解析と確率実現
- モデル低次元化と動的モード分解
9. 強化学習
最適制御と強化学習
モデルベースト設計
モデルフリー設計
- TD学習
- アルゴリズム例
- 【オプション】部分観測問題
10. エントロピーとロバスト性
エントロピー正則化
分布的ロバスト性
11. マルコフ連鎖と平衡状態
有限状態確率システム
- ベルマン方程式と線形計画法
- 線形可解マルコフ決定過程
漸近挙動
12. 数理最適解
凸最適化
統計的学習のための最適化
13. ガウス過程回帰
カーネル法
- 半正定値カーネル
- ガウス過程回帰
- 【オプション】再生核ヒルベルト空間
ガウス過程回帰状態空間モデル
14. おわりに
連続時間確率システムへの接続
展望
付録
測度論的確率論
システム同定・状態推定に関する補足
定理の証明
- フィッシャー情報行列
- 生成モデルの敵対的学習
- 方策勾配定理
- min-max 問題に関する双対性
- マルコフ連鎖の漸近特性
- 確率勾配法