EAの汎化性能を上げるには

2021-09-19 2023-04-26

この投稿文は次の言語で読めます: 日本語

投稿から随分日が空いてしまいました。

本業に追われ続け、EA開発は隙間時間で細々と対応してきましたが、ようやく実装が終わり検証工程に入りました。

前回EAの反省を踏まえ、様々な機能の改修を繰り返し、ようやく検証結果をまとめる段階になりましたが、

運用成績に直結する運用パラメータ選出のための手順(パラメータの最適化～最終候補確定)について従来の進め方に問題を感じていましたので、再検討してみました。

Contents

何が問題？

ナンピン系EAのパラメータ最適化を行う際、厄介な問題があり、単純にMT5の遺伝的最適化によって優良なパラメータセットを得たとしても問題が残ります。

ナンピン系EAはある程度の含み損を覚悟し、それを資金量の大きさで耐えながら利確を行い更に残高を増やしていくことになるのですが、

10年など長期でバックテストをした場合、前半で積み上がった確定利益があったがゆえに、後半の含み損に耐えられ、トータルでは良好な成績に見えてしまうケースが散見されます。

つまり、2009/01/01~2020/12/31で最適化したパラメータを、2020/01/01~2020/12/31 の期間で運用した場合、 2020/01/01時点の資金量の違いがあるため

前者は含み損に耐え良好な結果に見える(=訓練時の性能は高い)一方で、後者はロスカットに到達してしまう(=汎化性能が低い)というケースがあります。

この問題は、以前から認識していたものの、バックテストの残高推移グラフから目視確認で汎化性能が低いケースを除外する程度だったので、

その対応品質(量、質)が不十分だったと考えられます。

蓄積した資金量による挙動の違いが問題になるため、同一パラメータを異なる開始日からスタートして、それらの結果も含めて総合的に判断することで、従来よりは汎化性能を上げられるのでは、と考えました。

イメージとしてはウォークフォワードテストのようなものです。(厳密な定義は異なると思いますが)

2009/01/01~2020/12/31でパラメータ最適化を行い、上位数十件の良好なパラメータを選出する
- 4通貨ペア x 売買(2ケース) x 6期間足に対して、各最適化(1最適化あたり約15,000パターン(遺伝的最適化)) = 720,000パターンのテストを実施し、スコアはカスタム指標生成、上位パラメータを絞り込む

選出した各パラメータに対し、運用期間を変更したパターン(12年間、11年間、10年間、・・・・1年間)のバックテストを実行する
- 4通貨ペア x 売買(2ケース) x 6期間足の上位パラメータ各30件選出 x 評価期間12パターン = 17,280パターン

従来、この17,280パターンを目視確認することが難しかったために主観に頼っていたのですが、これの自動化を行い客観的に評価をしてみます。

これの一部を改修して、同一の最適化パスに対し期間のみ変更したバックテストを12回行うように変更しました。

最適化結果、pass別パラメータ、個別バックテスト結果は出力結果ファイルを AWS S3 へ連携し、 Athenaを介して標準SQLによる照会ができるようにしつつ、

個別バックテストレポートイメージやMT5にインポート可能なパラメータファイルはConfluenceに自動ページ作成、ファイルアップロードし使用性を担保しています。

→従来、Confluenceに自動ページ作成する件数は手順の問題もありせいぜい数百件程度だったのですが、今回は17,000件ということで数十倍のオーダーになりました。

これだけページ数が増えるとページツリーの読み込みだけでもかなり時間がかかる上に、全文検索では意図したページを特定しきれない問題が発生・・・

ページを探す手順も再検討が必要になりました。

Tableau は異なるデータセットを単一ダッシュボードに読み込んだり、関連付けて使用することができるため、

S3～Athenaの情報と Confluenceページを関連付けて閲覧できるようにしました。

箱ヒゲ図(左上)は値の分布と中央値確認用。各最適化結果の上澄部分を同じ件数抜き出しても、
同一通貨ペアでも買い中心エントリと売り中心エントリで成績に大きく差があったりしますので、全体的な傾向を掴むために表示しています。
ヒートマップ(左下)は、同じ最適化パスを行でまとめ、テスト期間の違いを列方向に並べています。
右端の総計は、期間別12パターンをまとめたものですが、その数値自体の意味合いを問うわけではなく、全体的なスコアの良し悪しをみるためのソート順程度の意味合いです。
ヒートマップ内の1セルが1バックテストの扱いになりますので、このセルをクリックすると画面右側のConfluenceページに該当バックテスト結果レポートが表示されます。