返回網站

認識過度最佳化:Overfitting

By研究員Beta

· 程式交易基礎知識

策略是否有Overfitting的問題,應該是每位程式交易者撇除網路斷線、系統不穩等軟硬體問題後,最為擔心的事情。

Overfitting這個詞是源自於統計學的領域,翻譯成中文除了大家常聽到的過度最佳化之外,也稱作過適、過度擬和。大意是指在調適一個統計模型時,使用過多參數。

如果搜尋維基百科,將有以下非常饒口的解釋:

broken image

很饒口對吧,但如果將這個解釋套用在交易上並翻成白話,意思其實很簡單,就是如果策略的參數過多,實際運用在交易就很難擁有像歷史績效表上那樣的獲利。

不過維基百科也有補充:過適的可能性不只取決於參數個數和資料,也跟模型架構與資料的一致性有關。

意思是當一個策略如果真的有Overfitting問題時,除了參數過多這個原因之外,也跟邏輯架構有關。除了這兩點,我認為也跟這套參數是否是"參數孤島"有關。

而這樣的概念其實相當符合我們的交易經驗,因為我們的組合裡,有不少多參數策略的獲利近期持續再創新高,因此確實能夠說明過適現象並不只取決於參數的多寡而已。(當然也不乏表現差強人意的)

像上週的文章有分享,alpha的策略組裡,有些策略的參數可以到十個以上,但績效卻依然可以持續創高。

但要注意的是,不是任何參數多的策略都可以上線,一定還需要有其他的衡量標準才行。

例如alpha就認為參數多的策略,交易次數也要夠多才行。
因為交易次數多,就意味著有較高的重現性。

像這支策略的參數一共有12個,但從完成至今已過了一段時間,但至今獲利卻仍然可以持續創新高。

broken image

因此參數是否過多,並不是發生Overfitting的唯一原因。

最後,我們來做個重點總結:
不論參數多寡與過去績效多好,任何策略遲早都會遇到無法應付的盤勢,也都會有Overfitting的可能。

因此、是否擁有互補性高的多策略模組,以及資金控管、策略控管等風控措施是否正確,才是交易這條路是否能走得順利、走得長遠的重要關鍵。