既要通過(guò)參數(shù)優(yōu)化改進(jìn)模型,又要防止對(duì)參數(shù)優(yōu)化過(guò)度擬合
A 參數(shù)高原與參數(shù)孤島
圖為參數(shù)高原
以參數(shù)高原示意圖和參數(shù)孤島示意圖為例,假設(shè)某交易模型內(nèi)有兩個(gè)參數(shù),分別為參數(shù)1和參數(shù)2,當(dāng)對(duì)兩個(gè)參數(shù)進(jìn)行遍歷測(cè)試后,得到一張三維的績(jī)效圖。好的參數(shù)分布應(yīng)當(dāng)是參數(shù)高原示意圖,即使當(dāng)參數(shù)的設(shè)置有所偏移,模型的獲利績(jī)效依然能夠得到保證。這樣的參數(shù)因穩(wěn)定性強(qiáng),可以使得模型在未來(lái)實(shí)戰(zhàn)中遇到各類行情時(shí),具有較強(qiáng)的因應(yīng)能力。但如果遍歷參數(shù)后的績(jī)效結(jié)果如參數(shù)孤島示意圖,當(dāng)參數(shù)發(fā)生小的偏移時(shí),模型的獲利績(jī)效就發(fā)生較大變動(dòng),那么這樣的參數(shù)因適應(yīng)性能差,往往難以應(yīng)對(duì)實(shí)際交易中變化多端的市場(chǎng)環(huán)境。
圖為參數(shù)孤島
一般來(lái)說(shuō),如果附近參數(shù)系統(tǒng)的性能遠(yuǎn)差于最優(yōu)參數(shù)的性能,那么這個(gè)最優(yōu)參數(shù)有可能是一個(gè)過(guò)度擬和的結(jié)果,在數(shù)學(xué)上可以認(rèn)為是奇點(diǎn)解,而不是所要尋找的極大值解。從數(shù)學(xué)角度來(lái)說(shuō),奇點(diǎn)是不穩(wěn)定的,在未來(lái)的不確定行情中,一旦市場(chǎng)特征發(fā)生變化,最優(yōu)參數(shù)可能會(huì)變?yōu)樽畈顓?shù)。
過(guò)度擬合與選取的樣本有關(guān)系,如果選取的樣本不能代表市場(chǎng)總體特征,只是為了使測(cè)試結(jié)果達(dá)到正的期望值而去調(diào)整參數(shù),這種做法無(wú)疑是自欺欺人,所得到的參數(shù)值是過(guò)度擬合的無(wú)效參數(shù)值。例如,通過(guò)分析參數(shù)過(guò)度擬合,交易模型分別在數(shù)值35和63出現(xiàn)了收益率突增現(xiàn)象,如果模型中的相應(yīng)指標(biāo)選用35和63做參數(shù),則模型的收益看上去很完美,但實(shí)際上卻是典型的參數(shù)孤島效應(yīng)。
過(guò)度擬合與參數(shù)優(yōu)化的主要矛盾在于,模型參數(shù)優(yōu)化得到的最優(yōu)參數(shù)只是建立在已經(jīng)發(fā)生過(guò)的歷史數(shù)據(jù)樣本上,而未來(lái)的行情是動(dòng)態(tài)變化的,與歷史行情相比既有相似性,也有變異性。模型設(shè)計(jì)者可以找到模型在歷史上表現(xiàn)最好的參數(shù),但是這個(gè)參數(shù)在未來(lái)模型實(shí)際應(yīng)用中未必表現(xiàn)最好,更有甚者歷史上表現(xiàn)最好的模型參數(shù),在未來(lái)模型實(shí)戰(zhàn)中可能是表現(xiàn)很糟糕的參數(shù),甚至帶來(lái)大幅虧損。比如,篩選出了一個(gè)能抓住歷史上一波大行情的一個(gè)參數(shù),但設(shè)置這樣參數(shù)值的模型,并不意味著模型在未來(lái)實(shí)戰(zhàn)中也能有如此好的表現(xiàn),這個(gè)歷史上較佳的參數(shù)值可能在未來(lái)模型的應(yīng)用中沒(méi)有起到任何幫助。
圖為參數(shù)過(guò)度擬合分析
此外,參數(shù)高原與參數(shù)孤島往往還與交易次數(shù)存在較大關(guān)系。如果模型的交易次數(shù)較少,往往能找到一個(gè)合適的參數(shù)點(diǎn),使得模型在這幾次交易中都盈利,這種參數(shù)優(yōu)化后的模型獲利體現(xiàn)出較強(qiáng)的偶然性。如果模型的交易次數(shù)較多,模型獲利的偶然性就會(huì)下降,更多地體現(xiàn)出獲利的必然性和規(guī)律性,也就會(huì)存在一個(gè)參數(shù)高原。而這種參數(shù)優(yōu)化模型才是進(jìn)行參數(shù)優(yōu)化的目的所在。
B 優(yōu)化參數(shù)的方法
在了解完參數(shù)高原與參數(shù)孤島之后,優(yōu)化參數(shù)的方法顯得很重要,特別是模型中存在多個(gè)參數(shù)(下稱參數(shù)數(shù)組)時(shí),往往一個(gè)參數(shù)的取值會(huì)影響到另外一個(gè)參數(shù)高原的分布。那么如何對(duì)參數(shù)數(shù)組進(jìn)行優(yōu)化呢?
一種方法為逐步收斂法。即先單獨(dú)對(duì)一個(gè)參數(shù)進(jìn)行優(yōu)化,取得其最佳值后固定下來(lái),然后再對(duì)另外一個(gè)參數(shù)進(jìn)行優(yōu)化,取得其最佳值后固定下來(lái)。如此循環(huán),直到優(yōu)化結(jié)果不再變動(dòng)。例如,一個(gè)均線交叉買賣交易模型,兩個(gè)獨(dú)立參數(shù)分別是均線短周期N1和長(zhǎng)周期N2。首先固定N2為1,對(duì)N1在1到100的數(shù)值范圍內(nèi)進(jìn)行測(cè)試篩選,尋找最佳數(shù)值,最終得到最佳參數(shù)為8并固定;其次對(duì)N2在1到200之間進(jìn)行優(yōu)化,得到最佳值26并固定;再次對(duì)N1進(jìn)行第二輪優(yōu)化,得到新的最佳值10并固定;最后對(duì)N2進(jìn)行優(yōu)化得到最佳值28并固定。如此循環(huán)的篩選下去,直到優(yōu)化結(jié)果不再變動(dòng)。假如最終得到的最優(yōu)參數(shù)值分別是N1為10,N2為30。至此,參數(shù)優(yōu)化工作結(jié)束。
另外一種方法是利用帶有較強(qiáng)計(jì)算功能的程序化軟件設(shè)計(jì)平臺(tái),直接算出目標(biāo)函數(shù)與參數(shù)數(shù)組之間的分布,進(jìn)而求多維差分的分布,定義一個(gè)差分閾值,差分絕對(duì)值小于閾值范圍內(nèi)對(duì)應(yīng)的多維體積最大、多維內(nèi)切球半徑最高者,入選為最穩(wěn)定參數(shù)取值。
除了參數(shù)優(yōu)化方法,數(shù)據(jù)樣本選取也是個(gè)重要因素。以趨勢(shì)跟蹤為交易思想的模型在出現(xiàn)趨勢(shì)行情時(shí)表現(xiàn)較好,以高賣低買為交易思想的策略在振蕩行情中表現(xiàn)較好。因此,在參數(shù)優(yōu)化時(shí),需要適當(dāng)剔除吻合交易思想的行情來(lái)考慮盈利,增加不吻策略思想的行情數(shù)據(jù)來(lái)考慮虧損。
以股指期貨為例,上市之初的2010年以及出現(xiàn)極端大牛市行情的2014年下半年至今,股指期貨都是單邊行情。毫無(wú)疑問(wèn),所有的趨勢(shì)模型都會(huì)取得不錯(cuò)的效果。然而如果我們把這種極端行情數(shù)據(jù)也放進(jìn)樣本中進(jìn)行參數(shù)優(yōu)化,得到的模型參數(shù)未必是最優(yōu)的。
例如,假設(shè)某個(gè)模型有兩個(gè)參數(shù),參數(shù)A的測(cè)試結(jié)果在單邊行情時(shí)段效果非常好,在其他的時(shí)段表現(xiàn)一般;另一個(gè)參數(shù)B的測(cè)試結(jié)果在單邊行情時(shí)段效果不如參數(shù)A,在其他時(shí)段的表現(xiàn)優(yōu)于參數(shù)A,各個(gè)時(shí)段之間的分布較參數(shù)A均勻。即使參數(shù)A在整個(gè)樣本數(shù)據(jù)測(cè)試的綜合指標(biāo)如風(fēng)險(xiǎn)收益高于B參數(shù),我們也更傾向于選用參數(shù)B,因?yàn)閰?shù)B相對(duì)更加穩(wěn)定,不依賴于特定樣本。
總之,在構(gòu)建程序化交易模型時(shí),一方面,可以通過(guò)參數(shù)優(yōu)化改進(jìn)模型,讓模型更好地適應(yīng)價(jià)格波動(dòng)的模式,提高投資收益;另一方面,又要防止對(duì)參數(shù)優(yōu)化的過(guò)度擬合,導(dǎo)致模型對(duì)行情變化適用性的大幅降低。
責(zé)任編輯:張文慧 |
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與本網(wǎng)站無(wú)關(guān)。本網(wǎng)站對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。
本網(wǎng)站凡是注明“來(lái)源:七禾網(wǎng)”的文章均為七禾網(wǎng) levitate-skate.com版權(quán)所有,相關(guān)網(wǎng)站或媒體若要轉(zhuǎn)載須經(jīng)七禾網(wǎng)同意0571-88212938,并注明出處。若本網(wǎng)站相關(guān)內(nèi)容涉及到其他媒體或公司的版權(quán),請(qǐng)聯(lián)系0571-88212938,我們將及時(shí)調(diào)整或刪除。
七禾研究中心負(fù)責(zé)人:劉健偉/翁建平
電話:0571-88212938
Email:57124514@qq.com
七禾科技中心負(fù)責(zé)人:李賀/相升澳
電話:15068166275
Email:1573338006@qq.com
七禾產(chǎn)業(yè)中心負(fù)責(zé)人:果圓/王婷
電話:18258198313
七禾研究員:唐正璐/李燁
電話:0571-88212938
Email:7hcn@163.com
七禾財(cái)富管理中心
電話:13732204374(微信同號(hào))
電話:18657157586(微信同號(hào))
七禾網(wǎng) | 沈良宏觀 | 七禾調(diào)研 | 價(jià)值投資君 | 七禾網(wǎng)APP安卓&鴻蒙 | 七禾網(wǎng)APP蘋果 | 七禾網(wǎng)投顧平臺(tái) | 傅海棠自媒體 | 沈良自媒體 |
? 七禾網(wǎng) 浙ICP備09012462號(hào)-1 浙公網(wǎng)安備 33010802010119號(hào) 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證[浙B2-20110481] 廣播電視節(jié)目制作經(jīng)營(yíng)許可證[浙字第05637號(hào)]
技術(shù)支持 本網(wǎng)法律顧問(wèn) 曲峰律師 余楓梧律師 廣告合作 關(guān)于我們 鄭重聲明 業(yè)務(wù)公告
中期協(xié)“期媒投教聯(lián)盟”成員 、 中期協(xié)“金融科技委員會(huì)”委員單位