設(shè)為首頁 | 加入收藏 | 今天是2024年11月18日 星期一

聚合智慧 | 升華財富
產(chǎn)業(yè)智庫服務(wù)平臺

七禾網(wǎng)首頁 >> 程序化交易 >> 程序化交易知識庫

如何基于(超)高頻數(shù)據(jù)作配對交易?

最新高手視頻! 七禾網(wǎng) 時間:2016-06-29 13:55:36 來源:知乎 作者:郭小賢

高頻數(shù)據(jù)大多“罔不因勢象形,各具情態(tài)”,其中就包括數(shù)據(jù)非等間距問題。我們?yōu)榱丝朔@些irregularities,我們就要對數(shù)據(jù)重新表示(re-representation)。


高頻價格數(shù)據(jù)的非等間距問題是首當(dāng)其沖要解決的。解決的辦法一般就是resampling。比如可以自己定義一個時間間隔(segment),重新抽樣。這時候的抽樣可以直接取用截點的數(shù)據(jù)(如圖1),或者取每個間隔內(nèi)數(shù)據(jù)的均值(如圖2),根據(jù)你的具體情況而定。還有也可以使用線性插值法(linear interpolation)。


圖一

圖二


上面提到的方法還僅限于高頻時間序列在時域(time domain)中的重新表示,但哪怕我們使用的是等間隔的高頻收盤價數(shù)據(jù),如果間隔做得比較小,數(shù)據(jù)的噪聲仍然是不可避免的,這就涉及一個頻域(frequency domain)的問題。那么對數(shù)據(jù)做去噪(de-noisying)或者平滑(smoothing)是一個很直接的做法。比如小波去噪(wavelet de-noising)后再做協(xié)整檢驗。或者更學(xué)術(shù)的做法是使用離散小波變換(DWT)把低頻方差和高頻方差分解開來,然后把低頻和高頻的小波系數(shù)留下來,將其納入到協(xié)整檢驗中來,成為一個專用于高頻數(shù)據(jù)協(xié)整檢驗的算法。


其實,高頻數(shù)據(jù)更有利用價值的還是order book。這類數(shù)據(jù)要是不去研究利用就太可惜了。與價格、成交量之類的time-series不同,order book這類sequence數(shù)據(jù)并不需要設(shè)置抽樣點,而是直接把每個時間點上的數(shù)據(jù)當(dāng)作一個事件,設(shè)定或者擬合一個針對這些事件序列(event sequences)的概率分布。比如著名的Rama Cont[注2]就把order arrival設(shè)定為服從泊松分布,每次order arrival都是獨立的,order arrival rate則服從指數(shù)分布。


當(dāng)然如果你有簡化數(shù)據(jù)的需要,也可以提取關(guān)鍵數(shù)據(jù)點,只是這些關(guān)鍵數(shù)據(jù)點不需要是等間隔的。(如圖3)


圖3


按照上述方法處理好高頻數(shù)據(jù)后,將協(xié)整[注1]的配對股票構(gòu)建一個contingent order,以兩者的mid-price之差作為spread,觸發(fā)交易信號的閾值也可以沿用你習(xí)慣的方法來計算??傊?,在中低頻統(tǒng)計套利中常用的entry-exit strategy都可以作為一個框架拿過來使用,無需贅言。


但任何高頻的交易環(huán)境下的問題都可以成為這個高頻統(tǒng)計套利策略的問題,其中最突出的問題之一就是滑點。我聽說有人做過測試,如果每次成交都增加一個tick的滑點,全年的收益就沒了。


那么這時候我們可不可以再研究研究order book的變化規(guī)律,特別是其中bid/ask的變化規(guī)律,摸索出一種計算在mid-price變動之前,配對股票的bid/ask上的orders得到執(zhí)行的概率,然后根據(jù)這些概率判斷剛剛觸發(fā)的交易信號能否得到執(zhí)行。這樣也同時可以規(guī)避那些bid-ask價差過大的情況。


我們知道order book的變化就來源于每個價位上的市價單、限價單和撤單指令的flow,每個flow都可以看作一個counting process。有很多實證研究表明,order arrival rate與之到bid/ask的距離有關(guān)。Rama Cont[注2]把每個價位上的未成交訂單的數(shù)量的變化規(guī)律看作一個birth-death process,其中每一個event(包括市價單、限價單和撤單指令)都是獨立泊松過程:


其中D(·)為death process,xt*θ(p)代表order cancellation rate,μ代表market order arrival rate,B(·)為birth process,λ(p)代表limit order arrival rate,p代表對應(yīng)的價格。為了建模的簡便,我們假設(shè)每一個未成交訂單被取消的概率都是相等的,也是獨立的。


然后就可以用Monte Carlo模擬出在mid-price變動之前,配對股票的bid/ask上的orders得到執(zhí)行的概率。與此同時,因為這個birth-death process是可以有解析解的,所以Rama Cont用拉普拉斯變換求逆推導(dǎo)出這個概率。推導(dǎo)過程比較復(fù)雜,就不寫出來了。做個回測,兩種方法得到的結(jié)果相近(詳見[注2])

(數(shù)值模擬得到的結(jié)果)

(拉普拉斯變換得到的結(jié)果)

分別對你的配對股票求取這個概率。當(dāng)概率高于你預(yù)設(shè)的閾值時,這次交易可以認(rèn)定為在mid-price變動之前,bid/ask order可以得到執(zhí)行,故以限價單分別以bid/ask價位執(zhí)行建倉。平倉同理。


Rama Cont的模型見仁見智。有的人認(rèn)為太復(fù)雜,也有的人覺得太粗糙。譬如Rama Cont把order arrival看作泊松過程,order duration服從指數(shù)分布。但泊松過程太粗糙了,隨便拿出一個log化的概率分布根本不成線性的,而且如果對log(duration)做一個自相關(guān)系數(shù)圖,你會發(fā)現(xiàn)是拖尾的,也就是個AR過程。另外,等概率的馬爾科夫鏈的假設(shè)也很粗糙,與現(xiàn)實的擬合不足,模擬出的概率可信度不足。而且為了追求有解析解而搞這么復(fù)雜的數(shù)學(xué)推導(dǎo)又顯得有點沒必要,畢竟Monte Carlo模擬在這里也不難實現(xiàn)。


其實沿著Rama Cont的思路,你完全可以將模型簡化成一個在技術(shù)上沒有難度的線性模型,最多加一個時變特征。比如你掌握著order book的當(dāng)前狀態(tài),并且知道下一狀態(tài)有固定且有限種可能,那么僅取決于哪一種order會先到。所以直接對order arrival rate建模,也就是λ(·),比如像這樣一個加入時變特征的線性模型:,分別按照limit/market/cancel、buy/sell、每個quote的價格到當(dāng)前bid/ask的距離建模。然后計算λ(·)就變成一個工程問題了,無論是怎樣做特征工程,還是選擇怎樣的回歸算法。因子可以有arrival rate的滯后項,波動率因子如VIX指數(shù),動量因子如過去若干的tick/second的漲幅,還可以有微觀結(jié)構(gòu)因子如bid-ask imbalance,如此等等?;貧w算法可以先選擇線性回歸,主要就看Lp regularization的設(shè)置了。


最后總結(jié)一下吧:


1)拿高頻數(shù)據(jù)做協(xié)整,肯定要先做預(yù)處理,主要思路就是本文前半部分所說。但這不是難點;

2)難點之一還在于構(gòu)建統(tǒng)計套利的協(xié)整組合,無論是把小波系數(shù)納入?yún)f(xié)整檢驗,還是用合適的生成模型或者manifold做個映射什么的,總之要做好你的仿射變換,這就要考察你對策略的理解和設(shè)計了;

3)對統(tǒng)計套利這種交易時機敏感型的策略,高頻環(huán)境下指令的執(zhí)行就是難點之二。解決這個問題可以有非常多的算法和技術(shù),比如很多人著急他們的機器學(xué)習(xí)怎么用在交易上,這不就是個好去處嘛。Rama Cont的模型只做個參考就好。但不妨可以把Rama Cont的模型作為一個發(fā)凡起例的入門思路,多發(fā)掘order book里面新的stylized facts。借助你對市場的觀察,開發(fā)你的交易執(zhí)行模塊,才是最好的。


注1:我這里所指的“協(xié)整”,不一定是時間序列教材里看到的若干種協(xié)整檢驗。在統(tǒng)計套利的語境下,協(xié)整有著更嚴(yán)格的內(nèi)含和更豐富的外延??傊憧梢愿鶕?jù)你對模型和數(shù)據(jù)的探索,做出某種仿射變換,構(gòu)建你的協(xié)整組合。

注2:來自于 Cont, Stoikov and Talreja, A stochastic model for order book dynamics

責(zé)任編輯:張文慧

【免責(zé)聲明】本文僅代表作者本人觀點,與本網(wǎng)站無關(guān)。本網(wǎng)站對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

本網(wǎng)站凡是注明“來源:七禾網(wǎng)”的文章均為七禾網(wǎng) levitate-skate.com版權(quán)所有,相關(guān)網(wǎng)站或媒體若要轉(zhuǎn)載須經(jīng)七禾網(wǎng)同意0571-88212938,并注明出處。若本網(wǎng)站相關(guān)內(nèi)容涉及到其他媒體或公司的版權(quán),請聯(lián)系0571-88212938,我們將及時調(diào)整或刪除。

聯(lián)系我們

七禾研究中心負(fù)責(zé)人:劉健偉/翁建平
電話:0571-88212938
Email:57124514@qq.com

七禾科技中心負(fù)責(zé)人:李賀/相升澳
電話:15068166275
Email:1573338006@qq.com

七禾產(chǎn)業(yè)中心負(fù)責(zé)人:果圓/王婷
電話:18258198313

七禾研究員:唐正璐/李燁
電話:0571-88212938
Email:7hcn@163.com

七禾財富管理中心
電話:13732204374(微信同號)
電話:18657157586(微信同號)

七禾網(wǎng)

沈良宏觀

七禾調(diào)研

價值投資君

七禾網(wǎng)APP安卓&鴻蒙

七禾網(wǎng)APP蘋果

七禾網(wǎng)投顧平臺

傅海棠自媒體

沈良自媒體

? 七禾網(wǎng) 浙ICP備09012462號-1 浙公網(wǎng)安備 33010802010119號 增值電信業(yè)務(wù)經(jīng)營許可證[浙B2-20110481] 廣播電視節(jié)目制作經(jīng)營許可證[浙字第05637號]

認(rèn)證聯(lián)盟

技術(shù)支持 本網(wǎng)法律顧問 曲峰律師 余楓梧律師 廣告合作 關(guān)于我們 鄭重聲明 業(yè)務(wù)公告

中期協(xié)“期媒投教聯(lián)盟”成員 、 中期協(xié)“金融科技委員會”委員單位