非传统的期货套利方法

144
提问者
2023-03-15 15:52 悬赏 0财富值 阅读 496回答 1

序言:期货是投资者非常常用的对冲风险和套利获取收益的工具。除了比较传统的对冲市场风险、套期保值的投资方法,本文将会介绍一些比较创新的、基于各类数据的股指和商品期

默认分类
登录 后发表回答
1楼 · 2023-03-15 16:09.采纳回答

序言:期货是投资者非常常用的对冲风险和套利获取收益的工具。除了比较传统的对冲市场风险、套期保值的投资方法,本文将会介绍一些比较创新的、基于各类数据的股指和商品期货投资套利方式。

基于库存定制的期货策略

库存理论(The Theory of Storage)认为实物商品的库存水平是期现价差(即基差或展期收益率)的根本决定因素。因此,利用对于商品期货标的的库存数据的提取,我们应当能够实现有效的期货套利,从而获取收益。

任瞳等(2017)设计了一套库存相关的策略并且通过回测测试,来验证通过库存数据进行商品期货套利的想法能否实现。在库存数据选取方面,作者考虑了社会库存、交易所库存以及期货库存(仓单),并且仅考虑更新及时的日频和周频数据。

通过直观的对比,我们可以发现选区的商品库存以及其期货指数价格有着比较明显的负相关的关系。

由此,我们验证了基于库存的期货策略理论为:库存偏高(低)时,期货价格有下(上)行趋势,应当做空(多)期货。为验证以上逻辑,我们使用库存变化率(Inventory_CR)作为多空信号因子进行策略回测。其中

OneDay_CR = Inventory(t)/Inventory(t-M)-1

Ave _CR = Inventory(t)/Inventory_ave(t-M:t)-1

即OneDay_CR指以M天前库存量为基准的库存变化率,Ave_CR指以过去M天平均库存量为基准的库存变化率。N为投资的窗口期。

接着,用中性策略首先做回测,即做多库存变化率最低的20%期货,做空库存变化率最高的20%期货。结果如下:

策略的年化收益率全部达到6%以上,夏普比率基本处于1左右。最大回撤基本控制在20%以内。其中,M=50的策略效果最好,其十年来的回测净值如下:

接着,作者又构建了基于时间序列的单个资产期货策略,即对于单个资产,库存变化率为正的时候卖空合约,反之则买入。在不同品种之间平均分配资产。策略回测当中,夏普比率达到了1.5,年化收益率达到了12%。

最后,结合上述两种策略构建优化的双维度测策略,在横截面信号和时间系列信号给出的多空指令一致的时候进行操作,策略效果对比多带带使用横截面信号的中性策略有了更大的提升。

运用虚拟变量的期货日内套利机会

Zhang et al.(2019)运用了一些模型来试图抓住期货的日内套利机会。作者在CSI500期货交易的时间段,选取了IC1705(近月合约)、IC1706(远月合约)2017年4月7号-20号的5分钟高频数据,以及IC1709(近月合约)、IC1712(远月合约)2017年7月7号-20号的5分钟高频数据作为两个对照组数据来进行研究。

作者根据一天的交易时间中的48个时段建立了47个虚拟变量,并且建立如下线性回归模型。

\begin{align*} X_t=\alpha_0+\alpha_1h_1+\alpha_2h_2+...\\ +\alpha_{46}h_{46}+\alpha_{47}h_{47}+\varepsilon_t \end{align*}

X_t指日内动量变量,\alpha_t为估计系数, h_i 为虚拟变量。9:30-9:35时间段表示为: h_1=1 , h_i(i≠1)=0 ,以此类推。

\left\{ \begin{align*} &X_t=\alpha_0+\alpha_1h_1+\alpha_2h_2+...\\ &\space\space\space\space\space+\alpha_{46}h_{46}+\alpha_{47}h_{47}+\varepsilon_t,\\ &\sigma_t^2=\beta_0+\sum^q_{i=1}\beta_i\varepsilon_{t-i}^2+\sum^p_{i=1}\beta_i\sigma_{t-i}^2, \end{align*} \right.

当序列满足平滑性、不存在自相关,但存在异方差时,用上述虚拟变量建立GARCH模型:

\left\{ \begin{align*} &f(t)=\phi_0+\phi_1X_{t-p}+...+\phi_pX_{t-p}\\ &\space\space\space\space\space\space\space+\varepsilon_t-\theta_1\varepsilon_{t-1}-...-\theta_q\varepsilon_{1-q}\\ &X_t=f(t)+\alpha_0+\alpha_1h_1+\alpha_2h_2+...\\ &\space\space\space\space\space+\alpha_{46}h_{46}+\alpha_{47}h_{47}+e_t,\\ \end{align*} \right.

当序列稳定且存在自相关,不存在异方差时,建立ARMA模型:

\left\{ \begin{align*} &X_t=f(t)+\alpha_0+\alpha_1h_1+\alpha_2h_2+...\\ &\space\space\space\space\space+\alpha_{46}h_{46}+\alpha_{47}h_{47}+\varepsilon_t,\\ &\sigma_t^2=\beta_0+\sum^q_{i=1}\beta_i\varepsilon_{t-i}^2+\sum^p_{i=1}\beta_i\sigma_{t-i}^2, \end{align*} \right.

其中,f(t)代表ARMA(p,q)模型。

当序列稳定且具有自相关和异方差时,则选择ARMA-GARCH模型:

\left\{ \begin{align*} &X_t=f(t)+\alpha_0+\alpha_1h_1+\alpha_2h_2+...\\ &\space\space\space\space\space+\alpha_{46}h_{46}+\alpha_{47}h_{47}+\varepsilon_t,\\ &\sigma_t^2=\beta_0+\sum^q_{i=1}\beta_i\varepsilon_{t-i}^2+\sum^p_{i=1}\beta_i\sigma_{t-i}^2, \end{align*} \right.

除了高频的5分钟收益,作者还使用交易量、头寸、价差、价格波动率等等数据来进行研究对象,也就是上述的 X_t 。

\left\{ \begin{align*} &lr_r=(lnp_t-lnp_{t-1})\times 100\\ &dvol_t=\frac{vol_t-vol_{t-1}}{vol_{t-1}}\times 100\\ &dope_t=\frac{ope_t-ope_{t-1}}{ope_{t-1}}\times 100\\ &jc_t=p_{1t}-p_{2t}\\ &vp_t=ln(hp_t)-ln(lp_t) \end{align*} \right.

其中,lr­指对数化的收益,dvol是交易量变化率,dope是头寸变化率,jc是价差序列,vp是价格波动区间范围,p是股指期货收盘价,vol是交易量,ope是当前持有头寸, p_{1t} 为时间t当月期货合约价格, p_{2t} 为远月合约在t时间的价格,hp、lp则是最高和最低价。

作者基于IC1709(近月合约)、IC1712(远月合约)2017年7月7号-20号10个交易日内的价差日内效应,用2017年7月21日的数据做回测,结果中的总胜率达到了69.2%。在9:30 - 9:40, 9:55- 10:00, 10:25 -10:30, 13:20 - 13:45, 13:50 - 13:55, 14:00 - 14:05 and 14:55 -15:00, 这7个时间段,套利胜率达到了100%。

挤压套利——以大豆和菜籽为例

期货挤压套利可以在大豆、菜籽之类的农产品原料制食用粉、食用油的过程中寻找套利机会。在工厂加工过程中,食用粉加食用油的挤压利润(crush profit)可以表示为:

Crush\space Profit=M\times \Phi_m+Y\times \Phi_y-C-A

其中,M、Y、A分别是食用粉、食用油和相应的农产品原料的价格;分别是食用粉、食用油的产出率(即单位原料能够产出的加工品的量);C是加工所需的总成本(除去农产品原料价格)。当crush profit的现价高的时候,加工厂会增大生产量以赚取更多利润,这就会增加原料的需求,提高加工品的供应量,因而导致加工品价格相对原料较低。此时在期货市场就出现以较低价买入加工品期货并且较高价卖出原料期货的套利机会。当crush profit限价较低的时候,则情况相反。

上述的期货套利机会则是Gu(2018)等提出的期货中基于食用油类生产过程的挤压套利方法(crush arbitrage),即在买入(卖出)该食用油原料农产品期货的同时,卖出(买入)该产品制作的食用粉、食用油产品的期货,以此来进行套利。作者在原先研究中简单地使用移动平均线等信号交易大豆期货方法的基础上,引入了GARCH模型,并且加入菜籽期货进行研究,对于该策略进行更加严谨完备的测试和论证。

构建协整回归公式:

\begin{align*} &y_t=\beta_0+\beta_1x_{1t}+\beta_2x_{2t}+e_t\\ &spread_t=y_t-\beta_1x_{1t}-\beta_2x_{2t}=\beta_0+e_t\\ &Mean(spread_t)=Mean(\beta_0+e_t)=\beta_0\\ &e_t=Mspread=spread_t-Mean(spread_t)\\ &\space\space\space\space=y_t-\beta_0-\beta_1x_{1t}-\beta_2x_{2t} \end{align*}

y_t , x_{1t} , x_{2t} 分别是原料农产品、食用粉、食用油的逃离综合期货合约的价格。

考虑到套利组合残差 \varepsilon_t 的波动性是随着时间变化的,作者引入GARCH(p, q)模型:

\begin{align*} &y_t=x'_t·\gamma+\varepsilon_t\\ &\sigma^2_t=\omega+\sum^q_{i=1}\alpha_i·\varepsilon_{t-i}^2+\sum^p_{i=1}\beta_j·\sigma_{t-j}^2 \end{align*}

套利策略如下:

1)MSpread≥k_1\sigma_t时,认为原产品期货价格相对偏高,卖出1单位原产品期货并且买入由对应的参数(出粉率、出油率、生产成本)处理计算过的对应单位食用粉和食用油的期货。 MSpread≤-k_1\sigma_t 时,做相反方向的操作。

2)-k_2\sigma_t≤MSpread≤k_2\sigma_t时,不做操作。

3) 为了控制交易成本、规避过大的波动, MSpread≥k_3\sigma_t 或 MSpread≤-k_3\sigma_t 时,说明价格的波动率过大,进行强行平仓操作。

k_1,k_2,k_3的值在本文分别被估计为0.75、0.05、1.5。

数据选取为2013年1月4日刀2016年12月,分别在大连期货交易所和郑州期货交易所的大豆、豆粉、豆油期货和菜籽、菜籽粉、菜籽油期货。其中,2013年1月-2014年12月的数据为训练数据,2015年1月2016年12月数据为测试数据。

为了确认GARCH模型的参数,作者首先取一阶自相关AR(1)进行ARCH-LM检验。F检验和Chi-Square检验结果来看,都能够拒绝残差序列中直到1阶度不存在ARCH效应的原假设。因此,确认本策略可以采用GARCH(1,1)模型。

回测结果如下,其中AMY、RMO分别为大豆和菜籽的期货投资组合。 CVM、TVM分别是波动率设置为常数和随着时间变动的策略。总体来看,两类商品的挤压套利都获得了20%以上的年收益,并且大豆考虑波动率随时间变动的挤压套利策略达到了最高的36.94%年化收益以及0.852的夏普率。

基于高频指数基金数据的套利

Frino et al.(2016)采用澳洲股指基金和期货价格,评估了基于这样的毫秒级高频数据所产生的套利策略收益、频率、久期等方面,以及波动率等因素对于高频套利的影响。

本文数据使用STW(追踪澳大利亚ASX/S&P200的被动指数基金)和SPI(ASX/S&P200的指数期货)的价格数据来分析套利方法。数据时间范围在2012年3月1日到2014年1月31日。

两种资产的价差 S_t=P_t^{SPI}- 100 P_t^{STW} 表示。由于即使价差具有波动性较大的特点,本文选择一段时间内的平均价差作为更为稳定的交易信号,以两个资产价格相关系数达到0.9为条件来确定取平均价差使用的时间窗口 r_i (精确到毫秒级别数据;使用当前时间前20个交易日数据)。

每一次价格更新的套利机会的基础被确定为在前一个r区间的时间加权价差 \overline{S_t} 为:

\overline{S_t}=\frac{1}{r}\sum^{n_r}_{i=1}S_{t-t_i}·\{t_i-Max(t_{i-1},t_{n_r})\}

\{n_r |t-t_{n_r-1}<r≤t-t_{n_r}\}.\{t_i-Max(t_{i-1},t_{n_r})\}为价格信息的时间间隔, n_r 指被包括的过去价差信息的个数。如果在任一市场内发生剧烈变动,但是在r秒内恢复到原始值,那么 \overline{S_t} 不会发生变动。

S^{bid}_t=_{bid}P_t^{SPI}-100_{ask}P_t^{STW}(做空SPI,做多STW),S^{ask}_t=_{ask}P_t^{SPI}-100_{bid}P_t^{STW}(做多SPI,做空STW)。在 S^{bid}_t<\overline{S_t}< S^{ask}_t 时,不发生交易。交易信号发生直到平仓的套利收益如下:

\pi= \left\{ \begin{align*} &\overline{S_u}-S^{ask}_t,\space if\overline{S_u}>S^{ask}_t\\ &S^{bid}_t-\overline{S_u},\space if\overline{S_u}<S^{bid}_t\ \end{align*} \right.

每次套利的美元收益为:

Volume= \left\{ \begin{align*} &25\times Min(Vol^{ask}_{SPI},\frac{Vol^{bid}_{STW}}{2500}),\\ &\qquad \qquad\qquad \qquad if\overline{S_u}>S^{ask}_u\\ &25\times Min(Vol^{bid}_{SPI},\frac{Vol^{ask}_{STW}}{2500}),\\ &\qquad \qquad \qquad \qquad if\overline{S_u}>S^{bid}_u\\ \end{align*} \right.

套利结果的统计数据如下。在测试期间内,每个交易日平均能够挖掘124次套利机会,套利收益达到每个交易日$529。Convergence Time记录了每天两种产品要达到0.9的价格相关系数所需的平均时间(计算平均价差的时间范围),分布在16s到165s之间。超过80%的套利机会来自于SPI的价格波动,符合SPI比起STW来说交易更活跃的说法。%Good Arbs展示了套利机会在daily convergence time之前消失的百分比,达到了98%,更说明了两种产品的相关性之强,因此套利的风险非常小。

在进行了考虑交易费用的调整以后,策略依然能够赚取稳定收益。

Arb_t 代指daily duration(每日平均累计套利机会存在的时长), daily arbitrage profit(每日套利收益), arbitrage frequency(套利频率)的三个有关套利结果因变量:

\begin{align*} Arb_t&=Intercept+\beta_1Colocation\\ &+\beta_2log(1/SPI Dollar Volume_t)\\ &+\beta_3Volatility_{SPI,t}+\beta_4NewsRelevence_t\\ &+\beta_5LagReturn_t+\varepsilon_t(1) \end{align*}

有关影响因素模型的结果检测中,发现除了交易量和波动性因素,其他因素对于套利收益的影响是不显著的,这说明高频套利交易基本不受金融市场行情以及股市实际收益等因素影响,而是根据市场的流动性和波动性赚取非常短期的收益。

总结

本文选取了基于库存、日内虚拟变量、挤压套利、指数基金高频价格的期货套利方法,从基础方法到创新角度,来介绍有关期货套利的理论方法,并且在基于历史数据的回测结果来看都是有相当赚取利润能力的。

以上几种方法仅用于学术讨论研究,并不建议作为实际期货市场交易策略。市场有风险,投资需谨慎。


参考文献:

[1] 任瞳,于明明,2017,CTA策略系列报告之三:基于库存基本面视角的商品期货投资策略(上),兴业证券

[2]任瞳,于明明,2017,CTA策略系列报告之二:基于商品期货的期限结构的投资策略,兴业证券

[3]Jianwen Zhang, Guoqiang Tang, Qiaofen Miao, Jingling Yang, 2019, The Statistical Arbitrage Study of CSI 500 Stock Index Futures Based on Intraday Effect, Open Journal of Business and Management, 2019, 7, 1095-1111

[4]Quan Gu, Xinghui Lei, 2018, The Profitability of Crush Spread: Statistical Arbitrage Method, Advances in Engineering Research, volume 152

[5]Alex Frino, Vito Mollica, Robert I.Webb, Shunquan Zhang, 2016, The impact of latency sensitive trading on high frequency arbitrage opportunities, Pacific-Basin Finance Journal