基差作为连接期货和现货的纽带,是判断品种基本面的关键指标,利用基差策略管理标的资产风险和提高投资组合回报率,对企业而言至关重要。我们根据所掌握的期货及现货价格数据,重点研究了安徽省合肥地区螺纹钢套保基差策略及过程逻辑,探索出了适宜操作的量化规则。

[样本数据整理]
根据已知并长期跟踪我的钢铁网合肥马长江螺纹钢HRB400E20mm收盘网价(简称合肥马长江网价)、上海中天螺纹钢HRB400E20mm收盘网价(简称上海中天网价)以及螺纹钢1月、5月和10月3个主要期货合约收盘价2021年年初至今的所有交易日数据,以及合肥马长江螺纹钢HRB400E20mm尾盘库提成交基准价(简称合肥马长江成交价)2023年10月初至今的所有交易日数据,得到样本。

表为样本情况
[相关性分析]
根据期货与现货时间差的定义,对上述样本进行概念区分,通过积差法计算不同类别两组变量的协方差与样本标准差乘积的比值,去计算相关系数,之后结合相关系数甄别样本数据之间的线性关系强弱。计算2021—2023年合肥马长江网价和上海中天网价分别与期货合约收盘价的相关系数r(样本量n1=727)可得结论:上海、合肥两地网价与螺纹钢期货合约收盘价呈高度正相关关系。

表为上海、合肥两地网价与螺纹钢期货合约收盘价的相关性
根据实际情况,希望得到合肥马长江成交价与期货盘面之间的量化函数关系,但受制于尾盘成交价样本量偏少(n2=75),故先对合肥马长江成交价与两地网价的相关性进行确认,再进一步拟合数据。经计算可得,上海、合肥两地网价与合肥马长江成交价也呈高度正相关关系。
[回归性分析]
根据上述相关性分析可以发现,上海、合肥两地网价与期货收盘价之间并无显著相关性差异,需要进一步做回归性分析。将期货价格定义为自变量,将现货价格定义为因变量,通过样本散点图以及数据间逻辑关系,计算样本组一元线性回归关系。同样,也可计算两地网价与合肥马长江成交价的一元线性回归关系。

表为上海、合肥两地网价与螺纹钢盘面的一元线性回归

表为上海、合肥两地网价与合肥马长江成交价的一元线性回归
回归系数的数值表示自变量每单位变化对因变量的影响程度,回归系数越大,自变量对因变量的影响就越大。可以发现,上海中天网价与期货收盘价相比合肥马长江成交价的关联性更强。
[显著性检验]
虽然上海中天网价与其他样本组的关联性最强,但还需对上述线性回归进行检验,无误后,才能选取关联样本(现货价-期货价=基差)进行下一步计算。
在简单线性回归中,主要通过相关指数R2观察线性回归的拟合优度、通过Significance F检验线性关系显著性的P值、通过T查看P-value检验回归方程系数的显著性,以及通过残差分析确定线性回归的前提假设。

表为3组样本的显著性检验
通过上述数据可以发现,P值不仅小于0.05,而且小于0.01,存在极显著差异,说明关联的两组样本总体间存在较强的关联性或者影响力,但通过对残差散点图分布的观察可见,残差的正态性分布特征不足够明显,是这一显著性检验的唯一问题。
根据上述情况,综合实际应用,再次检查样本,考虑到作为自变量的期货收盘价和因变量的现货价存在周期差异,于是,将1月、5月、10月合约收盘价样本根据所处周期重新进行数据挖掘,分为近期(主力连续合约)/中期(距离主力合约最近的1月、5月、10月合约)/远期(距离主力合约最远的1月、5月、10月合约)收盘价样本。
由于上述3组样本总体与前期相比并无变化,故无需再进行相关分析和回归分析,只需将自变量调整为近、中、远周期的3组期货合约收盘价样本,进行显著性检验。
检验数据和前期样本出现基本一致的表现,残差平方和依然较大,表示因变量对预测值的总偏差较大,意味着拟合的效果还不是最理想状态。

表为新的3组样本显著性检验
到这里若继续从线性回归的角度去纠正差异,就需要通过残差散点图去寻找异常点,或者通过最小二乘法、梯度下降法等去求解最小均方差,进而剔除或合并异常值,再重新拟合数据,修正线性回归方程,但得出的是围绕因变量(现货价)的函数公式,并非本次测算目的(基差)的函数公式,且过程复杂。因此,在确认相关样本组具备线性回归关系的前提下,暂停对线性回归方程的修正计算。
Copyright © 2024-2025 成都宁时科技有限公司 版权所有