信息冲击对股票市场影响的建模与检验
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4 实证分析

本节包括四部分。第一部分为样本数据选取和描述性统计,第二部分提出有效性指标,第三部分是基于整个样本数据刻画利好信息和利空信息的传播特征,第四部分比较不同类型的股票间利好信息和利空信息的传播特征。

1.4.1 描述性统计

随着市场经济的不断发展,资源配置越来越金融化,金融已经成为整个经济体系的中枢系统,2008年次贷危机中,金融机构风险的外部性影响也进一步凸显出金融业的重要性,以银行、保险、券商为主的金融行业整体成为股市的主力军,某种程度上,对金融行业的研究具有一定的代表性。另外,由于工作条件的限制,本书只考虑了信息在中国金融类上市公司间的传播特征。本章拟选取中国证券监督管理委员会(CSRC)行业划分中金融业所属的225只股票(6只CSRC保险业股票、138只CSRC房地产业股票、27只CSRC货币金融服务类股票、11只CSRC其他金融业股票和43只CSRC资本市场服务类股票)中的130只股票(6只CSRC保险业股票、78只CSRC房地产业股票、16只CSRC货币金融服务类股票、5只CSRC其他金融业股票和25只CSRC资本市场服务类股票)进行实证分析。以上信息详见附表1-1~附表1-5。我们注意到,1.3.1小节中提到的对数收益率分解模型利用开盘价、收盘价、最高价、最低价及其出现顺序来分解对数收益率。由于本书的数据集不包含任何出现时间顺序的信息,所以我们利用高频数据集来确定低频数据集中四种价格的出现时间顺序。本章选择的较低时间频率的数据是每日数据,而较高的时间频率是60分钟,即在每个交易日的10:30、11:30、14:00和15:00分别记录上述股票的开盘价、最高价、最低价和收盘价等信息。时间范围是2016年7月1日至2018年6月29日,共两年时间。在以上时间段,225只股票最多有1948个交易记录[1948÷4=487(天)]、最少有32个交易记录[32÷4=8(天)]。因为本书利用线性格兰杰因果关系检验模型构建网络,其前提是提取所分析数据的共有交易日数据。所以,为了尽可能多地保留股票的交易信息,选取130只交易记录在1900个[1900÷4=475(天)]以上的315个共有交易日的股票数据进行下一步分析。(1)

通过使用对数收益率分解模型从原始的开盘价序列、最高价序列、最低价序列、收盘价序列及其出现顺序提取出利好信息序列和利空信息序列。

在315个共有交易日数据上利用对数收益率分解模型分解出的利好信息序列和利空信息序列的描述性统计分别如表1-3和表1-4所示。

表1-3 利好信息序列的描述性统计

表1-4 利空信息序列的描述性统计

由表1-3和表1-4可知,利好信息序列和利空信息序列中对应行业的均值、标准差、最大值和最小值都大致相近。

1.4.2 有效性指标

N个研究对象间的利好信息Dijkstra网络和利空信息Dijkstra网络分别记为GN×NBN×Nij∈[1,2,…,N],根据1.3.1小节中的对数收益率分解模型得到Gij是第i个正向收益与第j个正向收益之间的最短路径。同理,我们可以定义BN×N。本书分别利用NumberSpeedDepthConnectless四个指标度量信息的传播特征。四个指标的定义如下:

表示GN×N网络的元素大于BN×N网络中对应位置元素的个数所占比例,分子表示Gij大于Bij的个数,NumberGood代表利好信息传播相对强度的平均个数指标。

表示BN×N网络的元素大于GN×N网络中对应位置元素的个数所占比例,分子表示Bij大于Gij的个数,NumberBad代表利空信息传播相对强度的平均个数指标。

代表利好信息传播速度的平均距离指标,数值越大,表示速度越慢。

代表利空信息传播速度的平均距离指标,数值越大,表示速度越慢。

DepthGood=max{Gij|ij=1,2,…,N }代表利好信息传播深度的指标,指标值越大,表示传播得越远。

DepthBad=max{Bij|ij=1,2,…,N }代表利空信息传播深度的指标,指标值越大,表示传播得越远。

表示GN×N网络中最短距离为∞的边的个数所占的比例,分子是Gij=∞元素的个数,ConnectlessGood代表利好信息无法成功传播的平均个数指标。

表示BN×N网络中最短距离为∞的边的个数所占的比例,分子是Gij=∞元素的个数,ConnectlessBad代表利空信息无法成功传播的平均个数指标。

1.4.3 利好信息和利空信息在整个样本数据中的传播特征比较

在本小节中,我们研究利好信息与利空信息在以下五组数据中的传播特征:第1组至第5组包含的股票分别为130只(其他金融业、保险业、货币金融服务、资本市场服务和房地产业)、125只(保险业、货币金融服务、资本市场服务和房地产业)、119只(货币金融服务、资本市场服务和房地产业)、103只(资本市场服务和房地产业)和78只(房地产业),在每个小组中,交易日长度为315-10×NN=0,1,…,19。

在每组选定的样本数据中,首先,利用线性格兰杰因果关系检验模型分别构建利好信息传播网络和利空信息传播网络;其次,利用Dijkstra算法找出信息传播网络内每一对节点之间的最短距离,进而构建利好信息Dijkstra网络和利空信息Dijkstra网络;最后,分别借助本书提出的四个指标对比分析利好信息和利空信息在所构建的Dijkstra网络上的传播特征。

图1-2~图1-5为阈值p=0.01时,五个组相对应的NumberSpeedDepthConnectless指标值。

图1-2 NumberGood-NumberBad(p=0.01)

图1-3 SpeedGood-SpeedBad(p=0.01)

图1-4 DepthGood-DepthBad(p=0.01)

图1-5 ConnectlessGood-ConnectlessBad(p=0.01)

图1-2中100个位置上有93个位置对应的NumberGood-NumberBad大于0,相减得到的最大的差值为0.2794,最小的差值为-0.0453。所以,利好信息的多数Number值比利空信息的对应的Number值大。

图1-3中100个位置上有93个位置对应的SpeedGood-SpeedBad大于0,相减得到的最大的差值为0.8119,最小的差值为-0.0705。所以,利好信息的多数Speed值比利空信息的对应的Speed值大。

图1-4中100个位置上有77个位置对应的DepthGood-DepthBad大于0,相减得到的最大的差值为6,最小的差值为-2。所以,利好信息的多数Depth值不小于利空信息的对应的Depth值。

图1-5中100个位置上有93个位置对应的ConnectlessGood-ConnectlessBad大于0,相减得到的最大的差值为0.2888,最小的差值为-0.0632。所以,利好信息的多数Connectless值不小于利空信息的对应的Connectless值。

综上所述,在图1-2~图1-5的多数位置上,利好信息的四种指标值大于利空信息的对应指标值。

1.4.4 利好信息和利空信息在不同类型的股票间的传播特征比较

下面比较利好信息和利空信息在五种不同类型的股票间的传播特征。如前所述,房地产业包含78只股票、资本市场服务包含25只股票、货币金融服务包含16只股票、保险业包含6只股票、其他金融业包含5只股票。表1-5~表1-8分别是利好信息和利空信息对应的四种指标NumberSpeedDepthConnectless在五个类型间的对比结果。

表1-5 五类股票间的NumberGood-NumberBad(p=0.01,315天)

表1-6 五类股票间的SpeedGood-SpeedBad(p=0.01,315天)

表1-7 五类股票间的DepthGood-DepthBad(p=0.01,315天)

表1-8 五类股票间的ConnectlessGood-ConnectlessBad(p=0.01,315天)

在本小节中,NumberSpeedConnectless指标的分母是M×N,其中MN分别是两个类包含的股票个数。

由表1-5可知,REI→INS、CMS→INS、MFS→INS、INS→INS、OFI→INS、MFS→CMS、MFS→OFI和INS→CMS的值为负数,最大值为-0.0133,最小值为-0.1600,其余NumberGood-NumberBad的值均非负数,最大值为0.5072,最小值为0.0000。

由表1-6可知,REI→INS、CMS→INS、MFS→INS、INS→INS、OFI→INS、MFS→CMS、INS→CMS和OFI→OFI的值为负数,最大值为-0.0100,最小值为-0.2396,其余SpeedGood-SpeedBad的值均非负数,最大值为1.0849,最小值为0.0534。

由表1-7可知,MFS→INS的数值为-2,其余DepthGood-DepthBad的数值均非负数,最大值为4,最小值为0。

表1-8中有11个正数、9个负数和5个等于0的数。正数的最大值为0.7708,最小值为0.0113。负数的最大值为-0.0051,最小值为-0.2000。

综上所述,利好信息和利空信息在不同类型的股票间的传播特征与1.3节所得结论基本一致。不同类型股票之间,在多数位置上,利好信息的四种指标值大于利空信息的相应指标值。