随机交互金融模型的构建及金融时间序列的统计分析

(整期优先)网络出版时间:2018-12-22
/ 2

随机交互金融模型的构建及金融时间序列的统计分析

谭纪远

中信银行股份有限公司六安支行安徽合肥230000

摘要:随机交互金融模型技术近年来被广泛用于时间序列分析,时间序列挖掘技术主要包括关联分析、序列分析、分类分析、聚类分析和异常检测等五类。由于金融领域的时间序列具有一些重要的特征,因此将各种挖掘方法与金融时间序列的特征,以及各种传统的时间序列分析模型相结合,是目前金融时间序列挖掘领域的研究热点。

关键词:时间序列;金融;随机交互金融模型

1引言

在金融领域,时间序列是一种重要的数据类型,对时间序列的分析是金融数据分析的一个重要内容。作为数理统计学的一个分支,时间序列分析自1960年代起就已经得到了广泛的研究。传统的金融时间序列分析方法主要包括基本分析、技术分析以及各种数理统计学方法等。随着近年来数据规模的不断增长以及分析任务的日益复杂,随机交互金融模型技术开始被运用到金融时间序列的分析中。所谓随机交互金融模型是指从大规模的数据中抽取隐含、未知、有潜在使用价值的规则的过程。作为一门交叉学科,随机交互金融模型集成了许多学科中成熟的工具和技术,包括数据库技术、统计学、机器学习以及人工智能等。广义地说,所有从海量数据中发现新的规律的方法都可以统称为随机交互金融模型技术。本文在对传统的金融时间序列分析方法进行简单回顾的基础上,对当前主要的金融时间序列挖掘技术进行综述,并指出相关方法的优缺点和需要进一步研究的问题,为该领域的进一步研究提供基础。

2金融时间序列传统分析方法

基本分析与技术分析是最常见的分析方法,主要用于证券与期货市场中的时间序列分析。基本分析主要通过对影响证券市场供求关系的基本因素进行分析,从而判断股票价格的走势。技术分析则通过对历史数据进行一些简单的计算,得到相关的技术指标和图表,从而判断序列未来的变化趋势。另一类主要的金融时间序列分析方法是数理统计方法,这类方法主要包括各种统计特征的检验分析、相关分析、线性/非线性回归分析、自回归移动平均(ARMA)分析以及分形分析等。此外,各种多元分析方法也被广泛用于金融时间序列分析,如判别分析、主成分分析以及因子分析等。限于篇幅,本文不再详细讨论这些方法。

3时间序列挖掘方法

近年来随机交互金融模型技术在时间序列分析领域开始得到广泛的研究与应用,已有大量的文献提出了各种时间序列挖掘算法。需要指出的是,虽然这些

文献本质上属于对通用的基础算法进行研究,并不是专门针对金融领域的时间序列,然而其中许多方法都是以金融时间序列为例,来说明算法的有效性、准确度或性能,因此这些算法也在金融领域得到了应用。时间序列挖掘方法主要包括以下几个方面。

3.1关联分析与序列分析

关联分析与序列分析的目的都是发现数据间的各种相关联系,不同的是,关联分析用于发现同一时间段内的各种联系,而序列分析用于发现在时间上具有先后关系的联系。使用关联与序列分析方法,能够发现同一序列的前后变化或不同序列变化间的复杂关系。由于传统的关联与序列挖掘算法主要适用于符号型数据,因此在对数值型金融时间序列进行关联与序列分析时一般需要先对序列进行符号化。

3.2相似性查找

相似性查找是时间序列挖掘领域的一个重要研究方向。所谓相似性查找是指对于给定的目标序列Q,根据某种相似性度量函数,寻找与Q最相似的序列Qk。时间序列的相似性查找分为全序列匹配和子序列匹配两大类。全序列匹配是指所查找的序列与目标序列Q具有相同的长度;子序列匹配则是指在一个更长的序列中,寻找与目标序列Q相似的所有子序列。相似性查找在金融领域典型的应用是,根据图形上的相似性,寻找与某种资产的价格(或收益率)变动情况比较接近的其他资产。由于金融时间序列一般都跨越较长的时间段,理论上甚至具有无限长度,因此这类数据都表现出高维甚至是超高维的特征。由于大多数相似性度量函数(如欧氏距离函数)在处理高维数据时性能都急剧下降,因此对于这类数据,一般先采用某种方法对序列进行维约简,即将原始序列变换到低维空间,在此基础上再比较序列间的相似性。

3.3聚类分析

聚类分析的目的是把整个目标数据分成多个不同的簇,使得每个簇中的数据尽可能相似,而不同簇中的数据具有明显的差别。在金融领域,聚类分析对于板块研究、投资组合模型的构建以及客户交易模式研究等都有着重要的意义。由于时间序列的聚类分析同样需要进行序列间的相似性度量,因此与相似性查找类似,在聚类分析之前一般先对序列进行维约简。

3.4分割与逐段描述

时间序列的分割与逐段描述是指对长度为n的序列Q,将其分为k段(k<<n),对各段分别使用某种模型进行描述并记为Q,使得Q与Q非常接近。对时间序列进行分割与逐段描述的主要原因有两个方面:第一,时间序列往往跨越较长的时间段,某些序列在理论上甚至具有无限长度,在此期间数据的许多特征都可能发生变化,对这样的数据用一个单一的模型来描述是不合适的;第二,时间序列在演化的过程中,由于受到各种因素的影响,往往具有复杂的局部特征,使用一些简单的模型(如线性模型)对序列进行逐段描述,丢弃一些细节变化信息,对于某些挖掘任务来说更合适。由于金融时间序列经常受到众多非线性因素的影响,并且随着时间的推移,各种因素的影响效果也不断变化,因此金融时间序列往往呈现出复杂多变的形态特征。对金融时间序列进行分割并逐段描述,对许多挖掘任务而言更有意义。最常用的时间序列分割方法是使用线性模型对序列进行分割与逐段描述,称为逐段线性描述。

3.5异常检测

异常检测是时间序列挖掘中的一个重要方面。所谓异常是指数据集中明显与众不同的数据,使人怀疑这些数据是由不同的机制产生的,而非随机偏差。异常检测最先在统计学领域得到研究,这些方法通常将数据用某个假定的统计分布进行建模,然后根据假定的模型和数据的实际分布来确定异常。由于通常无法准确地确定实际数据的分布形式,并且现实数据往往并不符合任何一种理想的数学分布,因此统计异常检测方法具有相当大的局限性。

4混合挖掘方法

近年来金融时间序列分析领域出现一种新的趋势,即将各种时间序列挖掘技术与传统分析方法和模型相结合,我们将这些方法称为混合挖掘方法。与第三节中的时间序列挖掘方法不同,这类方法大多针对于金融领域某个特定的分析任务,或者基于金融时间序列的某些特征,因此更具有针对性。

5对上述方法的评述

基本分析与技术分析方法主要用于证券与期货市场中的时间序列分析,这两种分析方法虽然计算简单并且易于使用,但是无法用于进一步分析数据中隐藏的其他规律和各种复杂的统计特征。数理统计方法是目前金融时间序列分析中最重要的方法。但是随着数据量的不断增加(如金融领域中的高频和超高频数据),这些方法在分析能力方面存在一定的缺陷。虽然近年来出现了大量的时间序列挖掘方法,然而将这些方法直接用于分析金融时间序列仍然存在一些不足。其中一个主要的原因在于不同领域的时间序列往往具有不同的特征。例如金融领域的时间序列一般不具有典型的周期性,而这一特征在商业或气象领域的时间序列中则非常明显。实验结果说明,对于来自不同领域、具有完全不同特征的时间序列,提出一种普适的挖掘方法是困难的。我们认为金融时间序列挖掘技术未来的主要发展方向是混合挖掘技术,这里的混合主要包括以下两个方面的内容:一方面,各种新的随机交互金融模型算法必须考虑到金融时间序列所具有的主要特征,即根据序列的特征研究相关挖掘算法。事实上,传统的数理统计分析方法与模型大多基于严格的统计数学和相关的金融分析理论,在金融时间序列分析中发挥着不可替代的作用。随机交互金融模型技术则为在海量的金融数据中快速、自动、智能化地发现各种潜在的、有价值的规律提供了新的支持。这些方法的结合,将使得金融时间序列分析领域具有更广阔的应用前景。

结束语

虽然金融时间序列挖掘技术得到了广泛的研究,但是仍然存在一些有待于进一步研究的问题。一方面,金融领域的某些分析任务或数据特征具有一定的特殊性,需要开发新的随机交互金融模型算法进行支持。另一方面,各种时间序列挖掘技术在金融领域的应用层次也有待于进一步深入。例如现有的关联分析与序列分析技术,大多侧重于发现序列中大量IF-THEN形式的规则以及这些规则的可信度。然而如何利用这些规则,并根据投资者的风险偏好以及资本金规模等相关特征,为其提供个性化的投资与理财方案,则需要将随机交互金融模型与关的决策优化技术相结合。此外,目前金融时间序列挖掘领域主要关注的是单变量时间序列,对多变量时间序列挖掘的研究则非常少。在金融领域经常使用多个变量描述一种现象或状态,例如描述股票交易情况的变量一般包括交易价格、成交量以及换手率等,并且与单变量时间序列相比,多变量金融时间序列将会具有一些新的特征(比如协整性等)。如何根据这些新的特征,将各种随机交互金融模型技术与相关的多变量统计模型(如向量自回归模型等)相结合,从而实现对多变量金融时间序列的有效挖掘,这是一个重要的研究方向。

参考文献:

[1]龚惠群,黄超,彭江平.具有双时间维约束的股票序列模式挖掘算法研究[J].计算机工程,2003,29(20):87-89

[2]肖辉,胡运发.基于分段时间弯曲距离的时间序列挖掘[J].计算机研究与发展,2005,42(1):72-79.

[3]王晓晔,孙济洲.一种时间序列表示算法及其在聚类中的应用[J].系统工程与电子技术,2006,28(8):1266-1270

作者简介:

谭纪远身份证号码:34242319910702xxxx