加密量化交易策略失败的原因
区块链研究员·2020-09-17 阅读 4

"加密 "和 "量化 "这两个词似乎是完美的搭配。比特币和加密资产诞生于资本市场最激动人心的时期,恰逢量化金融的黄金时代。云计算、大数据等运动引起的技术加速,加上机器学习的复兴,碰撞出了有利于量化革命的完美风暴。每年都有数十亿美元的资金从全权委托资产转移到量化工具中,而华尔街的数学家和机器学习专家数量的增长远远不够。


作为一种完全数字化的资产类别,加密似乎是量化模型的完美目标。然而,量化策略仍然局限于相对简单的技术,比如统计套利(一种寻求利用一对证券的市场效率低下的配对交易策略),我们仍然没有看到市场上出现大型的起主导作用的量化交易平台。尽管加密资产的特点对量化策略具有吸引力,但加密对量化模型提出了独特的挑战,现实情况是,加密中的大多数量化策略都失败了。在本文中,我想探讨一些基本但不明显的原因,这些原因会导致加密领域大多数量化策略的失败。

我所说的加密领域的大多数量化策略失败,主要是指机器学习策略。事实证明,统计套利是开发算法策略的有效机制,但我们应该预计,随着市场规模和效率的提高,这些机会将会消失。我们看到在传统资本市场,基于机器学习的量化模型的实施出现了爆炸性增长,且该领域的研究机构也在成倍增长。

然而,大多数在传统资本市场中被证明有效的量化策略,在应用于加密资产时很可能不那么有效。根据我们IntoTheBlock最近在预测模型和量化策略方面的一些经验,我列出了一些我认为可能导致加密资产的量化模型失败的因素。


  1. 小数据集 你在研究论文中发现的许多基于机器学习的量化策略都是在几十年的资本市场数据中训练出来的。而 大多数加密资产的交易历史仍然以月为单位来计算,即使是像比特币和以太坊这样的工具,数据集仍然相对较小。许多机器学习模型将很难从如此小的数据集中概括出任何知识。比方说,近几天LINK的价格很红火,你试图为LINK这种资产的价格建立一个预测模型,结果发现LINK的交易历史非常少,这不足以训练大多数量化金融中的机器学习模型。

  2. 经常性的 "离群 "事件 虽然 "经常性"和 "离群 "这两个词不应该用在同一个句子里,但我想不出一个更好的词来描述我们在加密资产中经历的事情。在几个小时的时间里,大规模的价格崩盘或飙升,可以改变任何加密资产的势头,这些 "离群 "事件在许多加密资产中发生得相当频繁。 从机器学习的角度来看,大多数模型会对这些现实中发生的价格变动感到困惑,因为它们在训练过程中没有看到任何类似的情况。许多机器学习量化模型在3月中旬的闪电崩盘中被斩杀,或者在过去几周的波动性突然增加的情况下未能抓住机会。这并不奇怪,因为在模型的训练过程中,很难捕捉到这些类型事件的知识。

  3. 过度拟合的倾向 加密资产中的小市场数据集的一个副作用是,大多数机器学习量子模型都有过度拟合或 "针对训练数据集进行优化 "的倾向。我们不断看到在回测期间表现得非常好的量子模型,在应用于真实市场时失败了。

  4. 定期再培训的困境 想想这个场景。你创建了一个预测模型,在几年的比特币交易历史上进行了训练,然后你经历了几周几乎没有波动的情况,接着是一些疯狂的波动(以前并没有发生过这种情况)。你想重新训练模型来捕捉这些知识,但如何训练?如果你只是简单地用最近的数据来重新训练模型,很有可能会出现过度拟合的情况,而如果你等待,那么这些知识可能就不再相关了。 要想在加密领域发展量化投资,人才是一个非常重要的,而且经常被忽视的方面。 这种再训练的困境是 "规律性异常事件 "现象的直接后果。如果你在标普500指数过去10年的数据集中训练一个模型,你可以设计一个策略来定期重新训练模型,因为指数不太可能在短时间内偏离传统行为太多。这种在传统的量化策略中被很好地采用的定期重新训练模型的做法,在涉及到加密技术时就会失效。

  1. 数据质量和可靠性 为加密资产设计机器学习量化模型的最大缺点之一是数据集的质量和可靠性差。许多交易所的订单簿数据集充满了表明虚假交易量、洗盘交易或欺骗行为的记录,这不是什么秘密。显然,使用这些数据集训练机器学习模型不会产生任何相关结果。此外,几乎每周我们都会听到交易所API出现中断,关闭数小时的消息。你上一次听说纳斯达克API崩溃是什么时候?它肯定会发生,但不是那么频繁。这种缺乏可靠性的情况会扼杀最强大的量化模型的准确性。

  2. 匿名区块链记录 区块链数据集仍然是加密领域量化策略最丰富的alpha来源之一。但区块链记录的匿名性使得设计有意义的量化模型确实具有挑战性。比如说,量化策略中的一个功能是利用以太坊区块链中的地址数。好吧,作为交易所的一部分的地址与个人钱包的地址有本质上的不同,这些地址与矿工的地址不同。给区块链记录贴上标签对于设计基于区块链数据集的有意义的量化模型是至关重要的,不幸的是,这些工作还处于非常早期的阶段。

  3. 因子策略的失效 在过去的二十年里,因子模型一直是一些最成功的量化策略的核心。像AQR这样的整个巨型基金都是建立在因子投资量化策略的承诺上。从最初的价值、动量或质量等因子,因子策略已经发展到数百种因子,对金融资产类别的相关行为进行建模。 至少直到今天,大多数因子策略在加密资产的背景下都被证明是无效的。当涉及到加密时,像价值和质量这样的因素并没有明确的定义,而其他因素如动量的行为则违背了传统模式。这导致许多加密量化交易台花了无数时间试图重新创建基于因子的策略,而这些策略在加密领域成功的可能性极低。

  1. 简单模型谬误 量化金融领域正在迅速向大型复杂模型靠拢,复杂模型的表现经常优于更简单、更专业的模型。这种趋势是整个机器学习领域的反映。深度学习的出现向我们展示了创建高度复杂的神经网络是可能的,这些神经网络以最不可想象的方式获取知识。 像TwoSigma和WorldQuant这样的基金正在积极推动深度学习研究,并将谷歌、微软或Facebook等科技巨头的人工智能实验室中的想法融入其中。然而,在加密世界中,大多数量化策略仍然依赖于非常基本的机器学习范式,如线性回归或决策树。 由于易于理解,更简单的模型无疑是有吸引力的,但它们可能很难从加密市场这样的复杂环境中概括知识。作为一个机器学习环境,加密结合了金融市场的复杂性和新资产类别的低效率和不确定性。绝对不是最适合简单模型的量化策略。

  1. 基本数量基础设施 补充上一点,加密领域的大多数量化基础设施都是比较初级的。一个强大的量化基础设施不仅仅是好的策略,还包括风险管理、回测、投资组合管理、策略执行、错误恢复等要素。在加密领域,大多数对冲基金的量化基础设施仍然相对简单,这使得某些类型的策略难以操作。 例如,假设你设计了一个漂亮的深度学习量化策略,根据区块链数据集预测比特币的价格。为了操作该策略,基金需要一个基础设施,定期收集区块链记录,拥有运行深度学习模型的计算机基础设施,适当的再训练工具等等。 目前的技术无疑降低了构建量化基础设施运行机器学习模型所需的时间和成本,但与传统资本市场的运作方式相比,量化交易台仍然比较基础。

  1. 人才供应 我把最有争议的一点留到了最后。作为一个金融市场,加密技术仍然无法吸引具有传统资本市场相关经验的顶级量化人才。我们仍然在用相对简单的模型、简陋的基础设施和糟糕的流程来处理令人难以置信的复杂问题,比如预测一个资产类别的行为方式。 要想在加密领域将量化投资发展成为一门学科,人才是非常重要的,也是经常被忽视的方面。当然,在加密领域,也有令人赞叹的天才量化团队,但他们是例外,而非普遍。


以上几点可能会引起我们对加密领域量化投资现状的反思。加密是量化策略的理想资产类别,从长远来看,量化基金应该是加密领域的主要投资工具,这个方向一路荆棘,但也闪耀着机会。

加密货币量化交易
本文仅代表作者观点,不代表本站立场,若侵犯了您的合法权益,请点击联系我们。