引言

如果你的工作与大宗商品交易这个万亿美元级市场有关,那你一定清楚基本面研究的重要性。不论是为了解释当前商品价格形成的内因,还是为了预测未来价格变化的趋势,人们都需要从供给需求两个主要方面收集基本面信息并对其进行分析。

图1 石油交易指数

需求侧的基本面研究需要建立在对与商品相关的整个产业链的深入了解之上,而供给侧的基本面研究则主要围绕着生产和库存这两个角度展开。在基本面研究所涉及到的所有环节中,生产侧研究往往存在较大的不确定性,因而也最容易受到市场中存在的各种“风吹草动”影响

以棉花交易为例,市场需求和库存数据可以通过产业中的渠道获得,信息相对客观。而市场中的一句“今年新疆棉花种植遭遇恶劣天气,产量可能受影响”却往往令人左右为难。貌似利多,但是对市场的具体刺激力度却又难以判断。在很多时候(当然不是所有),交易者要么患得患失结果错失机会,要么将信将疑最终铩羽而归。

“破解生产侧信息的不确定性”,这应该是每个商品交易相关行业从业者的愿望。但是这貌似简单的一句话,背后却充满了挑战。

众所周知,商品交易市场并不是简单的做做买卖而已,其背后代表的是整个世界的运行法则。因此,当我们想要以世界为尺度,对商品的生产进行研究时,首先面临的问题就是“大”。世界太大了,我们可以很轻松就能知道一个村,县的棉花种植情况,到市一级困难就有点困难了,再到后面的省,国家,全球——把信息调查清楚的难度显然越来越大。

正因如此,通常只有国家级机构(如美国农业部等)才能大规模地对商品生产侧信息进行调查,而调查的方式是以地面调查为主。很明显,这样的调查不是每个国家的机构都能承担的。就算勉强支撑,调查的准确性也值得怀疑。也有商业机构提供类似的信息,不过采用的同样是基于地面调查的统计方法。不论是准确性还是时效性,都存在不足。

如何准确地在大范围内对商品生产侧信息进行调查,又能保持较低的成本呢?卫星数据或许是个不错的选择。

你或许也能感受到遥感技术在解决大尺度时空信息问题上所具有的天然优势。要想解决商品生产侧信息的收集问题,不能光凭遥感技术的大尺度特性,还要结合人工智能技术(AI)和数据工程技术,才能真正满足信息准确性方面的要求,并解决长期、大范围调查所带来的海量数据的存储、调用和处理问题。

图2 AI+遥感

在各种技术创新之下,一系列针对商品交易市场的算法的出现,就是水到渠成了。

最典型的例子是对大豆基本面信息的监测。大豆的重要性在于它能够被用于生产两种重要商品——豆粕和豆油。豆油是世界上消费量第二的食用油,而豆粕则是世界上最大的饲料蛋白来源。此外,从近期的中美关系来看,大豆完全可以被称为一种战略性物资。

对于交易者而言,大豆种植季前期基本面研究中最重要的信息是种植面积,因为种植面积与最终的产量直接相关。在当今的市场中,大豆等农产品种植面积信息最重要的参考来源就是美国农业部每年定期发布的种植面积报告。不过,美国并不是全球唯一重要的大豆出口国。交易者以及相关行业从业者还需要关心巴西、阿根廷等国家的数据。然而巴西和阿根廷的数据并不能像美国一般完备,不同来源的数据之间常常有匪夷所思的差异,这种差异也常常给交易者带来困扰。

图3 美国大豆种植面积和产量预测展示

遥感与AI的结合可以帮助解决这个问题。与地面调研不同,遥感与AI结合的方法并不是一种基于统计采样的方法,而是在大范围内完成对大豆等作物的全盘识别,同时不丢失细节信息(如零散地块的作物信息)。卫星遥感影像包含了丰富的光谱信息,再通过AI技术,对特定作物的光谱特征进行分析,建立作物识别模型,便可以将肉眼难以识别的作物提取出来。最后,通过数据工程技术,利用识别模型对卫星遥感影像进行大规模分析,以实现洲际级别的作物识别。

图4 作物识别图

于是,利用上述技术,就能做到对巴西、阿根廷等全球其他产区的大豆种植面积的计算和种植区域的识别。种植区域识别也是很重要的信息,只是在过去并没有很好的数据来源。基于这些信息,可以更清晰地分析天气状况(例如突发性的强降雨或者洪水)对农产品生产的真实影响范围和强度,以实现更加客观且可量化的影响评估。

基于种植面积基本面数据,可以挖掘更深层次的数据——产量预测。将作物种类、光谱信息、气象信息、历史产量等投入到深度学习模型中,可以建立模型对作物单产的进行早期预测。相对于美国农业部等机构的报告,这样的数据可以在时效性上取得优势(发布时间早于机构),而且同样覆盖全球所有主产区。

上面的介绍是虽然以大豆为例,但同样的技术也可以应用于玉米、棉花、甘蔗、油菜等大宗农产品。但有些农产品是比较特殊的,比如棕榈油。与前面提到的农产品不同,油棕榈并不是一种每年定期收获的作物,而是全年滚动生产。同时,棕榈油的产量与油棕榈树的树龄高度相关。

图5 棕榈识别展示图

基于油棕榈的特性,可以对作物基本面监测技术进一步开发。针对油棕榈的基本面监测技术可以实现一年多次(4次以上)的对马来西亚和印尼的油棕榈种植面积的监测。同时,在了解油棕榈种植分布的基础上,可以实现对油棕榈树龄的识别。

对于棕榈油交易者而言,这样的技术实际上是将丰富而细致的基本面信息,以一种前所未有的方式呈现在其面前。他们不仅可以得到油棕榈种植面积,还了解了树龄分布。同时,因为知道种植区域分布,还能结合气象信息来判断气象事件棕榈果的单产的影响。而将以上所有信息集合在一起,便可以更加有效地判断棕榈油的产量,从而实现更好的基本面研究。

除了农产品,“遥感+AI”的技术也可以应用于其他大宗商品的基本面研究,例如石油。通过图像识别技术,可以对石油期货交割库中的原油库存进行分析。通过分析一定太阳入射角下的储油罐浮顶阴影大小,去计算储油罐中的原有存量。当同样的计算覆盖了全球所有的储油罐,石油的库存也就变得更加透明了。这一点非常重要,对于世界上很多石油出口国(包括许多欧佩克国家在内)来讲,自身的石油库存都存在着很大的不确定性,而这些不确定性常常给交易者们造成困扰。

图6 原油监测展示图

同时,随着页岩油革命的登场,美国的页岩油开采逐渐成为国际原油贸易中一股不可忽视的力量,而页岩油的产量与压裂井的数量直接相关。通过图像识别,可以对油井进行提取,不仅能帮助交易者了解井的总数,更能帮助计算井的运营时间。而结合压裂井的产量衰减特性,便可以对页岩油产量进行估算。

以上就是我们对于利用“遥感+AI”对商品基本面研究的一些想法。显然,目前能够解决的问题还只是冰山一角,尚有大量的基本面问题需要我们去解决。正如之前提到的,交易决策更加数据化是大势所趋,尽管有大量的算法问题,模型问题需要去解决,但这也是我们存在的意义。

(文章转载自大地量子)