因子研究方法之线性回归. 第28讲

作者: 渔阳
这一次讲一讲一个量化研究最基本的方法,也就是线性回归的方法。主要是两部分内容。首先我们要理解一下线性回归的数学意义和它的数学思想是什么。然后我们也考虑一些关于线性回归的进阶的问题。

欢迎来到量化小学
▲ 加入“量化小学”校友圈儿提问交流
详细内容请在wifi环境下观看视频

<本期课程4865字,视频19分48秒,请合理安排学习时间>
>>(订阅专辑后即可观看精彩的幻灯片视频以及案例操作视频哦)

在量化小学里,我们特别重视研究方法和数学公式背后的思想。线性回归这么一种简单的研究方法,它背后的思想是什么呢?

首先我们要找的是被预测变量Y和预测变量X的某种关系。比如,我们可以用市盈率来对股票未来的超额收益做一个预测。这两件事应该是正相关的,也就是越便宜的股票未来的超额收益越高。

如果我们从一个数学的角度去理解这个问题,可以讲Y(被预测的变量)是由两部分组成的。第一部分是跟X有关的,就是跟这个因子相关的,这是一个可以预测的部分。后面这一项是噪音,是不可预测或者说由于掌握的信息不够全面,还不能预测的部分。

在这儿,f和g两个都是一般意义的数学函数,最基础的模型就是线性的模型。我们如果学过高等数学的话,都知道任何的函数,只要不是太糟糕的比较平滑的函数,它做了泰勒展开之后,一阶的规律都是线性的。

所以我们可以认为线性模型就是这种最一般化的,X和Y之间的数学模型的最简单的表现形式。线性模型也是其他更复杂模型的一个基础,后面我们会看到各种各样非线性的模型,其实里面也有很多线性的成分。

所以线性模型两个重要的组成部分,一个是β,是衡量X和Y之间的关系,另外后面这项ε就是噪音,是模型解释不了的部分。

>>欢迎订阅《量化小学》,加入我们一起学习!

 

写评论

icon-emoji表情
图片