概率论基础模型02
2025/10/15大约 2 分钟约 476 字
概率论基础模型(用到多少,学多少 =_=)
皮尔逊相关系数(Pearson correlation coefficient)
皮尔逊相关系数(通常记作
取值范围:
含义:
:完全正线性相关(一个变量增大,另一个变量严格增大) :完全负线性相关(一个变量增大,另一个变量严格减小) :无线性相关(可能存在非线性关系,但没有线性趋势)
假设有两个变量
其中:
另一种形式(协方差形式)
分别是 和 的标准差
这也说明了皮尔逊相关系数本质上是标准化的协方差,即协方差除以变量的尺度。
性质
范围:
对称性:
无量纲:由于标准化,结果不受单位影响
线性敏感:只衡量线性关系,对非线性相关可能为 0
对离群点敏感:极端值可能显著改变 (r)
直观理解
正相关 (r>0):点大致沿右上到左下的方向排列
负相关 (r<0):点大致沿左上到右下排列
不相关 (r\approx 0):点散乱,无法用直线描述趋势
