Skip to content

3.1 导言

原文 The Elements of Statistical Learning
翻译 szcf-weiya
时间 2016-08-02
更新 2017-10-31; 2018-02-22
状态 Done

更新笔记

@2017.10.31 发现第一次翻译的太粗糙了,实在惭愧;隔了这么久竟也不经常回头看看.

线性回归模型假设回归函数 $\E(Y\mid X)$ 关于输入变量 $X_1,X_2,\ldots,X_p$ 是线性的.虽然线性模型大部分是在统计学的 前计算机时期 (precomputer age of statistics) 发展的,但即使在今天的 计算机时代 (computer era) 仍然有很好的理由去学习、使用线性模型.

weiya 注:统计推断的历史发展

Bradley Efron 和 Trevor Hastie 在 2016 年出了一本书 Computer Age Statistical Inference,按照历史发展介绍了统计推断.按照那本书的划分,第一部分为 Classical Inference,第二部分为 Early Computer Age(1950s-1990s),第三部分为 Twenty-First-Century(1900s-present).

因为它们简单,而且经常能够对输入变量怎样影响输出变量这一问题给出充分的、可解释性的描述.做预测时,线性模型有时比 更花哨的 (fancier) 非线性模型表现得还要好,特别是在 训练样本 (training cases) 很少、低信噪比或者稀疏数据的情况下.

最后,线性方法可以应用到输入变量的变换上,这在很大程度上扩大了其使用范围.这些推广有时被称作基函数方法,将在第 5 章中讨论.

这一章中我们描述用于回归的线性方法,下一章我们将讨论用于分类的线性方法.在某些主题上我们将详细讨论,因为我们坚信理解线性方法对于理解非线性是至关重要的.实际上,许多非线性技巧是线性方法的直接推广.

Comments