3.1 导言¶
原文 | The Elements of Statistical Learning |
---|---|
翻译 | szcf-weiya |
发布 | 2016-09-30 |
更新 | 2017-10-31; 2018-02-22 |
状态 | Done |
更新笔记
@2017.10.31 发现第一次翻译的太粗糙了,实在惭愧;隔了这么久竟也不经常回头看看.
线性回归模型假设回归函数 $\E(Y\mid X)$ 关于输入变量 $X_1,X_2,\ldots,X_p$ 是线性的.虽然线性模型大部分是在统计学的 前计算机时期 (precomputer age of statistics) 发展的,但即使在今天的 计算机时代 (computer era) 仍然有很好的理由去学习、使用线性模型.
weiya 注:统计推断的历史发展
Bradley Efron 和 Trevor Hastie 在 2016 年出了一本书 Computer Age Statistical Inference,按照历史发展介绍了统计推断.按照那本书的划分,第一部分为 Classical Inference,第二部分为 Early Computer Age(1950s-1990s),第三部分为 Twenty-First-Century(1900s-present).
因为它们简单,而且经常能够对输入变量怎样影响输出变量这一问题给出充分的、可解释性的描述.做预测时,线性模型有时比 更花哨的 (fancier) 非线性模型表现得还要好,特别是在 训练样本 (training cases) 很少、低信噪比或者稀疏数据的情况下.
最后,线性方法可以应用到输入变量的变换上,这在很大程度上扩大了其使用范围.这些推广有时被称作基函数方法,将在第 5 章中讨论.
这一章中我们描述用于回归的线性方法,下一章我们将讨论用于分类的线性方法.在某些主题上我们将详细讨论,因为我们坚信理解线性方法对于理解非线性是至关重要的.实际上,许多非线性技巧是线性方法的直接推广.