免费云主机试用三个月


在分类问题中,你要预测的变量y是离散的值,我们将学习一种叫做逻辑回归(LogisticRegression)的算法,这是目前最流行使用最广泛的一种学习算法。

在分类问题中,我们尝试预测的是结果是否属于某一个类(例如正确或错误)。分类问题的例子有:判断一封电子邮件是否是垃圾邮件;判断一次金融交易是否是欺诈;之前我们也谈到了肿瘤分类问题的例子,区别一个肿瘤是恶性的还是良性的。我们从二元的分类问题开始讨论。线性回归为什么不适用于分类问题?回答如下:

在这段内容中,我要给你展示假设函数的表达式,也就是说,在分类问题中,要用什么样的函数来表示我们的假设。此前我们说过,希望我们的分类器的输出值在0和1之间,因此,我们希望想出一个满足某个性质的假设函数,这个性质是它的预测值要在0和1之间。

现在讲下决策边界(decisionboundary)的概念。这个概念能更好地帮助我们理解逻辑回归的假设函数在计算什么。【横坐标变量x1,纵坐标变量x2,训练集的叉叉表示患肿瘤,圆圈表示没换肿瘤】【上图的分界线说的就是边界】