以使得与直线上每个数据点的垂直距离最小,总距离是所有数据点的垂直距离的平方和,其思想是通过最小化这个平方误差或距离来拟合模型。”
“它的难点不在得出预测值,而在于如何更加精确!”
“第二种,Logistic regression逻辑回归,与线性回归类似,但是逻辑回归的结果只能有两个值,如果说线性回归是在预测一个开放的值,那逻辑回归更像是做一道是或不是的判断题。”
说到这里,王东来特意补充了一句:“逻辑回归其实用在杭州马和狗东这样的电商平台,或者是今年刚获得E轮融资3.5亿美元的饿了吗这样的外卖平台上才是最合适的,可以用来预测用户对品类的购买偏好,如果你们毕业后有意加入这些公司的话,可以多关注这方面。”
王东来的语气平静,说起逻辑回归对电商平台和外卖平台的重要性,也是一副毫不在乎的样子。
就连在下面的诸多学生也能听得出来,王东来的语气之中对于电商平台和外卖平台的不在意,甚至是不喜。
来不及多想,王东来就又讲了起来。
“第三种便是决策树,如果说线性和逻辑回归都是把任务在一个回合内结束,那么决策树就是一个多步走的动作,它同样用于回归和分类任务中,不过场景更加复杂和具体。”
“举个例子,就像是我面对你们这个班级,如何分辨出哪些是好学生?如果只是依据高考成绩,或者出一套试卷让你们做的话,唯分数论的话,就有些太粗暴了。”
“那么,我就可以从作业、态度、出勤、提问等方面分开讨论,每一个有分叉的圈称为节点,在每一个节点上,根据可用的特征询问有关数据的问题,左右分支代表可能的答案,最终节点对应一个预测值,每个特征的鹅重要性都是通过自顶向下方法确定的,节点越高,其属性也就越高,比如说我如果觉得勤奋比成绩更重要,所以勤奋的节点就高。”
“第四种,Naive Bayes朴素贝叶斯,是基于贝叶斯定理,即两个条件关系之间,它测量每个类的概率,每个类的条件概率该出的x值。”
“用非术语解释贝叶斯定理,那就是通过A条件下发生B的概率,去得出B条件下发生A的概率,当然了,这个过程中还要引入一些其他数据用以确保结论正确。”
“第五种,Artificial Neural Networks人工神经网络,其本质是一组带有权值的边和节点组成的
本章未完,请点击下一页继续阅读!