戴翡翠真的有用吗?
这个问题有意思,首先我们要弄清楚“佩戴”这个行为在珠宝首饰领域里面到底意味着什么——从消费者的角度来看,“佩戴”其实是一个购买决策最终落地的行为;从商家角度看,“销售”才是目的,而“佩戴”则是促成销售的手段之一(毕竟谁也不会大老远的买一个自己压根不会戴的东西回家) 从上述定义我们可以得出这样一个公式: 消费者→购买决策→商家→(出售产品) 其实在这个公式里,我们之所以讨论“是否有用”似乎多此一举,但事实是这样的:因为人们对于自身购买的决策往往是有一定的主观意愿的(譬如一些特殊的日子或者场景会激发人们的购买意愿从而下单购物)这些主观因素实际上是可以被量化成客观指标的,因此我们在研究问题时就可以把这些主观因素转化为客观参数进行统计分析,进而得到一个有实证依据的研究结论。 这正是我利用机器学习算法中的分类算法中K近邻法(KNN)完成相关实验的目的所在。 K近邻法的原理并不复杂,简单地说就是在给定样本数据的情况下寻找最类似的一个“邻居”样本并以此判断新输入的样本属于哪一类。 下面我就以实验数据来说明问题: 在本实验中我一共收集了500个案例作为学习样本,并将这些案例按照是否对佩戴翡翠有作用进行了归类。然后在新的数据上运用K近邻法进行测试,最后得出的预测准确率约为82.8%。 由此我们可以得出这样一项结论: 对于“戴翡翠是否有作用”这一点,K近邻法可以找到大约83%的准确度,也就是说对于大多数情况下的普通人而言,通过计算可以得到一个接近83%的数值,这个数值越大的话就表示“戴翡翠确实对你有帮助/没用帮助”的可能性越大。
当然有人会问了,你这里得出的只是预测的准确率难道不能证明“戴翡翠有没有作用”吗? 这个自然可以,不过需要指出的是当我们需要考虑“概率”的问题时(例如在保险行业里就需要精确计算出每个客户投保之后可能遭受的损失从而计算出保费金额),机器学习模型就要退场了,此时我们需要借助于数理统计学里的方法来处理。