商业 * 统计 * 计算机

Business analytics到底学什么,很多同学都有这个问题,网上有些解释比较笼统,大多也是没读过business analytics的人士总结的。我这篇文章用比较通俗易懂的语言,来给大家介绍下business analytics到底学什么。

Business analytics不仅在国内没有任何大学开设过这个专业,就算是在美国也是最近3年才涌现出来的一个新兴学科。要回答business analytics学什么,就要先明白为什么会出现business analytics这个专业。Business analytics专业的出现,完全是被社会企业用人的需求所倒逼出来的。而这个需求的诞生,归根到底就是三个字:大数据。2007年移动互联网出现后,企业经营的数据大量增加。以前企业用Excel、Word做做财务、市场、运营的分析就可以了,现在出现了大量新的数据可以帮助企业了解消费者、提升运营水平。大家都知道数据是金矿,于是肯定要人去分析这些数据。但以前企业的business analyst一看到这样大量的数据就傻眼了。数据往往大到下载到excel里面直接excel爆掉的程度。即使切成小块,动不动几百列的数据,缺乏统计知识的传统business analyst完全不知道怎么去分析。于是有的企业说,我们不是有统计专业的同学吗,把他们从生产车间、制药实验室里面拉出来,让他们来分析分析。结果发现统计专业的同学对分析实验结果很在行,对business和市场却是一窍不通。另外,传统的business analyst和学统计的同学,面对储存数据的系统、逐渐流行的分析数据的开源软件,也就是计算机方面的东西,明显知识储备不足。但找学计算机的码农来做数据分析,他们对商业和统计知识基本一无所知。也就是说,分析企业中的数据,也就是business analytics这个领域,是business、statistics和computer science三个领域知识的结合。传统的business analyst、statistician和码农如果能够合体,才能成为适合新时代的business analytics人员。于是企业要求学校,特别是商学院,开设这样的专业,培养对business、统计和计算机都有所掌握的人员,于是business analytics孕育而生。

看到这里你应该明白了,business analytics要学的东西,就是三个方面:business 、统计、计算机。这里的business我不想多做说明,和大家熟知的business 的课程是一致的,就是marketing、 finance这些。但是统计和计算机,则和传统的统计和计算机教学有很大的差别。我接下来详细讲一下。

传统的统计,主要是学习对实验结果做显著性检验,比如一队小白鼠吃药,一队小白鼠不吃药,谁的身体比较好?有没有显著性的差别?以前商业中大量招聘统计专业同学的是市场调研机构:一队消费者看了广告,一队消费者没看广告,谁对品牌认知度高?有没有显著性区别?另外,统计讲究抽样,消费者太多没办法一一访问,于是抽样,于是就要看抽样的合理性。现代企业中的数据分析,可以说和这些传统的统计方法,有了很大的改变。business analytics的统计知识,主要是学习如何建立和评估多变量的统计模型,最典型的例子就是回归分析模型。回归分析在传统的统计中,可能只是重要的一块而已,而在business analytics的教育中的统计部分,几乎是全部。除了回归分析(包括逻辑回归),其他business analytics中要学的统计知识差不多也就是相关系数、时间序列之类,也都是小头。传统统计中的显著性检验、抽样方法,business analytics基本不教。所以我看到我去年辅导的学员从UT business analytics毕业了去沃尔玛做senior statistical analyst,我觉得很搞笑。她去考国内统计专业大一的专业课,估计都不懂。只能说沃尔玛其实需要的就是现代的business analytics人员,但老title一直没换。

接下来说下business analytics要学的计算机知识。计算机博大精深,幸运的是business analytics只用学其中可能是最简单的三块:第一就是数据库和SQL,因为企业里面数据都是储存在系统里面的。你要分析数据,首先要知道怎么把数据按照你要的方式提取出来。这就是用SQL写代码提取数据。学校一般不会花很多时间去教你,但是这个是学、做analytics的基础的基础。第二就是学习怎么在统计软件中进行编程。以前提到分析数据,国内最熟悉的是SPSS,像Excel一样妥妥拽拽就行了。但其实美国根本就没人用。现在分析数据的流行工具,必须通过写代码的方式进行操作,最典型的工具就是R和Python。这里的编程,其实是统计编程,和真正编网站的C语言、Java是很不一样的,也容易的多,但是仍是类似的编程思维。第三要学的计算机知识就是现在最流行的机器学习,机器学习基本上是代替和补充前面所说的回归分析等统计模型方法。做的事情几乎是一样的,就是建模,但做的方法是计算机的。不过很多原则其实和统计的回归分析是一样的,也都是用R或者Python的代码来实现,实现起来,不会比回归分析难太多,大家大可放心。

说了这么多,我们来举个企业里面数据分析的例子来对应相应business analytics要学的技能。你要分析可口可乐的广告投放是否有作用。传统的business analyst说了一堆逻辑,只有简单的数据图表支持。你说,啥年代了,还不拿历史存储的大数据说话?市场调研公司里面的统计专家告诉你应该抽样发问卷调研消费者,你也让他一边去,过去广告投放的时间、区域和销量的变化数据全调出来进行多变量的建模,还搞什么抽样调研。于是你作为business analytics的毕业生,首先运用对business、市场的知识对问题进行分析,比如,广告是如何影响销量的?投少了会不会没作用?投多了是不是边际效应递减?除了广告之外,还需要考虑哪些其他的变量?电视、互联网广告,是否有1+1大于2或者小于2的内在联系?商业分析的框架搭好后,就是数据分析了。你首先非常熟悉公司的数据库架构,然后用学过的SQL知识写SQL代码把数据从数据库里按照你的要求提取出来。进行了简单的数据清理整理探索之后,你就开始建立统计回归模型,而这个建模的过程,你都是在R或者Python通过写代码完成的。你可以在R或者Python里面除了回归分析,也试试机器学习,对回归分析进行一个补充,比如检查是否有些变量被回归分析的模型所遗漏。这些也就是在R和Python里面多写几行代码。最后,你run出了模型的结果,你要用你的统计知识对结果进行分析,判断广告到底对销量是如何影响。最后结合你的business的知识,对你的老板进行汇报。

以上这些,都是这些年学business analytics、做business analytics的总结,希望对大家有帮助。大家如果有任何疑问,欢迎和我们联系。

Posted in Business Analytics.