我觉得现在数据行业的人,都有一点满瓶不动半瓶摇的意思,懂一点知识,掌握一个入门工具,看了几篇所谓的大数据洞察文章,就洋洋自得。
譬如还在争执python和R哪个好,决策树和贝叶斯哪个准,写代码的就要鄙视用excel拉透视图的,会算法的就一定要鄙视做报表的等等。
网上,各类数据工具广告满天飞,今天劝你学python,明天劝你学编程,后天又让你抓住excel,也是让人迷惑,我们应该怎么做?怎么选?
就说说开头的三个工具吧。
一、Excel
这东西的知名度虽然谈不上家喻户晓,但职场的都知道吧,你去找个小学生问问,绝大多数也知道这是什么:从简单的表格制作,数据透视表,写公式,再到VBA语言,还有无数的插件。
但是我不知道是什么原因,很多人对它的理解就是,就是一表格工具嘛。
你去用python爬取,用BI连接,总不能每个数据都是从数据库里直接取吧,一些个人的分析,肯定是得用Excel收集数据的,前提是数据量不算很大。
那我还听到一些声音,认为Excel不能处理大数据量,这个是事实,但是换个角度想想,生活中的数据也足够了,能大到哪去?
你让不到50个人的公司去采购BI和报表系统,这明显是不现实的,还是老老实实用Excel吧。
二、BI工具
什么是BI工具,就是为了让老板和负责人更快地做出决策,通常被用作做分析结果层,使用的时候会历经整个数据分析过程:收集-处理-可视化-分析。
而这些,都是Excel做不到的,Excel最多只被用来作为其中的1-2种作用,到真正展示的时候,是上不来台面的,你看智慧城市、阿里的大屏展示,什么时候用过Excel?
就拿FineBI来举例子吧。
当你用FineBI这个工具的时候,你可以发现,它在整个数据分析的流程上带来了改进:
虽然谈不上达到了ETL的水平,但是FineBI内置的一些公式是可以快速地处理和清洗数据。
做数据透视分析,由于数据量很大,传统Excel工具就很吃力,卡掉、死机,FineBI处理大数据量的性能比Excel强很多。
做图形展现,Excel可能会花费很多时间编辑图表,包括颜色、字体的设定,甚至大家经常看到一些Excel技巧类的文章,实现一些精美的图表需要花很多偏门的小技巧才能够完成,而用FineBI的图表组件,你就可以把数据变成各类图表。
你看,在核心的可视化和分析模块,是不是觉得FineBI更加清晰?
BI工具现在有不少,关于好用的BI工具还是有很多争论,不过无论是谁,BI工具都是未来的主流数据分析工具的方向。
三、python
易学、易用、前途无量的编程语言,还和人工智能扯上了关系,但是学好了,能不能找到工作不关我事(开个玩笑)。
上面说到的Excel和FineBI,这两个工具的使用者和python的关系如何?总得来说,上手难度前两者小于python,而且侧重点不一样的。
做个简单的总结吧:
其实当你在行业待久了,层次上去了,就会发现这些工具都是次要的。公司里的人,不管是什么职位,工程师也好,运营也好,BI也好,其实都是在做业务。
但如果还没有那个水平,先用好工具才是正确的路。