文章来源: 知乎专栏 数据分析狮 许多孩子在高中毕业时,才猛然发现,不知道自己以后要干什么,遑论选择一个好专业了
往往都是,分数有多高,就报一个分数差不多的专业,甚至有一些专业之前都没听过
比如,建筑系一位教授就抱怨说,来到这里的很多同学,会考试,会得分,但是建筑最基本的要求,空间想象能力,不够,这直接导致专业兴趣不高
然后,这些孩子进入大学,发现学习环境和高中大大不同,不适应,网上总会适时地流传一些考分无用,能力第一的言论,一些孩子就跟风在宿舍窝着,最后毕业,发现失业了
因此,从小了解各种职业的特点,为孩子的未来做好准备,是十分必要的
下面要分享的是,近两年最热的互联网中最热的词:大数据分析师
他的经历告诉我们,学习不只是在学校的事,在社会上,学习能力的高低甚至可以决定offer的去留
作为一名热爱数据分析、通过努力拿到心仪offer的学生,是许许多多通过努力实现目标的学生中的普通一员
一路走来,我把自己的经历按照时间线写下来,中间穿插我的经验,在记录自己工作的同时,希望能给想要进入数据分析师岗位的学弟学妹们一点点的小收获
一、本科4年,初识数学建模,爱上统计 关键词:数学建模、大数据时代 从小就特别喜欢数学,高考146,大一时特别顺理成章的参加了数学建模的校内比赛,接着一直到大三,参加各种数学建模比赛,也是在比赛中,认识了我一辈子的好朋友——我的队友
大二时拿了大学生数学建模省一等奖,大三拿了美国大学生数学建模比赛一等奖
直接引导我想走数据这条路的,是我在大二时修的统计学基础的课程,老师讲得特别好,上课时讲解样本、抽样这些概念时,我听得津津有味,也是那时候,大数据的概念慢慢火起来,我买了当时最火的一本书——《大数据时代》
那时,第一次听说了啤酒与尿不湿的故事
接着,上网百度了大数据时代,好嘛,说行业欣欣向荣,人才需求旺盛,好嘛,哥来了,无论如何要投入大数据的怀抱! 那时候对统计的基础知识还是有的,SPSS能给熟练使用,由于数据建模比赛,小小的学了点matlab、sas,不过现在还没整太明白(哥可是负责建模和写论文的好嘛!)那时候还对SQL完全没概念
二、信息管理专业 关键词:数据挖掘概念与技术、统计学 当时的梦想就是去阿里巴巴工作,原因很简单,离家近、海量、超级有价值的电商数据,马云大大,等我! 研一课程特别多,那先好好上课吧!过去1年多,几乎所有课程内容我都忘记了(囧)
唯有2门课程认真听讲了,其一是我们院长叶强老师讲的数据挖掘,推荐教程是《数据挖掘概念与技术》,韩家炜老师写的,行业大拿啊,数据分析、数据挖掘行业的入门书籍呀!那时候知道了k-means聚类、神经网络、关联规则这些牛逼哄哄的算法,嗯,搞数据的大概就是做这些的吧,听起来还有点小激动呢!其二是葛虹老师讲的高级统计学,扎扎实实的又把统计学的基本方法学习了一遍,相关分析、回归分析、时间序列、多元回归、logistics回归,然后每2周一次的上机实验,拿数据用SPSS、Excel分析,实际的操作了数据分析
三、学习,积累,陷阱,进步 关键词:学习、定位 我们专业毕业做据分析师这个岗位的还是少(我们专业可是叫信息管理,去ERP公司比如SAP才是王道哎呦喂)
只能在网上搜索
首先,我知道了中国统计网,这是个不错的网站,关于技术的、业务的、统计基础知识的,都有,对于我要成为一名数据分析师很有帮助
再然后,我在知乎上找到了这个人,卡牌大师,找到了这样一个答案 https://www. zhihu.com/question/2926 5587/answer/44010658 ,从此, 我就跳到了一个大大的坑里面 ,陷入了无穷无尽的python和R学习中,导致对于我,有点本末倒置
以为数据分析师是整天用python和R写各种高大上的代码的
但实际上,这是因为现在业界对于数据分析师、数据挖掘师、算法工程师这几类岗位的界定不清楚
但就以我现在3段数据分析师的工作经历来看,这三类还是可以很清楚的区分开来的,也给学弟学妹们提个醒,找好自己的定位: 【1、数据分析师,主要技能SQL、Excel,从数据库里写SQL语句得到数据,然后在EXCEL里加工可视化后做成报表或者报告,利用你的商业敏感度,给出可靠的结论
听起来很简单是不是,但这其中需要的商业敏感度,确是最需要积累的
具体方向有3个:数据产品、决策支持、数据运营
其中, 数据产品 PK需求把控&项目管控能力; 决策支持 PK商业sense(例如做营销,360网址导航这种每月几百万的框架到底要不要签?); 数据运营 PK提炼特征能力综上,你会发现在互联网公司,数据分析师要处理的问题,跟营销、产品、运营一样
2、算法工程师,主要技能数学功底+统计功底+实打实的写代码能力+看论文读最新算法论文的能力
要求相当高
对应岗位推荐算法工程师、搜索算法工程师、文本挖掘、语音识别、图像处理这类算法工程师
比如阿里,做推荐的算法工程师基于访客、商品、商家的在线、离线信息等等数据库的数据,来得到一套推荐的逻辑,通俗点说,怎么给出个公司,给每个商品算个得分,排列出来给买家看到,买家会想要买更多的商品
而这背后的算法,其实市面上大部分机器学习的书都覆盖不到,是需要算法工程师基于算法基本功(数据结构、核心算法范式)+商业感觉(业务逻辑、综合行业运营、分析师的假设经验)+利用数据不断的实验迭代得到最好的结果、获得参数、还要担心本身样本不随机带来的系统偏差等等问题
3、数据挖掘工程师/数据科学,当用户的行为通过日志等形式被记录后,数据挖掘/数据科学便成为认知用户的工具
通过KDD工程标准化的流程,即:业务理解、数据理解、数据处理、建模、评估、部署的过程、业务理解是基础,只有正确、全面的理解了业务逻辑,后面的挖掘才是有理可据的,通常需要结合数据分析师提供的经验
实际中常用的算法有分类、预测、关联规则这几类,往往可以解决实际中绝大部分问题
与算法工程师的技能要求相似,区别在于算法工程师的工作往往用于改进产品表现;数据挖掘工程师用于挖掘用户的性质
前者是事中,后者是事后
】 听了介绍,你应该比较理解了!其实最简单的找到自己定位的方法,就是找到你心仪公司的校招岗位,看底下的岗位要求,找到你最感兴趣的、跟你的能力和经历最匹配的,就可以啦!So easy!妈妈再也不要担心我找不到方向啦!哈哈哈! 四、研一寒假,第一次实习经历 关键词:第一次实习 对于找工作,我很着急,生怕找不到工作,于是乎,快寒假的时候,那时候我才转专业1个学期哟,我就开始在网上投实习简历了,我在拉勾网上投的简历
是一个创业公司,主营业务是数据驱使的营销策划公司
跟我还挺对口的,营销和数据的结合嘛~获取数据的主要途径是网络爬虫获取,分析方法是文本数据挖掘
举个例子,当时我在的项目组是电动汽车的销售现状分析
首先,了解到汽车之家、爱卡汽车等汽车论坛是汽车类数据的一个非常重要的来源,论坛上包含口碑、价格、评论等数据,非常的全面
于是,团队里面的一个计算机专业的博士,就负责用网络爬虫,把数据爬取下来,然后我们用公司自己写的一套软件进行分词,然后词频统计,词条关联分析,然后blabla的给出一套分析结果,然后blabla的给出营销解决方案
就酱紫~ 实习了大概1个月,就过年了,然后我就回家了,挺对不起老板的! 五、调整学习方向,学习数据库和 SQL 关键词:SQL、调整方向 经过第一段实习,以及我百度的有关数据分析师的文章,我知道了数据分析师要求的精髓:业务理解+SQL、Excel等技能,于是乎,我开始调整了我的学习内容:重点了解如何对一个公司的业务进行分析、SQL语句、Excel提高
六、课程基本结束,我去北京找实习 关键词:投简历、面试 研究生课程基本在2015年4月就结束了,我非常着急找实习,始终认为实习才是找到好工作最重要的敲门砖(事实证明真的是如此!)于是乎,我又开始投简历,拉勾网,应届生招聘网(我投简历的途径比较单一,其实找学长学姐推荐也是非常不错的一个选择,大家一定要多多和自己的学长学姐交流,他们都是非常乐意和学弟学妹分享经验的!)投了大概有20家吧,城市都是北京,岗位都是数据分析师
于是我和面试官沟通,把面试都安排到一周内,于是我就到北京参加一连串的面试了
1、聚美优品的数据分析师
我按照和HR约定的时间提前到了,还做了一套性格测试的题目,填了份需要写家庭情况的问卷
填完之后,我就在等了,然后HR来跟我说,要面试我的那个boss现在在开会,不知道到什么时候,让我明天来
Over! 2、美团外卖的数据分析师,面试前还进行了一轮笔试,考的是纯纯的SQL题目,当时我SQL还不是那么熟练,不太确定的发给我的同学让帮忙看一下,哈哈~~然后面试时候的流程很规范化,看看笔试题、介绍自己、介绍项目、对美团外卖了解不了解、和其他的竞争对手对比怎么样(这个问题真的挺重要的,很多面试官都会问,答案也能扩展他们的思路啊,多一举多得的好题目呀)
当时因为我真的不知道面试的部门是外卖部门,所以回答的不太好最后问我有没有什么问题我问了:平常分析工具都有哪些?其他忘记了 3、联想的用户研究 4、百度商务搜索部的数据分析师3轮面试
第一轮,主要让我介绍自己的项目,我就blabla说,第一轮面试官是校友,我还尝试套一下近乎,心中窃喜
第二轮,问了我许多算法的东西,让我现场画神经网络的示意图,让我写k均值聚类的建模过程(内心os:阿西吧,投错岗位了,数学模型写公式这些我都不会呀,平常就是直接丢到程序里面跑的)
硬着头皮把我知道的一点点写了下来
然后就是问我有什么问题吗?我回答:没有什么问题了(我是真的不知道问什么呀!!!)好了,居然还有第三轮,面试官很忙的样子,中间一直还得在电脑上和同事交流
直接把电脑给我,给我一个数据,让我写一段程序,实现分组······听起来很简单对吧,我尝试用了python,毕竟我还是买了几本python书学习过的,但是吧,学了等于没血,我写不好······至此,我知道,肯定没有希望了
(不管是实习还是正式工作,公司招聘人员都希望招到一个马上上手就可以做事的人,你不会,那对不起,再见;一定要根据自己的技能来对应岗位投递,要不然,只能是浪费时间,自取其辱···) 5、nice
以前我根本没有听过nice
投岗位的时候也是不经意,可能是看到薪资很高吧(6k,其他公司都是100块/天,工资能给这么高的公司,应该还不错吧)
当时的我,毫不犹豫的说可以啊!(其实说真的,实习3个月,公司的培养成本很高的,实习生也学不到什么东西
但是对于我们学生来说,很难有3个月的整时间来实习
所以,一旦问到实习时间的问题,如果你真觉得这个岗位不错的话,一定先要答应说可以实习3个月,毕竟我们找工作不容易嘛,嘤嘤嘤,不要骂我···)然后HR说,好,他再跟boss商量下
我说好
这是一次非常好的面试和一次非常棒的实习! 面试主要问3部分:(1)我自己的项目介绍
(2)SQL语句左连接、右连接,各种查询(3)对nice这个产品的分析
全程面试官非常专业,问的问题很有水平,语气非常谦和,反正就是舒服!面试结束,等结果,第二天通知过了,问我什么时候能去实习
一个星期后,基本上结果都下来了,拿到了nice、美团、联想的实习offer,选择去nice
七、从5月到9月,踏实学习工作的5个月 关键词:nice、《数据挖掘与数据化运营实战》、SQL 回忆这半年,思绪万千,总结来说,付出就有收获!我在nice的技术部门的数据组,做数据分析师,满足运营、市场等部门的数据需求,自己根据对业务的了解做数据分析
前2个月,我认真学习,阅读公司的学习资料,熟练写SQL,运用Excel,阅读书籍,推荐几本书,《数据挖掘与数据化运营实战》,《数据化管理》,《谁说菜鸟不会数据分析》,值得数据分析的实习生们反复阅读,提升对业务分析的理解,也足够应对面试官们给出的业务分析的题目
再2个月,潜心学习python,希望能用python解决Excel处理不了的海量(上百万、上千万条)数据,并且提高我的工作效率,毕竟我在的是技术组
从6月开始,我就开始潜心准备阿里巴巴数据分析师的内推了阿里巴巴是我一直非常想去的公司
在7月底8月初,陆续参加了3轮技术面试+1轮HR面试,拿到内推的offer
然后非常幸运的是,8月初参加了nice一年一度的国外旅行,去了日本!!!好公司呀好公司!!!8、9月份已经能够比较自如的应对工作的需求
认识了一个非常好的领导,一群非常棒的小伙伴,特别开心,离职的时候特别舍不得大家
八、我是如何准备阿里内推的 关键词:阿里巴巴7月内推、充分准备 阿里内推大概是7月底开始,我找了我公司的同事的同学帮我内推(只要是阿里巴巴的员工都可以帮忙推荐,可以联系自己在阿里巴巴工作的学长学姐帮忙推荐,或者联系我也可以^_^)
) 古话说,不打无准备之仗,我有一个好习惯:提前做好准备
比如,准备阿里内推,我写了一份10000字的文档: (1)按照我自己的思路,按照比较口语化的文字,整理好我的每个实习经历、项目经历、比赛经历,保证一旦问到介绍自己的经历时,就可以非常思路清晰的、流畅的回答出来
(2)准备好淘宝分析相关的问题,比如我准备了:数据技术及产品部介绍、淘宝数据分析工具有哪些、淘宝数据产品技术架构、淘宝监控的数据、中秋淘宝月饼购买报告、淘宝店铺流量来源与构成、手机淘宝用户行为分析、淘宝数据分析:基础方法、母婴数据分析、我对数据分析师的理解、淘宝100指数等这些问题
事实证明,这些问题极大地扩展了我回答面试题目时候的思路,有的还是完全一样的题目,提前准备好,保证面试时胸有成竹,不慌不乱! 3轮技术面试基本的步骤都是:“介绍自己的项目”+“几个淘宝业务分析的题目”+“你有什么想问我们的吗?”这样的顺序
十、尘埃落定 现在的我已经入职了阿里巴巴数据分析师的岗位,实现了自己目标的感觉真好! 我总结我的这一路就是: 找定位——练技能——实习再实习——定工作,多学习、多阅读、多沟通
希望学弟学妹们最终能够获得心仪的offer!