于贵洋的博客

BI、数据分析


  • 首页

  • 分类

  • 标签

  • 归档

  • 站点地图

  • 公益404

  • 关于

  • 搜索

读书笔记-数据分析实战(3章)

发表于 2017-09-04 | 分类于 读书笔记

读书笔记

《数据分析实战》

从第3章开始,都是从一个实际问题出发,套用,前面的数据分析思路,来进行模拟分析。
第3章的主题是“销售额为什么会减少?”:一款社交游戏本月的销售额相较于上月有所下滑,于是想调查下滑的原因,来提升销售额。

现状和预期

现状肯定是当月销售额下降,预期肯定是保持上升,等于甚至高于上月销售额,这里的话,要确定销售额下降是不是一个问题,因为该社交游戏一直保持稳定增长,所以突然下滑,一定是不正常的, 是一个问题。

发现问题

我们明确了现状和预期,需要从中,找出影响最大的因素。
上面说到,有3种方法去发现问题:

  • 观察数据大小
  • 数据分解(指标拆解)
  • 数据对比

这一步,也是一个根据经验来提出假设的过程,我们需要从宏观角度,找到可能影响销售额的因素。
我感觉,这一步是数据分析切入的点,比较重要,如果这一步没有发现核心问题,那后面的数据收集和分析都会有问题。

书中,在这一步,提出的问题是“商业宣传上存在问题”,对了,这一步,还需要及时和其他部门去沟通,像这种市场推广、商业宣传,本身我们可能不知道,所以,假设后要去确认是否有这样的情况。

阅读全文 »

数据分析案例-购物篮分析

发表于 2017-09-01 | 分类于 数据分析

数据分析案例

说到数据分析、数据挖掘,我们首先想到的可能就是沃尔玛那个“啤酒与尿布”的故事,它告诉我们,世间万物都有着千丝万缕的联系。这其中使用的数据分析方法就是“关联分析”。

什么是购物篮分析

购物篮分析(Market Basket Analysis),购物篮就是我们去超市使用的篮子,结账的时候,购物篮中所有的商品都会被一起结算。所谓的购物篮分析就是通过购物篮子所反应的信息来==研究顾客的购买行为==

阅读全文 »

读书笔记-数据分析实战(1、2章)

发表于 2017-09-01 | 分类于 读书笔记

读书笔记

《数据分析实战》

1. 什么是数据科学家

书中通过“什么是数据”和“数据在商业中的应用”,推导出数据科学家的定义。

人们通过观测数据来推测出某种因果关系,再用这种因果关系来预测未来或者控制原因以达到预期的结果。把从事这种工作的人成为数据科学家。
– 书中摘录

上面的定义觉得不是很清晰,就百度上找了找:

数据科学家是指能采用科学方法、运用数据挖掘工具对复杂多量的数字、符号、文字、网址、音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师)。一个优秀的数据科学家需要具备的素质有:懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用、懂决策分析等。
– 百度百科

我觉得数据科学家就是对于数据相关的所有门类都有一个整体的认识,感觉是个“杂家”,精通算法、什么深度学习、机器学习、AI之类的都是信手拈来,对我就是神一样的存在了,努力吧,同学。

阅读全文 »

SQL笔试题-连续登录天数

发表于 2017-08-31 | 分类于 笔试题

SQL笔试题

下面的SQL基于PostgreSQL

1.用户连续登录天数

背景描述

现在我们有一张用户登录日志表,记录用户每天的登录时间,我们想要统计一下,用户每次连续登录的开始日期和结束日期,以及连续登录天数。

用户ID 登录日期
1001 2017-01-01
1001 2017-01-02
1001 2017-01-04
1001 2017-01-06
1002 2017-01-02
1002 2017-01-03

同学们先思考下,整理下思路,如果没有思路或者某几个点不了解,就可以继续往下看了。

阅读全文 »

SQL笔试题-行转列

发表于 2017-08-28 | 分类于 笔试题

SQL笔试题

下面的SQL基于PostgreSQL

1. 行转列

背景

我们写SQL的时候,经常会遇到一些列转行、行转列的情况,有的时候是为了展现需要,有的时候是代码里就得这样转一下。总之嘞,得掌握这个技巧。下面就开始我们的练习。

测试数据

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
CREATE TABLE interview.tm_score
(
stu_name character varying(20), -- 学生名称
course_name character varying(20), -- 课程名称
score numeric(10,0) -- 分数
)
WITH (
OIDS=FALSE
);
-- 初始化数据
insert into interview.tm_score values('路飞','数学',100);
insert into interview.tm_score values('路飞','语文',62);
insert into interview.tm_score values('路飞','英语',98);
insert into interview.tm_score values('索隆','数学',40);
insert into interview.tm_score values('索隆','语文',57);
insert into interview.tm_score values('索隆','英语',40);
insert into interview.tm_score values('娜美','数学',42);
insert into interview.tm_score values('娜美','语文',44);
insert into interview.tm_score values('娜美','英语',28);

data-analyst-interview-sql-02-01

阅读全文 »
1…789…23
于贵洋

于贵洋

111 日志
17 分类
30 标签
RSS
GitHub
友情链接
  • 很久之前的CSDN博客
0%
© 2017 于贵洋
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.3
Hosted by GitHub Pages
本站访客数 人次 本站总访问量 次