于贵洋的博客

BI、数据分析


  • 首页

  • 分类

  • 标签

  • 归档

  • 站点地图

  • 公益404

  • 关于

  • 搜索

二八定律与长尾理论

发表于 2017-09-18 | 分类于 数据分析思维

二八定律

前面,我们整理了《帕累托的故事》,里面有说过“帕累托法则”,就是这个二八定律,简单说来,就是

世界上20%的人占有80%的财富,即财富的分布式是不平衡的

这里理论不单单应用在经济学领域,其他领域也一样适用。比如:
在零售或销售行业,80%的利润可能来自20%的客户,所以运用该分析方法,就可以专注于维护这20%的客户,而不是将主要精力放在那80%的客户身上,因为他们只产生了20%的利润。通过80/20分析方法,可以有效的找到影响利润的主要因素

二八定律应用场景

这里列举几个广泛使用的场景

  • 在管理学中,企业80%的利润来自20%的项目或客户
  • 心理学中,20%的人身上集中了80%的智慧,他们一出生就鹤立鸡群
  • 20%的有目标,80%的人爱瞎想
  • 20%的人把握机会,80%错失机会
  • 20%的人会坚持,80%的人会放弃
阅读全文 »

帕累托的故事

发表于 2017-09-18 | 分类于 随笔

周末听Tableau的一个培训,遇到一个帕累托图,就是关于二八定律的那个帕累托,就想着,他到底是干嘛的呢,然后,就有了这篇《帕累托的故事》,让我们开始了解一下这个经济学家。

帕累托简介

维弗雷多·帕累托(Vilfredo Pareto ,1848年7月15日—1923年8月19日),意大利经济学家、社会学家,洛桑学派的主要代表之一。生于巴黎,曾就读于意大利都灵大学,后来任瑞士洛桑大学教授。
– 百度百科

哦,他是一个经济学家、社会学家,怪不得会提出“20%的人掌握着百分之80%的财富”,以前,是先知道这句话,然后才知道帕累托的大名的。

洛桑学派

洛桑学派主要代表之一,什么是洛桑学派,干嘛的呢?估计是因为在洛桑大学任教,所以统称为“洛桑学派”吧

“洛桑学派”指的是,以法国人瓦尔拉斯和意大利人帕累托为中心的新古典思想流派的一支。洛桑学派的主要特点在于它对一般均衡理论的推进,从而在广度上和深度上都扩大了新古典研究方法在经济学上的适用性。洛桑学派也被称为“数理学派”(因为它们强调数理的解释说明)或者“意大利学派”(因为在早期的队伍里有很多意大利人)。
– 百度百科

阅读全文 »

MySQL-自增列

发表于 2017-09-12 | 分类于 MySQL

MySQL
自增列

什么是自增列

自增列就是一个自动增长的列,他没有什么业务含义,一般可能用来做主键,作为唯一标识。
自增列一般是一个整数,相比其他的UUID占用的存储更少,网络资源占用也少。如果考虑其他因素的话,UUID使用也很多。
实际应用还要考虑很多问题,不能单纯的使用

自增列是使用

我们可以再create table的时候,就定义好自增列
我们使用关键字 auto_increment 来指定。

1
2
3
4
5
mysql> create table t_book_1(
-> id int auto_increment,
-> f_name varchar(10),
-> primary key(id)
-> );

这里的话,一定要让自增列是主键,不然会报错

阅读全文 »

MySQL-聚合函数

发表于 2017-09-11 | 分类于 MySQL

MySQL
聚合函数

聚合函数也是函数的一种,比较常用,这里我们就单独拿出来介绍下。
聚合函数一般配合group by来使用,经常是用来对数据集中的数值求和、平均值啊这里类的。

聚合函数的默认特性

  • 忽略NULL值
  • 如果没有匹配的记录,返回NULL
  • 如果没有使用group by,则默认对所有字段进行group by

常用聚合函数

这里的测试数据依然使用前面的数据,可以参考前面的文章。

count

统计结果集的数量,没有结果时,返回0

1
2
3
4
5
6
7
8
9
10
11
12
13
-- 我们以学生表为例,来统计每个班级的学生人数
select
c_id,count(1),
count(s_id),
-- 这里学生ID是唯一的,所以是否使用distinct是一样的
count(distinct s_id),
-- 统计班级的个数
count(distinct c_id)
from
t_student
group by
c_id;

count

阅读全文 »

MySQL-子查询的使用

发表于 2017-09-11 | 分类于 MySQL

MySQL
变量的使用

什么是子查询

子查询是将一个 SELECT 语句的查询结果作为中间结果,供另一个 SQL 语句调用。
像这样:

1
2
-- 我们将学生表中的所有班级ID当做中间结果
select *from t_class where c_id in (select distinct c_id from t_student);

常用比较符

子查询最常用的用法:

non_subquery_operand comparison_operator (subquery)
其中操作符通常为
= > < >= <= <> != <=>

其他的都不说了,这里说下这个<=>,以前还真没用过
<=>和=比较类似,也是判断是否相等,相等返回1,不相等返回2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
mysql> select 1<=>1,1<=>2;
+-------+-------+
| 1<=>1 | 1<=>2 |
+-------+-------+
| 1 | 0 |
+-------+-------+
1 row in set
mysql> select 1=1,1=2;
+-----+-----+
| 1=1 | 1=2 |
+-----+-----+
| 1 | 0 |
+-----+-----+
1 row in set

和=不一样的地方,是对NULL的支持,用<=>可以判断是否为null,而等号则是出现null,结果就为null

1
2
3
4
5
6
7
mysql> select 1<=>null,null<=>null,1=null,null=null;
+----------+-------------+--------+-----------+
| 1<=>null | null<=>null | 1=null | null=null |
+----------+-------------+--------+-----------+
| 0 | 1 | NULL | NULL |
+----------+-------------+--------+-----------+
1 row in set

阅读全文 »
1…456…23
于贵洋

于贵洋

111 日志
17 分类
30 标签
RSS
GitHub
友情链接
  • 很久之前的CSDN博客
0%
© 2017 于贵洋
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.3
Hosted by GitHub Pages
本站访客数 人次 本站总访问量 次