TA的每日心情 | 无聊 3 天前 |
---|
签到天数: 530 天 连续签到: 2 天 [LV.9]测试副司令
|
1测试积点
统计一个数据的异常点,用箱型图分析,异常点标注的是用圆圈,因为有几个值几乎重叠,圆圈看着太大了,看了官方文档也找不到在哪里改标注,不懂哪里修改成'+'。
- #-*- coding: utf-8 -*-
- import pandas as pd
- catering_sale = r'C:\Users\81284\OneDrive\python datamining\Python数据分析与挖掘实战\chapter3\demo\data\catering_sale.xls' #餐饮数据
- data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列
- import matplotlib.pyplot as plt #导入图像库
- plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
- plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号
- plt.figure() #建立图像
- p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
- x = p['fliers'][0].get_xdata() # 'flies'即为异常值的标签
- y = p['fliers'][0].get_ydata()
- y.sort() #从小到大排序,该方法直接改变原对象
- #用annotate添加注释
- #其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
- #以下参数都是经过调试的,需要具体问题具体调试。
- for i in range(len(x)):
- if i>0:
- plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
- else:
- plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))
- plt.show() #展示箱线图
复制代码
|
|