2022年 11月 4日

利用Python画直方图

  1. 1 #
  2. 2 # 本文以某一批产品的长度为数据集
  3. 3 # 在此数据集的基础上绘制直方图和正态分布曲线
  4. 4 #
  5. 5
  6. 6 import pandas as pd # pandas是一个强大的分析结构化数据的工具集
  7. 7 import numpy as np # numpy是Python中科学计算的核心库
  8. 8 import matplotlib.pyplot as plt # matplotlib数据可视化神器
  9. 9
  10. 10 # 正态分布的概率密度函数
  11. 11 # x 数据集中的某一具体测量值
  12. 12 # mu 数据集的平均值,反映测量值分布的集中趋势
  13. 13 # sigma 数据集的标准差,反映测量值分布的分散程度
  14. 14 def normfun(x, mu, sigma):
  15. 15 pdf = np.exp(-((x - mu) ** 2) / (2 * sigma ** 2)) / (sigma * np.sqrt(2 * np.pi))
  16. 16 return pdf
  17. 17
  18. 18 if __name__ == '__main__':
  19. 19
  20. 20 data = pd.read_csv('length.csv') # 载入数据文件
  21. 21 length = data['length'] # 获得长度数据集
  22. 22 mean = length.mean() # 获得数据集的平均值
  23. 23 std = length.std() # 获得数据集的标准差
  24. 24
  25. 25 # 设定X轴:前两个数字是X轴的起止范围,第三个数字表示步长
  26. 26 # 步长设定得越小,画出来的正态分布曲线越平滑
  27. 27 x = np.arange(2524, 2556, 0.1)
  28. 28 # 设定Y轴,载入刚才定义的正态分布函数
  29. 29 y = normfun(x, mean, std)
  30. 30 # 绘制数据集的正态分布曲线
  31. 31 plt.plot(x, y)
  32. 32
  33. 33 # 绘制数据集的直方图
  34. 34 plt.hist(length, bins=12, rwidth=0.9, density=True)
  35. 35 plt.title('Length distribution')
  36. 36 plt.xlabel('Length')
  37. 37 plt.ylabel('Probability')
  38. 38
  39. 39 # 输出正态分布曲线和直方图
  40. 40 plt.show()