2022年 11月 5日

Python基础与大数据应用(三)

1、大数据最基本特点数据体量巨大

2、pandas 是 Python的一个数据分析包,主要有 Series 和 DataFrame 两种类型的数据对象。

3、字典中的键可以是 Python 中的任意不可变数据,如整数、字符串、元组等。字典中的键不允许重复。

4、在Python中,所有数据类型都被视为对象,如字符串、列表、字典、元组等内置数据类型都具有和对象相似的语法和用法。

5、Python提供了两种实现循环的语句,分别是 for while

6、matplotlib 是 Python 中最常用的可视化工具之一。

7、数据分析是指利用合适的工具在统计学理论的支撑下,对数据进行一定程度的处理,然后结合具体业务分析数据,进行监控、定位、分析、解决问题。达到高效决策、提高经营效率,发现业务机会点,从而占有优势。

数据分析可以把隐藏在大量数据背后的信息提炼出来,总结出数据的内在规律。

数据分析究竟在分析什么:

(1)总体概览指标:总体概览指标又称统计绝对数,是反映某一数据整体规模大小,总量多少的指标。

(2)对比性指标&