欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 科技 > IT业 > Python数据分析及可视化中常用的6个库及函数(二)

Python数据分析及可视化中常用的6个库及函数(二)

2025/6/6 14:44:18 来源:https://blog.csdn.net/gsjthxy/article/details/148411011  浏览:    关键词:Python数据分析及可视化中常用的6个库及函数(二)

Python数据分析及可视化中常用的6个库及函数(二)

       摘要:以下是Python数据分析及可视化常用的6个库的详细介绍,包括它们的概述以及每个库中最常用的10个函数(如果某些库常用函数不足10个,则列出所有常用函数)。每个函数都附带功能描述、用法说明和使用示例。这些库在数据科学、机器学习和数据可视化领域被广泛使用。

1. NumPy

  • 概述:NumPy 是 Python 中用于科学计算的基础库,提供多维数组对象和各种数学函数,支持高效的数值运算。

1.1 常用函数

  1. numpy.array()功能:创建一个 NumPy 数组。
    用法numpy.array(object, dtype=None)object 是输入数据(如列表、元组),dtype 是数据类型。
    示例

    import numpy as np
    data = [1, 2, 3, 4]
    arr = np.array(data)
    print(arr)  # 输出: [1 2 3 4]
    
  2. numpy.mean()
    功能:计算数组的平均值。
    用法numpy.mean(a, axis=None)a 是输入数组,axis 指定计算平均值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    avg = np.mean(arr)
    print(avg)  # 输出: 2.5
    
  3. numpy.sum()
    功能:计算数组元素的总和。
    用法numpy.sum(a, axis=None)a 是输入数组,axis 指定求和的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    total = np.sum(arr)
    print(total)  # 输出: 10
    
  4. numpy.reshape()
    功能:改变数组的形状。
    用法numpy.reshape(a, newshape)a 是输入数组,newshape 是新的形状。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4, 5, 6])
    reshaped = np.reshape(arr, (2, 3))
    print(reshaped)  # 输出: [[1 2 3] [4 5 6]]
    
  5. numpy.zeros()
    功能:创建一个全零数组。
    用法numpy.zeros(shape, dtype=float)shape 是数组形状,dtype 是数据类型。
    示例

    import numpy as np
    arr = np.zeros((2, 3))
    print(arr)  # 输出: [[0. 0. 0.] [0. 0. 0.]]
    
  6. numpy.ones()
    功能:创建一个全一数组。
    用法numpy.ones(shape, dtype=float)shape 是数组形状,dtype 是数据类型。
    示例

    import numpy as np
    arr = np.ones((2, 3))
    print(arr)  # 输出: [[1. 1. 1.] [1. 1. 1.]]
    
  7. numpy.random.rand()
    功能:生成均匀分布的随机数(0到1之间)。
    用法numpy.random.rand(d0, d1, ...)d0, d1, ... 是数组的维度。
    示例

    import numpy as np
    rand_arr = np.random.rand(2, 3)
    print(rand_arr)  # 输出: 2x3 的随机数数组
    
  8. numpy.std()
    功能:计算数组的标准差。
    用法numpy.std(a, axis=None)a 是输入数组,axis 指定计算标准差的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    std_dev = np.std(arr)
    print(std_dev)  # 输出: 1.118033988749895
    
  9. numpy.max()
    功能:返回数组中的最大值。
    用法numpy.max(a, axis=None)a 是输入数组,axis 指定查找最大值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    max_val = np.max(arr)
    print(max_val)  # 输出: 4
    
  10. numpy.min()
    功能:返回数组中的最小值。
    用法numpy.min(a, axis=None)a 是输入数组,axis 指定查找最小值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    min_val = np.min(arr)
    print(min_val)  # 输出: 1
    

2. Pandas

  • 概述:Pandas 是一个强大的数据分析和操作库,提供 DataFrame 和 Series 数据结构,适用于数据清洗、分析和处理。

2.1 常用函数

  1. pandas.read_csv()
    功能:从 CSV 文件读取数据并创建 DataFrame。
    用法pandas.read_csv(filepath, delimiter=',')filepath 是文件路径,delimiter 是分隔符。
    示例

    import pandas as pd
    df = pd.read_csv('data.csv')
    print(df.head())  # 输出数据的前5行
    
  2. pandas.DataFrame.groupby()
    功能:按指定列对数据进行分组,并可应用聚合函数。
    用法DataFrame.groupby(by)by 是分组依据的列名。
    示例

    import pandas as pd
    data = {'Name': ['Alice', 'Bob', 'Alice'], 'Score': [85, 90, 88]}
    df = pd.DataFrame(data)
    grouped = df.groupby('Name').mean()
    print(grouped)  # 输出: 按Name分组的平均分
    
  3. pandas.DataFrame.describe()
    功能:生成数据的描述性统计信息(如均值、标准差)。
    用法DataFrame.describe()
    示例

    import pandas as pd
    data = {'Score': [85, 90, 88, 92]}
    df = pd.DataFrame(data)
    stats = df.describe()
    print(stats)  # 输出: Score列的统计信息
    
  4. pandas.DataFrame.fillna()
    功能:用指定值填充数据中的缺失值。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词