# 如何用Python的pandas库修改列的数据类型

# 题目

DataFrame students
+-------------+--------+
| Column Name | Type   |
+-------------+--------+
| student_id  | int    |
| name        | object |
| age         | int    |
| grade       | float  |
+-------------+--------+

编写一个解决方案来纠正以下错误:

grade 列被存储为浮点数,将它转换为整数。

返回结果格式如下示例所示。

示例 1:

输入:
DataFrame students:
+------------+------+-----+-------+
| student_id | name | age | grade |
+------------+------+-----+-------+
| 1          | Ava  | 6   | 73.0  |
| 2          | Kate | 15  | 87.0  |
+------------+------+-----+-------+
输出:
+------------+------+-----+-------+
| student_id | name | age | grade |
+------------+------+-----+-------+
| 1          | Ava  | 6   | 73    |
| 2          | Kate | 15  | 87    |
+------------+------+-----+-------+
解释:
grade 列的数据类型已转换为整数。

# 解题方案

# 1、审题,理解题意

题目的意思是有一个名为 students 的 DataFrame,它包含学生数据。但是,分数存储为浮点数,而不是整数。要求是将分数类型从浮点型更改为整型。更改数据类型可以用pandas库中的astype 函数

# 2、解题思路

astype 函数: astype 函数用于将pandas 对象强制转换为指定的数据类型(数据类型)。astype 可用于将熊猫对象强制转换为任何 dtypeastype 函数不会就地修改原始的 DataFrame。相反,它返回具有指定数据类型更改的新 DataFrame。如果您希望反映原始 DataFrame 中的更改,则需要将结果重新赋值给它或相应地使用 copy 参数。

# 该函数的语法为:
DataFrame.astype(dtype, copy=True, errors='raise')
  • dtype: 它是一种数据类型,或列名->数据类型的字典。

  • copy: 默认情况下,astype 总是返回新分配的对象。如果 copy 设置为 False,则只有在旧对象无法强制转换为所需类型的情况下才会创建新对象。

  • errors: 控制对提供的数据类型的无效数据引发异常。默认设置为raise,表示会引发异常。

    因此,在我们的例子中,我们希望将 grade 列从浮点数转换为整数,我们可以使用下面的代码行来完成此操作:

    students = students.astype({'grade': int})      #此行将 grade 列从浮点型转换为整型。
    
# 代码实现步骤为:
  • 定义 changeDatatype 的函数,该函数接受 DataFrame students 作为参数并返回 DataFrame。
def changeDatatype(students: pd.DataFrame) -> pd.DataFrame:
  • 改变列的数据类型:

    students = students.astype({'grade': int})      #这行代码是解决方案的核心。使用 astype 函数将 grade 列的数据类型更改为整型。{'grade': int} 是一个字典,其中键是列名,值是所需的数据类型。
    
  • 返回语句:

return students       #此行返回修改后的 DataFrame。

# 3、代码实现

import pandas as pd

def changeDatatype(students: pd.DataFrame) -> pd.DataFrame:
    students = students.astype({'grade': int})
    return students

# 4、执行结果

image-20231025102405781

image-20231025102502781

更新时间: 2023/10/29 02:21:09