astype函数详解
一、astype函数 Python
astype
函数是NumPy中的一个重要函数,常用于数组的数据类型转换。它的基本语法是:astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
,其中dtype
参数表示指定的目标数据类型,可以是Python数据类型或NumPy中定义的数据类型,其余参数都是可选的。
例如,假设我们有一个二维数组x
:
import numpy as np x = np.array([[1, 2], [3, 4], [5, 6]]) print(x.dtype) # 输出:int64
默认情况下,x
的数据类型为int64
。如果我们想将它转换为float
类型,可以这样做:
y = x.astype(float) print(y.dtype) # 输出:float64 print(y) # 输出:[[1. 2.] # [3. 4.] # [5. 6.]]
在这个例子中,astype
函数将x
数组的数据类型从int64
转换为float64
。
二、astype不是定义函数
注意,astype
不是Python内置函数,它是NumPy库中定义的一个函数。如果在使用astype
函数时遇到“astype is not defined”错误,可能是因为没有正确导入NumPy库或者代码中的语法错误。
例如,以下示例中的代码会导致“名字 'astype' 未定义”错误:
# 错误示例 x = [1, 2, 3, 4, 5] y = x.astype(float)
正确的代码应该是:
# 正确示例 import numpy as np x = np.array([1, 2, 3, 4, 5]) y = x.astype(float)
三、参数说明
1. dtype参数
dtype
参数是必须指定的,表示目标数据类型。可以是Python数据类型,例如int
、float
、str
等,也可以是NumPy中的数据类型,例如np.int32
、np.float64
等。
如果指定的目标数据类型和数组的原始数据类型不一致,astype
函数将会执行数据类型转换。例如,将整型数组转换为浮点型数组:
import numpy as np x = np.array([1, 2, 3]) y = x.astype(float) print(y) # 输出:[1. 2. 3.]
需要注意的是,如果指定的数据类型无法表示原始数据,astype
函数会执行截断操作,也就是将数据截断至目标数据类型的范围内。例如,将大于255的无符号整型数据转换为uint8
类型:
import numpy as np x = np.array([255, 256, 257], dtype=np.uint16) y = x.astype(np.uint8) print(y) # 输出:[255 0 1]
2. order参数
order
参数用于指定数组的内存布局,默认值为'K'
,表示优先使用数组本身的内存布局。当order
取值为'C'
或'F'
时,将强制使用按行排列('C'
)或按列排列('F'
)的内存布局。
例如,以下示例中的代码将数组x
从按行排列('C'
)的内存布局转换为按列排列('F'
)的内存布局:
import numpy as np x = np.array([[1, 2], [3, 4], [5, 6]]) y = x.astype(float, order='F') print(y.flags) # 输出:C_CONTIGUOUS : False # F_CONTIGUOUS : True # OWNDATA : True # ...
3. casting参数
casting
参数用于指定数据类型转换时的转换规则,有三种取值:
'no'
:不允许任何转换。'equiv'
:只允许等价类型转换,例如int
转换为float
。'unsafe'
:允许任何类型转换,即使可能导致数据丢失。例如,以下示例中的代码不允许将浮点型数据转换为整型:
import numpy as np x = np.array([1.2, 2.5, 3.7]) y = x.astype(int, casting='no') # 报错:Can't cast float64 to int64 without losing precision
4. subok参数
subok
参数用于指定是否返回一个派生类,默认为True
,即返回一个与输入参数类型相同的派生类。如果取值为False
,则返回一个NumPy数组对象。
以下示例中的代码将返回一个类型为ndarray_subclass
的派生类:
import numpy as np class ndarray_subclass(np.ndarray): pass x = np.array([1, 2, 3], dtype=np.int32).view(ndarray_subclass) y = x.astype(float, subok=True) print(type(y)) # 输出:
5. copy参数
copy
参数用于指定是否为返回的数组对象分配新的内存,默认为True
,即始终创建一个新数组并复制数据。如果取值为False
,则可能直接返回原始数组的视图。
例如,以下示例中的代码直接返回原始数组的视图:
import numpy as np x = np.array([1, 2, 3], dtype=np.int32) y = x.astype(float, copy=False) print(y is x) # 输出:True print(y.base is x) # 输出:True