介紹
NumPy是Python數(shù)值計算最重要的基礎(chǔ)包,大多數(shù)提供科學(xué)計算的包都是用NumPy的數(shù)組作為構(gòu)建基礎(chǔ)。NumPy本身并沒有提供多么高級的數(shù)據(jù)分析功能,理解NumPy數(shù)組以及面向數(shù)組的計算,將有助于你更加高效地使用諸如Pandas之類的工具。
雖然NumPy提供了通用的數(shù)值數(shù)據(jù)處理的計算基礎(chǔ),但大多數(shù)讀者可能還是想將Pandas作為統(tǒng)計和分析工作的基礎(chǔ),尤其是處理表格數(shù)據(jù)時。
NumPy的部分功能如下:
ndarray,一個具有矢量算術(shù)運(yùn)算和復(fù)雜廣播能力的快速且節(jié)省空間的多維數(shù)組。
用于對整組數(shù)據(jù)進(jìn)行快速運(yùn)算的標(biāo)準(zhǔn)數(shù)學(xué)函數(shù)(無需編寫循環(huán))。
用于讀寫磁盤數(shù)據(jù)的工具以及用于操作內(nèi)存映射文件的工具。
線性代數(shù)、隨機(jī)數(shù)生成以及傅里葉變換功能。
用于集成由C、C++、Fortran等語言編寫的代碼的A C API。
NumPy之于數(shù)值計算特別重要是因為它可以高效處理大數(shù)組的數(shù)據(jù)。這是因為:
比起Python的內(nèi)置序列,NumPy數(shù)組使用的內(nèi)存更少。
NumPy可以在整個數(shù)組上執(zhí)行復(fù)雜的計算,而不需要Python的for循環(huán)。
使用下面格式約定,引入NumPy包:
import numpy as np
NumPy的ndarray:N維數(shù)組對象
NumPy最重要的是其N維數(shù)組對象(即ndarray),其中的所有元素必須是相同類型的。該對象是一個快速而靈活的大數(shù)據(jù)集容器,可以利用這種數(shù)組對整塊數(shù)據(jù)執(zhí)行數(shù)學(xué)運(yùn)算,其語法跟標(biāo)量元素之間的運(yùn)算一樣。
創(chuàng)建ndarray
使用np.array(list/tuple, dtype=np.float32)函數(shù),產(chǎn)生一個新的含有傳入數(shù)據(jù)的ndarray對象。
第一個參數(shù)為元組、列表(相同數(shù)據(jù)類型),第二個參數(shù)為ndarray數(shù)組中的數(shù)據(jù)類型。當(dāng)?shù)诙€參數(shù)為空時,NumPy將根據(jù)數(shù)據(jù)情況指定一個類型。
返回值為[ ]形式,元素間由空格分割。
In [20]: arr1 = np.array([6, 7.5, 8, 0, 1]) #從列表創(chuàng)建
In [21]: pring(arr1)
Out[21]: [ 6. , 7.5, 8. , 0. , 1. ] #NumPy根據(jù)數(shù)據(jù)情況,指定了float類型
In [23]: arr2 = np.array([[1, 2, 3, 4], [5, 6, 7, 8],(1.2 , 2.3)])
In [24]: pring(arr2)
Out[24]: [[1, 2, 3, 4] [5, 6, 7, 8] (1.2 , 2.3)]
使用NumPy中的內(nèi)置函數(shù)
np.arange(begin,end,step,dtype=np.float32):begin為元素起始值(包含),end為元素結(jié)束值(不包含),step為步長(默認(rèn)值為1),dtype為元素類型。如果只有一個參數(shù)n,則為從0到n-1;如有有兩個參數(shù)n和m,則為從n到m-1;
np.linspace(begin,end,number):創(chuàng)建包含number個元素的數(shù)組,并在指定的開始值(包含)和結(jié)束值(包含)之間平均間隔;
np.ones(shape):根據(jù)shape生成一個全1數(shù)組,shape是元組類型,比如(2,3);
np.zeros(shape):根據(jù)shape生成一個全0數(shù)組,shape是元組類型,比如(2,3,4);
np.full(shape,val):根據(jù)shape生成一個數(shù)組,每個元素值都是val;
np.eye(n):創(chuàng)建一個正方的n*n單位矩陣,對角線為1,其余為0;
np.ones_like(a):根據(jù)數(shù)組a的形狀生成一個全1數(shù)組;
np.zeros_like(a):根據(jù)數(shù)組a的形狀生成一個全0數(shù)組;
np.full_like(a,val):根據(jù)數(shù)組a的形狀生成一個每個元素值都是val的數(shù)組;
np.concatenate() 將兩個或多個數(shù)組合并成一個新的數(shù)組。
In [30]: arr3 = np.zeros((3, 6))
In [31]: print(arr3)
Out[30]: [[ 0., 0., 0., 0., 0., 0.] [ 0., 0., 0., 0., 0., 0.] [ 0., 0., 0., 0., 0., 0.]]
從磁盤讀取數(shù)據(jù)創(chuàng)建ndarray數(shù)組,將ndarray數(shù)組保存到磁盤(大部分情況會使用pandas或其它工具加載文本或表格數(shù)據(jù))
np.load(fname)
• fname : 文件名,以.npy為擴(kuò)展名,壓縮擴(kuò)展名為.npz
np.save(fname, array) 或 np.savez(fname, array)
• fname : 文件名,以.npy為擴(kuò)展名,壓縮擴(kuò)展名為.npz
• array : 數(shù)組變量
ndarray數(shù)組對象的屬性
.ndim:秩,即軸的數(shù)量或維度的數(shù)量
.shape:ndarray對象的尺度,對于矩陣,n行m列
.size:ndarray對象元素的個數(shù),相當(dāng)于.shape中n*m的值
.dtype:ndarray對象的元素類型
.itemsize:ndarray對象中每個元素的大小,以字節(jié)為單位
ndarray數(shù)組對象的類型和維度變換
.astype(np.float64):將ndarray數(shù)組元素從一個類型轉(zhuǎn)換成另一個類型,返回一個新數(shù)組。如果將浮點(diǎn)數(shù)轉(zhuǎn)換成整數(shù),則小數(shù)部分將會被截取刪除。(類型變換)
.reshape(shape):不改變原數(shù)組元素,返回一個新的shape維度的數(shù)組(維度變換)
.resize(shape):與.reshape()功能一致,但修改原數(shù)組(維度變換)
.swapaxes(ax1,ax2) 將數(shù)組n個維度中兩個維度進(jìn)行調(diào)換(維度變換)
.flatten():對數(shù)組進(jìn)行降維,返回折疊后的一維數(shù)組,原數(shù)組不變(維度變換)
.tolist():將N維數(shù)組轉(zhuǎn)換成列表(維度變換)
ndarray數(shù)組的索引和切片
具體使用參考
https://seancheney.gitbook.io/python-for-data-analysis-2nd/di-04-zhang-numpy-ji-chu-shu-zu-he-shi-liang-ji-suan#ji-ben-de-suo-yin-he-qie-pian
https://docs.scipy.org/doc/numpy/user/quickstart.html#indexing-slicing-and-iterating
https://blog.csdn.net/zheng_weibin/article/details/79358986
ndarray數(shù)組的運(yùn)算
數(shù)組與標(biāo)量之間的運(yùn)算,都會作用于數(shù)組的每一個元素;
大小相同的數(shù)組之間的任何算術(shù)運(yùn)算,都會將運(yùn)算應(yīng)用到元素級;
大小相同的數(shù)組之間的比較運(yùn)算,都會將運(yùn)算應(yīng)用到元素級并生成布爾值數(shù)組;
np.abs(arr)\np.fabs(arr):計算數(shù)組arr各元素的絕對值
np.sqrt(arr):計算數(shù)組arr各元素的平方根
np.square(arr):計算數(shù)組arr各元素的平方
np.log(arr)\np.log10(arr)\np.log2(arr):計算數(shù)組arr各元素的自然對數(shù)、10底對數(shù)和2底對數(shù)
np.ceil(arr)\np.floor(arr):計算數(shù)組arr各元素的ceiling值 或 floor值
np.rint(arr) 計算數(shù)組arr各元素的四舍五入值
np.modf(arr) 將數(shù)組arr各元素的小數(shù)和整數(shù)部分以兩個獨(dú)立數(shù)組形式返回
np.cos(arr)\np.cosh(arr)\np.sin(arr)\np.sinh(arr)\np.tan(arr)\np.tanh(arr)計算數(shù)組arr各元素的普通型和雙曲型三角函數(shù)
np.exp(arr) 計算數(shù)組arr各元素的指數(shù)值
np.sign(arr) 計算數(shù)組arr各元素的符號值,1(+), 0, ‐1(‐)
利用ndarray進(jìn)行數(shù)據(jù)處理
排序
ndarray數(shù)組通過.sort()函數(shù)排序,多維數(shù)組時傳入軸編號
NumPy的隨機(jī)數(shù)函數(shù)
np.random.rand(d0,d1,..,dn):根據(jù)d0‐dn創(chuàng)建隨機(jī)數(shù)數(shù)組,浮點(diǎn)數(shù),[0,1),均勻分布
np.random.randn(d0,d1,..,dn):根據(jù)d0‐dn創(chuàng)建隨機(jī)數(shù)數(shù)組,標(biāo)準(zhǔn)正態(tài)分布
np.random.randint(low[,high,shape]):根據(jù)shape創(chuàng)建隨機(jī)整數(shù)或整數(shù)數(shù)組,范圍是[low, high)
np.random.seed(s):隨機(jī)數(shù)種子,s是給定的種
np.random.shuffle(a):根據(jù)數(shù)組a的第1軸進(jìn)行隨排列,改變數(shù)組x
np.random.permutation(a):根據(jù)數(shù)組a的第1軸產(chǎn)生一個新的亂序數(shù)組,不改變數(shù)組x
np.random.choice(a[,size,replace,p]):從一維數(shù)組a中以概率p抽取元素,形成size形狀新數(shù)組 replace表示是否可以重用元素,默認(rèn)為False
np.random.uniform(low,high,size):產(chǎn)生具有均勻分布的數(shù)組,low起始值,high結(jié)束值,size形狀
np.random.normal(loc,scale,size):產(chǎn)生具有正態(tài)分布的數(shù)組,loc均值,scale標(biāo)準(zhǔn)差,size形狀
np.random.poisson(lam,size):產(chǎn)生具有泊松分布的數(shù)組,lam隨機(jī)事件發(fā)生率,size形狀
NumPy的統(tǒng)計類函數(shù)
np.sum(a, axis=None):根據(jù)給定軸axis計算數(shù)組a相關(guān)元素之和,axis整數(shù)或元組
np.mean(a, axis=None):根據(jù)給定軸axis計算數(shù)組a相關(guān)元素的期望,axis整數(shù)或元組
np.average(a,axis=None,weights=None):根據(jù)給定軸axis計算數(shù)組a相關(guān)元素的加權(quán)平均值
np.std(a, axis=None):根據(jù)給定軸axis計算數(shù)組a相關(guān)元素的標(biāo)準(zhǔn)差
np.var(a, axis=None):根據(jù)給定軸axis計算數(shù)組a相關(guān)元素的方差
np.min(a)\max(a):計算數(shù)組a中元素的最小值、最大值
np.argmin(a)\argmax(a):計算數(shù)組a中元素最小值、最大值的降一維后下標(biāo)
np.unravel_index(index, shape):根據(jù)shape將一維下標(biāo)index轉(zhuǎn)換成多維下標(biāo)
np.ptp(a):計算數(shù)組a中元素最大值與最小值的差
np.median(a):計算數(shù)組a中元素的中位數(shù)(中值)
NumPy的梯度函數(shù)
梯度:連續(xù)值之間的變化率,即斜率
XY坐標(biāo)軸連續(xù)三個X坐標(biāo)對應(yīng)的Y軸值:a, b, c,其中,b的梯度是:(c‐a)/2
np.gradient(f):計算數(shù)組f中元素的梯度,當(dāng)f為多維時,返回每個維度梯度