【初心者向け】NumPyで始めるデータ操作入門

Pythonでデータ分析や数値計算を行う際に、必ず登場するのが NumPy（ナムパイ） というライブラリです。

この記事では、「NumPyってなに？」「どうやってデータを扱えばいいの？」という初心者の方に向けて、NumPyの基本操作をステップごとに紹介していきます。

NumPy配列の作り方（基本）

import numpy as np

arr = np.array([1, 2, 3, 4, 5])
print(arr)

[1 2 3 4 5]

import numpy as np

matrix = np.array([[1, 2], [3, 4]])
print(matrix)

[[1 2]
 [3 4]]

print(arr.shape)       # 配列の形（要素数や行列サイズ）
print(arr.reshape(5, 1))  # 5行1列に変換

print(arr[0])      # 先頭の要素
print(arr[1:4])    # 2番目〜4番目

NumPyでは、ベクトル演算や統計処理がとても簡単です。

import numpy as np

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

print(a + b)  
print(a * b)

[5 7 9]
[ 4 10 18]

print(np.mean(a))  # 平均
print(np.max(b))   # 最大値
print(np.min(b))   # 最小値
print(np.sum(b))   # 合計

data = np.array([1, 2, 3, 4, 5])
filtered = data[data > 3]
print(filtered)

 [4 5]

zeros = np.zeros((2, 3))  # 2行3列の0行列
ones = np.ones((2, 2))    # 2行2列の1行列
rand = np.random.rand(3)  # 0〜1のランダム数（3個）