首頁 > 軟體

Python實現SVM支援向量機的範例程式碼

2023-11-01 10:00:50

下面是使用 scikit-learn 庫中的 SVM 模型的範例程式碼:

from sklearn import svm
from sklearn.datasets import make_classification

# generate some example data
X, y = make_classification(n_features=4, random_state=0)

# fit an SVM model to the data
clf = svm.SVC(kernel='linear')
clf.fit(X, y)

# predict new data
print(clf.predict([[0, 0, 0, 0]]))

什麼是支援向量機

支援向量機(SVM),SVM 的目的是在資料集中找到一條最佳分隔超平面,使得在這個超平面兩側的資料分別屬於不同的類別,且該超平面與最近的資料點之間的距離最大。

這些最近的資料點稱為支援向量,因此該模型被稱為支援向量機。

SVM 可以處理線性可分和線性不可分的情況,也可以通過使用核函數來處理非線性問題。

SVM 在解決分類問題時,通常是通過構造一個最大間隔分離超平面來實現的。

在迴歸問題中,SVM 通過構造一個迴歸超平面來實現預測。

SVM 的核心思想是利用數學方法將高維資料對映到低維空間,從而對不可分資料進行線性分類。

SVM 模型具有很好的泛化能力,可以解決高維資料的分類問題。

SVM 模型可以使用不同的核函數,如線性核、多項式核、高斯核等,這樣可以解決非線性問題。此外,SVM 還可以處理大量特徵資料,並具有高效的計算速度。

用 Python 實現 SVM

使用 scikit-learn 庫實現 SVM 分類

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 載入資料集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]

# 劃分訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 建立 SVM 模型
model = SVC(kernel='linear', C=1, random_state=0)

# 訓練模型
model.fit(X_train, y_train)

# 在測試集上進行預測
y_pred = model.predict(X_test)

# 計算預測精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

首先使用 load_iris() 函數載入 iris 資料集,然後使用 train_test_split() 函數將資料集劃分為訓練集和測試集。

接著,使用 SVC 函數建立一個 SVM 模型,並使用 fit() 函數在訓練集上進行訓練。

最後,使用 predict 函數在測試集上進行預測,並使用 accuracy_score() 函數計算預測精度。

多項式和高斯核函數的 SVM

使用高斯核函數的 SVM 可以如下實現:

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 載入資料集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]

# 劃分訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 建立 SVM 模型,使用高斯核函數
model = SVC(kernel='rbf', C=1, random_state=0)

# 訓練模型
model.fit(X_train, y_train)

# 在測試集上進行預測
y_pred = model.predict(X_test)

# 計算預測精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

在上面的程式碼中,首先載入了 scikit-learn 中的 iris 資料集,並將其特徵資料儲存在 X 中,標籤儲存在 y 中。

使用 train_test_split() 函數劃分出了訓練集和測試集,並將其分別儲存在 X_train , X_test , y_train , y_test 中。

建立了一個 SVM 模型,使用了高斯核函數(Radial basis function, RBF)。引數 C 用於控制對誤差的懲罰程度,數值越大,懲罰程度越大。引數 gamma 控制高斯核函數的影響範圍,數值越小,影響範圍越廣。

使用 fit() 方法訓練模型。訓練後,使用 predict() 方法在測試集上進行預測,並將預測結果儲存在 y_pred 中。

最終的結果將通過 accuracy_score() 函數計算預測精度,並將其列印出來。

還可以調整 SVM 模型的超引數以改變模型的表現,例如 C 和 gamma 。通過調整超引數可以使模型更加適合資料,並提高模型的預測精度。

到此這篇關於Python實現SVM支援向量機的範例程式碼的文章就介紹到這了,更多相關Python SVM支援向量機內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com