TShopping

 找回密碼
 註冊
搜索
查看: 1591|回復: 0
打印 上一主題 下一主題

[分享] X_train,X_test,y_train,y_test有什麼區別?

[複製鏈接]
跳轉到指定樓層
1#
發表於 2020-4-15 19:58:41 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
 
Push to Facebook
看著這一行代碼

  1. X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.2,random_state=0)
複製代碼

我心生疑惑,這究竟代表什麼含義?

現在我基本弄懂了,特記錄下來。

train_test_split()是sklearn包的model_selection模塊中提供的隨機劃分訓練集和測試集的函數;使用train_test_split函數可以將原始數據集按照一定比例劃分訓練集和測試集對模型進行訓練

x,y是原始的數據集。X_train,y_train 是原始數據集劃分出來作為訓練模型的,fit模型的時候用。

X_test,y_test  這部分的數據不參與模型的訓練,而是用於評價訓練出來的模型好壞,score評分的時候用。

test_size =0.2測試集的劃分比例。如果為浮點型,則在0.0-1.0之間,代表測試集的比例;如果為整數型,則為測試集樣本的絕對數量;如果沒有,則為訓練集的補充。

random_state:是隨機數的種子。固定隨機種子時,同樣的代碼,得到的訓練集數據相同。不固定隨機種子時,同樣的代碼,得到的訓練集數據不同。




 

臉書網友討論
*滑块验证:
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則



Archiver|手機版|小黑屋|免責聲明|TShopping

GMT+8, 2024-4-23 17:57 , Processed in 0.048912 second(s), 22 queries .

本論壇言論純屬發表者個人意見,與 TShopping綜合論壇 立場無關 如有意見侵犯了您的權益 請寫信聯絡我們。

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表