國立中興大學

#新手 [機器學習] 訓練資料方法

6月11日 00:40
各位大大好 有個名詞問題想請教大家 目前我手上有兩個dataset分別稱呼為A, B 在A與B上面都有定義的標準training set與validation set 我們稱他們為A-training A-validation與 B-training B-validation 我想用一個model去測試看看使用B-training 作為訓練的效果能否比用A-training做訓練 A-validation作為檢驗的好 這個方法可被稱作有效的cross validation嗎? 我的題目重點是想知道dataset的好壞 而不是model的好壞 用這個方法作為測試不知道可不可行?
0
回應 7
文章資訊
共 7 則留言
國立臺灣大學
cross validation應該是專門指針對同一個dataset做不同的split來測試 不過只是名詞定義而已啦
可以找bench mark的model以及dataset,然後套自己的Dataset 我之前是找Google的AVA Dataset,文獻內就有提到與之前bench mark ucf101 dataset的差別在哪 這些都是bench mark的Dataset
國立清華大學
1. 這不是 cross validation 2. 可以試試看
匿名
這則留言已被本人刪除
6月11日 19:09
已經刪除的內容就像 Dcard 一樣,錯過是無法再相見的!
匿名
這則留言已被刪除
6月12日 05:31
已經刪除的內容就像 Dcard 一樣,錯過是無法再相見的!
北京清華大學
這個不是cross validation,方法是hold out,分別在A,B固定訓練集跟驗證集。
國立雲林科技大學
我記得cross validation是不自己分配dataset像kfold就是一種方法