AI知道
当缺少所需数据集时,大家是怎么寻找训练样本的? 已解决
悬赏分:0
- 解决时间 2021-11-07 16:31
当缺少所需数据集时,大家是怎么寻找训练样本的? |
|
1,一般就是对现有的数据做数据增强,图片做各种旋转斜切曝光等(不过这个方式不如直接尝试用胶囊网络 学习到各种角度等信息)
2,爬取更多数据,图像可以通过Google或百度用无头浏览器进行图片搜索 保存图片,文本例如评论可以去爬取一些商品或店铺的评价及分数 3,一般常见的深度学习任务都会有数据集 比赛的或公开的。天池 datacastle 百度点石等等 |
|
举报
2021-11-07 16:20
除非是比较冷门的方向,一般都有前人做过的数据集。最直接的方法是百度搜索专业方向+数据集,一般会有前人总结的相关工作。比如“金属表面缺陷数据集”。没有的话去各类比赛比如阿里的天池,注册个账号也有些数据集可以下载。在验证实验阶段或者对数据集要求不高的场景大可以使用现成的数据集,实在找不到的话再考虑自己制作(拍照+打标签)。
|
|
举报
2021-11-07 16:23
这个,的确很痛苦哎~
1、如果通过数据扩增可以解决,那就人造一批数据,丢进去看看结果怎么样; 2、如果公开数据集里面多少会有一些,那就把里面能用的筛选出来; 3、发动大家去拍照,去录音,然后一起标注一波~ |
感谢