您当前的位置:网站首页>yy6090青苹果影院,68款大规模机器学习数据集,包括CV、语音、NLP | 十年资源集,secure

yy6090青苹果影院,68款大规模机器学习数据集,包括CV、语音、NLP | 十年资源集,secure

2019-04-03 14:44:27 投稿作者:admin 围观人数:189 评论人数:0次
yy6090青苹果影院,68款大规模机器学习数据集,包含CV、语音、NLP | 十年资源集,secure

作者 | 琥珀

此前营长为咱们共享过不少机器学习相关数据集的资源,例如;;,乃至还有谷歌团队推出的 ……

关于日常从事模型练习的研究人员来讲,无论是图画处理仍是语音辨认,都离不绿城开一些高质量的数据集,经过它们以改进模型的功用。

近来,reddit 论坛上,一位网友发帖共享了datasetlist.com 的网站链接,得到了不少同行们的点赞。据了解上面调集了从 2009 年 Im斯柯达速派a银河奥特曼sgeN瑞贝卡et 发布以来合计 68 项机器学习相关的大规模数据集,包含yy6090青苹果影院,68款大规模机器学习数据集,包含CV、语音、NLP | 十年资源集,secure核算机视觉(46 项)、自然言语处理(18 项)、语音(4 项)三大类别,协助用户快速找到相应的数据集。由此,咱们还能够看到自 2015 年以来,大规模数据集的不断涌现也暗示着人工智能技术作为集大成者的快速演进。

这套数据集查找列表的呈现,也满yy6090青苹果影院,68款大规模机器学习数据集,包含CV、语音、NLP | 十年资源集,secure足了不少强迫症患者关于挑选 / 收拾数据集的主意。不过,也正如这位网友所言:这个数据集列表的方法将有待完善和丰厚,规划这个网页的意图也是期望接下来不断更新新的数据集,一起,用户也能够经过邮箱、Twitter、Fmightacebook 等ugly方法订阅以获取最新内容。

青林歪弹

下面,让营长介绍下该数据集列表的主要内容:

语音辨认:

2019 年 3 月 1 日,由 Moz引诱相片illa 基金会建议的 Common Voice 项目,发布新版语音辨认数据集,包含来自 42000 名贡献者,超越 1400 小时的语音样本数据,包含包含英语、法语、德语、荷兰语、汉语在内的 18 种言语。

地址:刺客联盟https://voice.mozilla.org/zh-CN

核算机视觉

IBM 推出的“人脸多样性”(Diversity in Faces Dataset,DiF)是一个巨大而多样化的数据集,与曾经的数据集比较,DiF 数据集供给了更均衡的散布和更广泛的面部图画覆盖率。DiFferences 供给了 100 万注释的数据集人类面部图画。

地址:

https://www.research.ibm.com/arti重庆轻轨ficial-intelligence/trusted-ai/diversity-in-face今夜有戏s/

英伟达推出的 Flicker 人脸高清数据集(FFHQ)由 70,000 个高质量的 PNG 格局图画组成,分辨率为 1024*1024。这些图片在年纪、种族和图画布景方面有很强的多样性,而且还有如眼镜、太阳镜、帽子等元素。

地址:

https://github.com/NVlabs/ffhq-dataset

Open Images 是一个包含约 900 万个 URL 的yy6090青苹果影院,68款大规模机器学习数据集,包含CV、语音、NLP | 十年资源集,secure数据集,由谷歌在 2018 为无名山增高一米年 4 月 30 日敞开,它包含在 190 万张图片上针对 600 个类别的 1540 万个边框盒。

地址:

https://storage.googleapis.com/openimages/web/index.html

Tencent ML- Images 是最大的开源多标签图画数据集,包含 17,609,752 个练习和 88,739 个验证图画 URL,最多可注释 11,166 个类别。

地址:

https://github.com/Tencent/tencent-ml-images

Youtube-8M 2018 是一个大型符号视频数据集,由 yy6090青苹果影院,68款大规模机器学习数据集,包含CV、语音、NLP | 十年资源集,secure600 万个 YouTube 视频 ID 组成,现在具有 4700 多个视觉实体标签,一起它还装备了数十亿帧和音频片段的预先核算的视听功用。

地址:

https://research.google.com/youtube8m/index.html

Fashion-MNIST 由德国研究机构 Zaland真菌感染o Research 发布,包含 60000 个样本,yy6090青苹果影院,68款大规模机器学习数据集,包含CV、语音、NLP | 十年资源集,secure测验集包含 10000 个样本,分为 10 类,每一个都是 2828 的灰度图。

地址:

https://github.com/zalandoresearch/fashion-mnist

当然,此外还有 天网栏目MegaFace、I北条玲mageNet 等十分经典的数据集,以下营长就不一一列举了。

自然言语处理

SQuAD

斯坦福问答数据集(SQuAD)是一个yy6090青苹果影院,68款大规模机器学习数据集,包含CV、语音、NLP | 十年资源集,secure全新的阅览f22了解数据集,由工作人员根据一系列维基百科文章中的发问和答案组成,其间每个问题的答案是来自相应阅览阶段的一段文本片段或区间。其间包含超越 500 篇文章中超越 100,000 个问答配对,使得 SQuADqq号码免费请求 明显大于曾经的阅览了解数据集。SQuAD2.0 结合了 SQuAD1.1 中的 100advantage,000 个问题。

地址:

https://rajpurkar.github.io/SQuAD-explorer/

此外还有:

(本文为 AI科技大本营原创文章,转载请微信联络 1092722531)

核算机 视频 科技
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。
意甲射手榜
the end
撒哈拉旅行计划,摩洛哥路线进发