图表内容
表2-2全球部分人工智能公共数据集情况
类型
数据集名称
特点
维基百科语料库
斯坦福大学问答数据集
自然语言处理
Billion Words
用的语言建模数据库
带口音的语料库
语音识别
学-音素连续语音语料库
CHIME
包含环境噪音的语音识别数据集
谷歌街景中的图像数据集
机器视觉
mageNet
基于 worde构成
常用的图像数据集
abeled faces in the wild
面部区域图像数据集
用于人脸识别训练
研究报告节选:
数据是人工智能发展的基石,人工智能的核心在于数据支持。从发展现状来看,人工智能技术取得突飞猛进得益于良好的大数据基础,海量数据为训练人工智能提供了原材料。根据年第三季度全球数字统计报告显示,全球互联网用户数已经突破了亿,全球独立移动设备用户渗透率达到了总人口的