深度学习数据集汇总
深度学习数据集汇总
原文链接:https://zhuanlan.zhihu.com/p/25138563
分门别类整理了一些网上的免费数据集,这是分类下载地址,希望能节约大家找数据的时间。欢迎数据达人加入QQ群 565136792 交流。
金融
- 美国劳工部统计局官方发布数据
-
上证A股日线数据,1999.12.09
至 2016.06.08,前复权,1095支股票 -
深证A股日线数据,1999.12.09
至 2016.06.08,前复权,1766支股票 -
深证创业板日线数据,1999.12.09
至 2016.06.08,前复权,510支股票 - MT4平台外汇交易历史数据
- Forex平台外汇交易历史数据
- 几组外汇交易逐笔(Ticks)数据
- 美国股票新闻数据【Kaggle数据】
- 美国医疗保险市场数据【Kaggle数据】
- 美国金融客户投诉数据【Kaggle数据】
-
Lending
Club 网贷违约数据【Kaggle数据】 -
信用卡欺诈数据【Kaggle
数据】 - 某个金融产品实时交易数据【Kaggle数据】
- 美国股票数据XBRL【Kaggle数据】
- 纽约股票交易所数据【Kaggle数据】
交通
- 2013年纽约出租车行驶数据
- Udacity自动驾驶数据
-
纽约
Uber 接客数据 【Kaggle数据】 - 英国车祸数据(2005-2015)【Kaagle数据】
- 芝加哥汽车超速数据【Kaggle数据】
-
KITTI
自动驾驶任务数据【数据太大仅有一部分】 - Cityscapes 场景标注数据【数据太大仅有介绍】
商业
-
Amazon
食品评论数据【Kaggle数据】 -
Amazon
无锁手机评论数据【Kaggle数据】 - 美国视频游戏销售和评价数据【Kaggle数据】
-
Kaggle
各项竞赛情况数据【Kaggle数据】 -
Airbnb
开放的民宿信息和住客评论数据
推荐系统
-
Netflix
电影评价数据 -
MovieLens
20m 电影推荐数据集 - WikiLens
- Jester
- HetRec2011
-
Book
Crossing -
Large
Movie Review -
Retailrocket
商品评论和推荐数据
医疗健康
- 人识别物体时大脑核磁共振影像数据
- 人理解单词时大脑核磁共振影像数据
- 心脏病心房图像及标注数据
- 细胞病理识别
-
FIRE
视网膜眼底病变图像数据 -
食物营养成分数据
【Kaggle数据】 -
EGG
大脑电波形状数据【Kaggle数据】 - 某人基因序列数据【Kaggle数据】
- 癌症CT影像数据【Kaggle数据】
- 软组织肉瘤CT图像数据【Kaggle数据】
- 美国国家健康与服务部-国家癌症研究所发起的癌症数据仓库介绍【仅有介绍】
-
Data
Science Bowl 2017 肺癌识别竞赛数据【数据太大仅有介绍】 -
TCGA-LUAD
肺癌CT图像数据 -
RAID
肺癌CT图像数据
图像数据
综合图像
-
Visual
Genome 图像数据 -
Visual7w
图像数据 -
COCO
图像数据 -
SUFR
图像数据 -
ILSVRC
2014 训练数据(ImageNet的一部分) -
PASCAL
Visual Object Classes 2012 图像数据 -
PASCAL
Visual Object Classes 2011 图像数据 -
PASCAL
Visual Object Classes 2010 图像数据 -
80
Million Tiny Image 图像数据【数据太大仅有介绍】 - ImageNet【数据太大仅有介绍】
-
Google
Open Images【数据太大仅有介绍】
场景图像
-
Street
Scences 图像数据 -
Places2
场景图像数据 -
UCF
Google Street View 图像数据 -
SUN
场景图像数据 -
The
Celebrity in Places 图像数据
Web标签图像
人形轮廓图像
视觉文字识别图像
-
Street
View House Number 门牌号图像数据 -
MNIST
手写数字识别图像数据 -
3D
MNIST 数字识别图像数据【Kaggle数据】 -
MediaTeam
Document 文档影印和内容数据 -
Text
Recognition 文字图像数据 -
NIST
Handprinted Forms and Characters 手写英文字符数据 -
NIST
Structured Forms Reference Set of Binary Images (SFRS) 图像数据 -
NIST
Structured Forms Reference Set of Binary Images (SFRS) II 图像数据
特定一类事物图像
- 著名的猫图像标注数据
-
Caltech-UCSD
Birds200 鸟类图像数据 -
Stanford
Car 汽车图像数据 -
Cars
汽车图像数据 -
MIT
Cars 汽车图像数据 -
Stanford
Cars 汽车图像数据 -
Food-101
美食图像数据 -
17_Category_Flower
图像数据 -
102_Category_Flower
图像数据 -
UCI
Folio Leaf 图像数据 -
Labeled
Fishes in the Wild 鱼类图像 -
美国
Yelp 点评网站酒店照片 -
CMU-Oxford
Sculpture 塑像雕像图像 -
Oxford-IIIT
Pet 宠物图像数据 -
Nature
Conservancy Fisheries Monitoring 过度捕捞监控图像数据【Kaggle数据】
材质纹理图像
物体分类图像
-
COIL-20
图像数据 -
COIL-100
图像数据 -
Caltech-101
图像数据 -
Caltech-256
图像数据 -
CIFAR-10
图像数据 -
CIFAR-100
图像数据 -
STL-10
图像数据 - LabelMe_12_50k图像数据
-
NORB
v1.0 图像数据 -
NEC
Toy Animal 图像数据 -
iCubWorld
图像分类数据 -
Multi-class
图像分类数据 -
GRAZ
图像分类数据
人脸图像
-
IMDB-WIKI
500k+ 人脸图像、年龄性别数据 -
Labeled
Faces in the Wild 人脸数据 -
Extended
Yale Face Database B 人脸数据 -
Bao
Face 人脸数据 -
DC-IGN
论文人脸数据 -
300
Face in Wild 图像数据 -
BioID
Face 人脸数据 -
CMU
Frontal Face Images -
FDDB_Face
Detection Data Set and Benchmark -
NIST
Mugshot Identification Database -
Faces
in the Wild 人脸数据 -
CelebA
名人人脸图像数据 -
VGG
Face 人脸图像数据 -
Caltech
10k Web Faces 人脸图像数据
姿势动作图像
-
HMDB_a
large human motion database -
Human
Actions and Scenes Dataset -
Buffy
Stickmen V3 人体轮廓识别图像数据 -
Human
Pose Evaluator 人体轮廓识别图像数据 -
Buffy
pose 人类姿势图像数据 -
VGG
Human Pose Estimation 姿势图像标注数据
指纹识别
-
NIST
FIGS 指纹识别数据 -
NIST
Supplemental Fingerprint Card Data (SFCD) 指纹识别数据 -
NIST
Plain and Rolled Images from Paired Fingerprint Cards in 500 pixels per inch 指纹识别数据 -
NIST
Plain and Rolled Images from Paired Fingerprint Cards 1000 pixels per inch 指纹识别数据
其它图像数据
视频数据
综合视频
人类动作视频
-
Microsoft
Research Action 人类动作视频数据 -
UCF50
Action Recognition 动作识别数据 -
UCF101
Action Recognition 动作识别数据 -
UT-Interaction
人类动作视频数据 -
UCF
iPhone 运动中传感器数据 -
UCF
YouTube 人类动作视频数据 -
UCF
Sport 人类动作视频数据 -
UCF-ARG
人类动作视频数据 -
HMDB
人类动作视频 -
HOLLYWOOD2
人类行为动作视频数据 -
Recognition
of human actions 动作视频数据 -
Motion
Capture 动作捕捉视频数据 -
SBU
Kinect Interaction 肢体动作视频数据
目标检测视频
-
UCSD
Pedestrian 行人视频数据 -
Caltech
Pedestrian 行人视频数据 -
ETH
行人视频数据 -
INRIA
行人视频数据 -
TudBrussels
行人视频数据 -
Daimler
行人视频数据 -
ALOV++
物体追踪视频数据
密集人群视频
其它视频
音频数据
综合音频
语音识别
-
Sinhala
TTS 英语语音识别 -
TIMIT
美式英语语音识别数据 -
LibriSpeech
ASR corpus 语音数据 -
Room
Impulse Response and Noise 语音数据 -
ALFFA
非洲语音数据 -
THUYG-20
维吾尔语语音数据 -
AMI
Corpus 语音识别
自然语言处理
- RCV1英语新闻数据
-
20news
英语新闻数据 -
First
Quora Release Question Pairs 问答数据 -
JRC
Names各国语言专有实体名称 -
Multi-Domain
Sentiment V2.0 -
LETOR
信息检索数据 -
Yale
Youtube Vedio Text - 斯坦福问答数据【Kaggle数据】
- 美国假新闻数据【Kaggle数据】
- NIPS会议文章信息数据(1987-2016)【Kaggle数据】
- 2016年美国总统选举辩论数据【Kaggle数据】
-
WikiLinks
跨文档指代语料 -
European
Parliament Proceedings Parallel Corpus 机器翻译数据 -
WikiText
英语语义词库数据 -
WMT
2011 News Crawl 机器翻译数据 -
Stanford
Sentiment Treebank 词汇数据
社会数据
- 希拉里邮件门泄露邮件
-
波士顿
Airbnb 公开数据【Kaggle数据】 - 世界各国经济发展数据【Kaagle数据】
- 世界大学排名芝加哥犯罪数据(2001-2017)【Kaagle数据】
- 世界范围显著地震数据(1965-2016)【Kaagle数据】
- 美国婴儿姓名数据【Kaagle数据】
- 全世界鲨鱼袭击人类数据【Kaagle数据】
- 1908年以来空难数据【Kaagle数据】
- 2016年美国总统大选数据【Kaagle数据】
- 2013年美国社区统计数据【Kaagle数据】
- 2014年美国社区统计数据【Kaagle数据】
- 2015年美国社区统计数据【Kaagle数据】
- 欧洲足球运动员赛事表现数据【Kaagle数据】
- 美国环境污染数据【Kaagle数据】
- 美国H1-B签证申请数据【Kaggle数据】
- IMDB五千部电影数据【Kaggle数据】
- 2015年航班延误和取消数据【Kaggle数据】
- 凶杀案报告数据【Kaggle数据】
- 人力资源分析数据【Kaggle数据】
- 美国费城犯罪数据【Kaggle数据】
- 安然公司邮件数据【Kaggle数据】
- 历史棒球数据【Kaggle数据】
-
美联航
Twitter 用户评论数据【Kaggle数据】 -
波士顿
Airbnb 公开数据【Kaggle数据】
处理后的科研和竞赛数据