Yolov5系列AI常见数据集(1)车辆,行人,自动驾驶,人脸,烟雾

下述所有数据可在下方二维码公众号回复: 数据大礼包 获得!!!

Fashion-MNIST图像数据集(200.4MB)

每个训练和测试样本都按照以下类别进行了标注:

标注编号描述
0T-shirt/top(T恤)
1Trouser(裤子)
2Pullover(套衫)
3Dress(裙子)
4Coat(外套)
5Sandal(凉鞋)
6Shirt(汗衫)
7Sneaker(运动鞋)
8Bag(包)
9Ankle boot(踝靴)

CIFAR100数据集(161.3MB)

车辆数据集(车辆识别与分类)(62.5MB)

垃圾分类数据集

该数据集是图片数据,分为训练集85%(Train)和测试集15%(Test)。其中O代表Organic(有机垃圾),R代表Recycle(可回收)。

另一个垃圾分类数据集(40.9MB)

CIFAR10数据集(148MB)

GTSRB-德国交通标志识别图像数据(253.3MB)

手势识别数据库(1.1GB)

提出了手势识别数据库,该数据库由Leap Motion传感器获取的一组近红外图像组成。

数据说明

该数据库由10个不同的手势(如上所示)组成,这些手势由10个不同的对象(5位男性和5位女性)执行。

情绪的面部表情(170MB+)

它是一个包含9名BPD(边缘型人格障碍)患者的数据库。
并非所有患者都接受了12次治疗采访。
所有患者都是女性。
治疗干预的持续时间因访谈而异。

数据说明

我们根据Paul Ekman和David Matsumoto的理论分析了7种情绪(Happy,Sad,Angry,Surprised,Scared,Disgusted,Contempt)的面部表情。
从每位患者的每次治疗访谈的视频记录中分析这些表达,每0.04秒分析一次,即每秒进行25次测量。
并非所有患者都能覆盖所有12个访谈,但会议的年表按照对治疗的帮助顺序出现。
因此,我们希望看到的是这些患者的适应力或情绪调节。
中性对Contemp的情绪在0到1的强度中被评估。
情绪效价从0到1被评估为正面情绪,0到-1是负面情绪。唤醒评估从0到1。

枪支目标检测(2.4MB)

一共有333张图像,对于每张图像,都标注了其中枪支的所在位置。图像不是单一尺寸的,它们有不同的长宽大小。值得注意的是,一张图像里面可能有不止一把枪支!

数据来源

数据收集基于来自flickr,google图像和yandex图像的抓取数据。

人脸图像数据(294.1MB)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4k5GGey7-1603543383804)(https://cdn.kesci.com/upload/image/pzgl9tukkd.png)]

RMFD口罩遮挡人脸数据集(610.3MB)

中国交警手势数据集(1.8GB)

数据已划分为训练集和测试集,每个文件夹包含多个视频和csv文件;
视频里展示了中国交警的各种手势动作,同一序号名称的csv文件则对应了每帧视频交警的动作标签

场景分类数据集(105.9MB)

87种宝石图片数据(50.9MB)

验证码数据集(13.5MB)

硬币图像数据集(326.7MB)

LabelMe图像语义分割数据集(102.6MB)

数据集包含945张图片,图片已经注释了天空,建筑物,道路,人行道,植被,窗户,门和汽车等的标签信息,用于语义图像分割任务。

车牌识别数据集(62.8MB)

Biwi头姿势数据库(449.7MB)

数据集包含945张图片,图片已经注释了天空,建筑物,道路,人行道,植被,窗户,门和汽车等的标签信息,用于语义图像分割任务。

动物

Butterfly-200细粒度图像分类数据集(828MB)

数据集包含25,279张蝴蝶🦋图像,涵盖200个物种,116属,23个亚科和5个科的四个不同级别,用于细粒度图像分类研究

宠物图像数据集(783.5MB)

狗狗种类图像数据集(919.5MB)

黑猩猩图片数据集(604.4MB)

植物:

水稻叶子疾病图片集(36.7MB)

水稻叶子的三种疾病,即Bacterial leaf blight, Brown spot, and Leaf smut。

植物幼苗图片数据集

花卉识别数据集(224.9MB)

花卉图像分类

可食用野外植物数据集

叶片计数图像数据集(882.3MB)

气象:

飓风损害的卫星图像数据集(63MB)

从卫星图像理解云层数据集(42MB)

字符识别:

TibetanMNIST藏文手写数字数据集(53.2MB)

MNIST手写识别数据集(9.5MB)

Chars74K字符识别数据集(188.3MB)

信用卡卡面图像及标注数据(42.9MB)

卡片是信用卡的重要载体,我们希望能够通过拍照卡片来识别卡片上的信息。
本次竞赛希望参赛者独立设计模型,在拍照的卡面上识别卡面信息, 具体包括如下几点:

  1. 判断是否是招行信用卡
  2. 识别卡类别
  3. 识别卡片编号
  4. 识别卡片有效期

手写数学表达式识别(29MB)

CROHME,一个在线手写数学表达识别竞赛。本数据集提供了来自CROHME 2011、2012和2013竞赛的训练和测试数据

图片与单词匹配数据集(31.1MB)

密集不规则文本行数据集(353MB)

视觉文字识别数据集

HASY手写符号图片数据集(127.2MB)

麻将图片数据集(7.5MB)

医疗:

犬球虫病寄生虫图片集(18.1MB)

包含犬球虫病寄生虫的近350张图片,识别他们!

头部CT图像数据(24.4MB)

该数据集包含100个正常头部CT切片和100个头部其他出血的CT切片

肺部CT图像数据(529.0MB)

LUNA和2017年Kaggle数据科学碗等竞赛涉及处理并试图找到肺部CT图像中的病变。
为了很好地发现这些图像中的疾病,首先要很好地找到肺部是很重要的。
该数据集是具有手动分割的肺的2D和3D图像的集合。

心血管疾病预测(2.7MB)

深圳医院胸片检查掩膜图片数据集(19.8MB)

该数据集包含人工分割的肺部图像掩膜,在我们最近的论文中使用该肺部图像掩膜来描述肺分割技术,结合无损和有损数据增强功能,使我们能够在如此小的数据集(<1000张图像)上获得统计上可靠的预测。

肺部CT图像数据(529MB)

结核病图像数据集(456.8MB)

该数据集全部与结核有关,取自痰液样本。
它包含928个痰液图像以及3734个细菌的边界框。XML文件包含图像的边界框详细信息。参见示例图片:

Image Name

行人识别:

行人检测数据集ETHZ(146MB)

行人重识别数据集Market-1501(145.7MB)

该数据集包括了1501个行人,751个行人用于训练,有750个人用于测试,共有3368个图像。 测试集中有19732张图像,训练集中有12936张图像。

行人重识别数据集RAiD(140.1MB)

行人重识别数据集prid_2011(1015.3MB)

汽车后视摄像头视角行人数据集(799.7MB)

数据集包含15个拍摄时段,每个拍摄时段在不同的日子以不同的场景进行。每个会话包含多个剪辑,持续时间从几秒钟到几分钟不等。数据集总共包含250个剪辑,总时长为76分钟,并带有超过20万个带注释的行人边界框。

两种类型的session。分阶段进行的场景主要包括行人以可控的方式在摄像机前的不同位置和方向行走,跨越后方警报或制动汽车功能的不同用例。在其余的时段中,车辆在公共道路或停车场中行驶,并捕获了偶然的行人。不同的位置包括:室内停车场,室外铺砌/沙地停车场,城市道路和私人车道。我们在不同的天气和光照条件下拍摄白天和黑夜的场景。有

——语音大类——

Mozilla语音数据集-中文(358.2MB)

2000个英语读数字的录音(8.9MB)

上述所有数据可在下方二维码公众号回复: 数据大礼包获得!!!

所有的数据,在下面二维码扫码关注就能免费领取~

一 [NLP] 50万闲聊语料

公众号回复:闲聊

二 密集人群检测

公众号回复:密集人群检测

三疲劳驾驶数据集

公众号回复:pilao

四 文本生成与文本分类数据集

公众号回复:文本生成

五 实体命名识别

公众号回复:实体命名识别

六 人脸识别

公众号回复:人脸识别

七 车牌数据集

公众号回复:车牌

八 自动驾驶数据集

公众号回复:自动驾驶

九 异常行为数据集

公众号回复:异常行为

十 人脸关键点检测

公众号回复:人脸关键点检测

十一 高空车辆数据集

公众号回复:高空车辆

十二 安全帽+头盔+算法

公众号回复:头盔

十三 吸烟手势

公众号回复:吸烟手势

十四 香烟数据+算法

公众号回复:香烟

十五 10万烟雾数火灾数据

公众号回复:烟雾

十六 十万口罩数据集

公众号回复:口罩

十七 车道线数据

公众号回复:车道线

十八 车辆识别数据+模型

公众号回复:车辆识别

十九 车辆检测数据集

公众号回复:车辆检测

二十 无人机检测

公众号回复:无人机

二十一 X光安检

公众号回复:安检

二十二 【语音识别】婴儿啼哭

公众号回复:婴儿啼哭

二十三 老鼠检测

公众号回复:老鼠检测

二十四 工业缺陷检测

包含:纺织布缺陷检测;

​ 金属钢板缺陷检测;

​ 混凝土缺陷检测;

​ PCB板缺陷检测;

​ 太阳能板缺陷检测;

等等

公众号回复:工业缺陷检测

二十五 交通卡口 车辆计数

公众号回复:车辆计数

二十六 电动车

公众号回复:电动车

二十七 医疗ct

公众号回复医疗ct

二十八 YOLOv3 口罩检测

公众号回复:v3口罩

二十九 漂流物检测

公众号回复:漂流物

三十 昆虫检测

公众号回复:昆虫

**三十一 点赞关注转发~

热门文章

暂无图片
编程学习 ·

那些年让我们目瞪口呆的bug

程序员一生与bug奋战&#xff0c;可谓是杀敌无数&#xff0c;见怪不怪了&#xff01;在某知识社交平台中&#xff0c;一个“有哪些让程序员目瞪口呆的bug”的话题引来了6700多万的阅读&#xff0c;可见程序员们对一个话题的敏感度有多高。 1、麻省理工“只能发500英里的邮件” …
暂无图片
编程学习 ·

redis的下载与安装

下载redis wget http://download.redis.io/releases/redis-5.0.0.tar.gz解压redis tar -zxvf redis-5.0.0.tar.gz编译 make安装 make install快链方便进入redis ln -s redis-5.0.0 redis
暂无图片
编程学习 ·

《大话数据结构》第三章学习笔记--线性表(一)

线性表的定义 线性表&#xff1a;零个或多个数据元素的有限序列。 线性表元素的个数n定义为线性表的长度。n为0时&#xff0c;为空表。 在比较复杂的线性表中&#xff0c;一个数据元素可以由若干个数据项组成。 线性表的存储结构 顺序存储结构 可以用C语言中的一维数组来…
暂无图片
编程学习 ·

对象的扩展

文章目录对象的扩展属性的简洁表示法属性名表达式方法的name属性属性的可枚举性和遍历可枚举性属性的遍历super关键字对象的扩展运算符解构赋值扩展运算符AggregateError错误对象对象的扩展 属性的简洁表示法 const foo bar; const baz {foo}; baz // {foo: "bar"…
暂无图片
编程学习 ·

让程序员最头疼的5种编程语言

世界上的编程语言&#xff0c;按照其应用领域&#xff0c;可以粗略地分成三类。 有的语言是多面手&#xff0c;在很多不同的领域都能派上用场。大家学过的编程语言很多都属于这一类&#xff0c;比如说 C&#xff0c;Java&#xff0c; Python。 有的语言专注于某一特定的领域&…
暂无图片
编程学习 ·

写论文注意事项

参考链接 给研究生修改了一篇论文后&#xff0c;该985博导几近崩溃…… 重点分析 摘要与结论几乎重合 这一条是我见过研究生论文中最常出现的事情&#xff0c;很多情况下&#xff0c;他们论文中摘要部分与结论部分重复率超过70%。对于摘要而言&#xff0c;首先要用一小句话引…
暂无图片
编程学习 ·

安卓 串口开发

上图&#xff1a; 上码&#xff1a; 在APP grable添加 // 串口 需要配合在项目build.gradle中的repositories添加 maven {url "https://jitpack.io" }implementation com.github.licheedev.Android-SerialPort-API:serialport:1.0.1implementation com.jakewhart…
暂无图片
编程学习 ·

2021-2027年中国铪市场调研与发展趋势分析报告

2021-2027年中国铪市场调研与发展趋势分析报告 本报告研究中国市场铪的生产、消费及进出口情况&#xff0c;重点关注在中国市场扮演重要角色的全球及本土铪生产商&#xff0c;呈现这些厂商在中国市场的铪销量、收入、价格、毛利率、市场份额等关键指标。此外&#xff0c;针对…
暂无图片
编程学习 ·

Aggressive cows题目翻译

描述&#xff1a; Farmer John has built a new long barn, with N (2 < N < 100,000) stalls.&#xff08;John农民已经新建了一个长畜棚带有N&#xff08;2<N<100000&#xff09;个牛棚&#xff09; The stalls are located along a straight line at positions…
暂无图片
编程学习 ·

剖析组建PMO的6个大坑︱PMO深度实践

随着事业环境因素的不断纷繁演进&#xff0c;项目时代正在悄悄来临。设立项目经理转岗、要求PMP等项目管理证书已是基操&#xff0c;越来越多的组织开始组建PMO团队&#xff0c;大有曾经公司纷纷建造中台的气质&#xff08;当然两者的本质并不相同&#xff0c;只是说明这个趋势…
暂无图片
编程学习 ·

Flowable入门系列文章118 - 进程实例 07

1、获取流程实例的变量 GET运行时/进程实例/ {processInstanceId} /变量/ {变量名} 表1.获取流程实例的变量 - URL参数 参数需要值描述processInstanceId是串将流程实例的id添加到变量中。变量名是串要获取的变量的名称。 表2.获取流程实例的变量 - 响应代码 响应码描述200指…
暂无图片
编程学习 ·

微信每天自动给女[男]朋友发早安和土味情话

微信通知&#xff0c;每天给女朋友发早安、情话、诗句、天气信息等~ 前言 之前逛GitHub的时候发现了一个自动签到的小工具&#xff0c;b站、掘金等都可以&#xff0c;我看了下源码发现也是很简洁&#xff0c;也尝试用了一下&#xff0c;配置也都很简单&#xff0c;主要是他有一…
暂无图片
编程学习 ·

C语言二分查找详解

二分查找是一种知名度很高的查找算法&#xff0c;在对有序数列进行查找时效率远高于传统的顺序查找。 下面这张动图对比了二者的效率差距。 二分查找的基本思想就是通过把目标数和当前数列的中间数进行比较&#xff0c;从而确定目标数是在中间数的左边还是右边&#xff0c;将查…
暂无图片
编程学习 ·

项目经理,你有什么优势吗?

大侠被一个问题问住了&#xff1a;你和别人比&#xff0c;你的优势是什么呢? 大侠听到这个问题后&#xff0c;脱口而出道&#xff1a;“项目管理能力和经验啊。” 听者抬头看了一下大侠&#xff0c;显然听者对大侠的这个回答不是很满意&#xff0c;但也没有继续追问。 大侠回家…
暂无图片
编程学习 ·

nginx的负载均衡和故障转移

#注&#xff1a;proxy_temp_path和proxy_cache_path指定的路径必须在同一分区 proxy_temp_path /data0/proxy_temp_dir; #设置Web缓存区名称为cache_one&#xff0c;内存缓存空间大小为200MB&#xff0c;1天没有被访问的内容自动清除&#xff0c;硬盘缓存空间大小为30GB。 pro…
暂无图片
编程学习 ·

业务逻辑漏洞

身份认证安全 绕过身份认证的几种方法 暴力破解 测试方法∶在没有验证码限制或者一次验证码可以多次使用的地方&#xff0c;可以分为以下几种情况︰ (1)爆破用户名。当输入的用户名不存在时&#xff0c;会显示请输入正确用户名&#xff0c;或者用户名不存在 (2)已知用户名。…