- ● 数据集介绍:工地工人安全设备佩戴检测数据集,真实场景+数据生成增强后高质量图片数据,涉及场景丰富,比如楼宇建筑工地工人作业数据、道路建筑工地工人作业数据、室内工地工人作业数据、露天挖掘场景工人作业数据、工地工人自拍+摆拍数据、工人背景抠图生成数据等; ● 适用实际项目应用:监控场景下工地工人安全设备佩戴检测项目,以及作为监控场景通用工地工人安全设备佩戴检测数据集场景数据的补充; ● 标注说明:采用 labelimg 标注软件进行标注,标注质量高,提供 VOC(xml)、COCO (json)、YOLO (txt) 三种常见目标检测数据集格式,可以直接用于如 YOLO 等的算法训练; ● 附赠训练示例:提供 YOLOv8、YOLOv5 一键训练脚本,提供 GPU(GPUs)、CPU、Mac(M芯片) 多平台训练方案支持,提供博主训练结果日志供参考; 注意:由于数据集资源超过 1G,所以托管在我的百度网盘,所以这里的资源格式是 PDF,内附数据集基本情况介绍以及数据集获取方式!0 16浏览¥ 59.90
- ● 数据集介绍:工地工人安全设备佩戴检测数据集,真实场景+数据生成增强后高质量图片数据,涉及场景丰富,比如楼宇建筑工地工人作业数据、道路建筑工地工人作业数据、室内工地工人作业数据、露天挖掘场景工人作业数据、工地工人自拍+摆拍数据、工人背景抠图生成数据等; ● 适用实际项目应用:监控场景下工地工人安全设备佩戴检测项目,以及作为监控场景通用工地工人安全设备佩戴检测数据集场景数据的补充; ● 标注说明:采用 labelimg 标注软件进行标注,标注质量高,提供 VOC(xml)、COCO (json)、YOLO (txt) 三种常见目标检测数据集格式,可以直接用于如 YOLO 等的算法训练; ● 附赠训练示例:提供 YOLOv8、YOLOv5 一键训练脚本,提供 GPU(GPUs)、CPU、Mac(M芯片) 多平台训练方案支持,提供博主训练结果日志供参考; 注意:由于数据集资源超过 1G,所以托管在我的百度网盘,所以这里的资源格式是 PDF,内附数据集基本情况介绍以及数据集获取方式!0 18浏览¥ 29.90
- 随着人工智能时代的到来,信息技术得以空前的速度迅猛发展,环境方面数据也呈现爆发性增长趋势,大数据已渗透的生活的方方面面。其中,在环境监测与保护领域的大数据研究也如火如荼。本文旨在探讨大数据在环境监测与保护中的应用,分析其在提升水面环境监测效能、优化环境治理等方面的突出作用。 首先,本文阐述了本研究的背景及重要性。 其次,本文阐述了大数据技术在环境监测与保护领域中的实际应用,在环境监测方面,大数据挖掘技术能够有效地对各种环境数据进行融合、深入挖掘与详细分析,增强监测数据的精确度、实用性和重要性,提高数据的质量。在水面环境保护方面,大数据技术能够通过对水面环境数据的深入分析,利用统计学、机器学习等方法,对水面环境数据进行深入分析和挖掘,发现环境问题的根源以及分析其发展趋势。 最后,论文总结了大数据技术在水面环境监测与保护中的应用成果和不足之处,并在环境监测与保护提出了一些建设性意见,此外,我们还对该领域的未来发展动向进行了预测。展望未来,大数据技术将持续进化并日趋完善,其在环境监测与保护领域的运用也将变得更为普遍和深刻,为解决环境问题提供更加有效的手段,同时也为相关部门和决策者提供了有益的0 5浏览¥ 14.90
- VMD-TCN-BiLSTM-MATT变分模态分解卷积双向长短期网络多头注意力多变量时序预测 VMD-TCN-BiLSTM-MATT变分模态分解卷积双向长短期网络多头注意力多变量时序预测 VMD-TCN-BiLSTM-MATT变分模态分解卷积双向长短期网络多头注意力多变量时序预测 VMD-TCN-BiLSTM-MATT变分模态分解卷积双向长短期网络多头注意力多变量时序预测0 38浏览¥ 199.90
- CPO-TCN-BiGRU-Attention和TCN-BiGRU-Attention多变量时序预测 CPO-TCN-BiGRU-Attention和TCN-BiGRU-Attention多变量时序预测 CPO-TCN-BiGRU-Attention和TCN-BiGRU-Attention多变量时序预测 CPO-TCN-BiGRU-Attention和TCN-BiGRU-Attention多变量时序预测 CPO-TCN-BiGRU-Attention和TCN-BiGRU-Attention多变量时序预测5 26浏览¥ 299.90
- 专119-PSO-RF-KDE的粒子群优化随机森林结合核密度估计多变量回归区间预测0 28浏览¥ 119.90
- 专149-BiLSTM-MATT-ABKDE的多头注意力机制自适应带宽核密度估计多变量回归区间预测0 25浏览¥ 149.90
- sap sd0 7浏览¥ 19.90
- 对保险业中人工智能的监管: 平衡消费者保护与创新.pdf0 35浏览¥ 19.90
- 本书将全⾯介绍深度学习从模型构造到模型训练的⽅⽅⾯⾯,以及它们在计算机视觉和⾃然语⾔处理中的应⽤。我们不仅将阐述算法原理,还将基于ApacheMXNet对算法进⾏实现,并实际运⾏它们。本书的每⼀节都是⼀个Jupyter记事本。它将⽂字、公式、图像、代码和运⾏结果结合在了⼀起。读者不但能直接阅读它们,而且可以运⾏它们以获得交互式的学习体验。0 19浏览¥ 9.90
- 一种基于强化学习的自适应多邻域人工蜂群算法是一种优化算法,结合了强化学习和人工蜂群算法的思想。该算法通过引入强化学习的机制,使得人工蜂群算法能够在不同问题和环境下进行自适应调整和优化。0 21浏览¥ 9.90
- 无人机空地网络研究综述是对无人机和地面网络相结合的通信网络研究进展和应用领域的综合性概述。该综述旨在介绍无人机空地网络的背景、关键技术、应用场景以及未来发展趋势。0 10浏览¥ 9.90
- 卫星光网络中基于DQN的匹配度感知波长路由算法是一种应用于卫星光通信网络的算法。该算法利用深度强化学习(Deep Q-Network, DQN)技术,结合匹配度感知和波长路由策略,实现对卫星光网络中的数据传输进行优化与管理。0 15浏览¥ 9.90
- 面向语义通信网络的能效跨层优化是一种应用于通信网络的算法。该算法针对语义通信网络,通过跨层设计和优化,提高通信网络的能效,实现更高效的数据传输和资源利用。0 10浏览¥ 9.90
- 考虑可变旋转参数的机器人多轴孔装配强化学习策略是一种应用于机器人装配任务的算法。该算法结合了强化学习和可变旋转参数的技术,旨在实现机器人在多轴孔装配过程中的自主决策和优化。0 9浏览¥ 9.90
- 计算机与人工智能在分子生物学数据分析方面的应用是指利用计算机科学和人工智能技术来处理和分析分子生物学领域的大数据,以揭示生物学系统的结构、功能和相互作用。0 11浏览¥ 9.90
- 基于稀疏探针机制的门控Transformer模型是一种用于自然语言处理任务的深度学习模型。该模型结合了稀疏探针机制和门控Transformer架构,旨在提高模型的效率和性能。0 13浏览¥ 9.90
- 基于双层联邦学习的高动态车联网业务边缘协作计算机制是一种用于车联网领域的算法。它结合了双层联邦学习和边缘计算技术,旨在实现车联网中高动态业务的协作计算与优化。0 17浏览¥ 9.90
- 基于深度强化学习的住宅区电动汽车充电策略是一种用于优化住宅区电动汽车充电行为的算法。面对日益增长的电动汽车数量和有限的充电资源,该算法结合了深度学习和强化学习方法,旨在实现住宅区电动汽车充电的智能调度和管理。0 13浏览¥ 9.90
- 基于强化学习的任务缓存和计算卸载效益最大化算法是一种用于优化任务调度和计算资源利用的算法。该算法结合了强化学习方法和任务缓存、计算卸载技术,旨在实现任务执行的高效性和资源利用的最大化。0 13浏览¥ 9.90
- 基于混合专家模型的智能网联汽车换道决策方法是一种用于自动驾驶汽车的决策算法。在自动驾驶汽车中,换道是一个关键的决策过程,需要考虑到交通流、安全性和效率等因素。 传统的换道决策方法往往使用规则或基于物理模型的方法来做决策,但这些方法可能无法适应复杂的交通环境和多变的驾驶情况。因此,基于混合专家模型的智能网联汽车换道决策方法被引入。 该算法的背景可以分为以下几个方面: 智能网联汽车:智能网联汽车是指配备了感知、通信和决策能力的汽车。它可以通过与其他车辆和基础设施的通信来获取周围环境的信息,并根据这些信息做出相应的决策和行动。 换道决策:换道是指在驾驶过程中将车辆从当前车道移动到相邻的车道。换道决策需要考虑到许多因素,如前方车辆的速度、距离、加速度、交通标志和信号等。 混合专家模型:混合专家模型是一种将多个专家子模型结合起来的方法。在该算法中,使用了多个专家子模型来对换道决策进行建模和预测。0 24浏览¥ 9.90
- 基于裁剪近端策略优化算法的软机械臂不规则物体抓取是一种用于软机械臂控制的算法。该算法结合了裁剪近端策略和优化方法,旨在实现对不规则物体的精确抓取。 传统的机械臂通常用硬件材料组成,而软机械臂由柔性材料构成,因此具有更好地适应性和柔韧性。然而,由于其柔软特性,软机械臂在抓取不规则物体时面临一定的挑战,如抓取姿态的选择和力的控制等。0 12浏览¥ 9.90
- Sam Altman 是 OpenAI 的 CEO,这家公司致力于使通用人工智能(AGI)惠及全人类。OpenAI 是历史上扩张速度最快的公司之一,估值高达 900 亿美元,收入超过 20 亿美元。在 OpenAI 之前,Sam 曾担任 Y Combinator 的总裁和 CEO,并在 Airbnb、Stripe、Reddit、Pinterest、Asana 等公司做过天使投资。 在今天的节目中,Sam Altman 和 Brad Lightcap 将讨论: 合作伙伴关系:科技界最强大的二人组: 6 年前,25 人拒绝了 OpenAI CFO 的职位,是什么让 Brad 在 Sam 之前加入了 OpenAI?他看到了什么别人没看到的? Brad 认为 Sam 最大的独特优势是什么,这一点世界还未知晓?Sam 又认为 Brad 的最大优势是什么? Brad 和 Sam 如何共同决策?他们是如何平衡直接处理和委派的?最近他们有什么意见不合?又是如何解决的? OpenAI 接下来的 12 个月:瓶颈、计算力和商品化: 接下来的 12 个月,OpenAI 面临的主要瓶颈是什么?0 62浏览¥ 19.90
- K-最近邻算法(K-Nearest Neighbors,简称kNN或k-NN)是一种非参数、有监督的学习分类器,它使用邻近度对单个数据点的分组进行分类或预测。kNN算法的核心思想是,如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别。 kNN算法的步骤主要包括: 计算未知实例到所有已知实例的距离。 选择参数k,k的值一般是奇数,以防止两个类别的个数相同,无法判断对象的类别。 根据多数表决(Majority-Voting)规则,将未知实例归类为样本中最多数的类别。 kNN算法可以用于分类和回归两种任务。在分类问题中,根据比重分配类别标签,即使用在给定数据点周围最多的标签。kNN算法的一个主要特点是,它在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN算法的优点是简单直观,对于类域的交叉或重叠较多的待分样本集来说,kNN方法较其他方法更为适合。但是,kNN算法的缺点是计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个最邻近点。因此,kNN算法在处理大数据集时可能会变。0 44浏览¥ 9.90
- 由于其在自主导航中的关键作用,对高效车载物体检测的需求正在增加。然而,由于 YOLO 等资源受限的边缘设备上的计算要求很高,因此在此类模型上部署此类检测模型具有挑战性。本文研究了一种名为Squeezed Edge YOLO的压缩目标检测模型。该模型被压缩和优化为千字节的参数,以适应此类边缘设备的板载。为了评估 Squeezed Edge YOLO,使用了两个用例 - 人体和形状检测 - 来展示模型的准确性和性能。此外,该模型还部署在具有 8 个 RISC-V 内核的 GAP8 处理器和具有 4GB 内存的 NVIDIA Jetson Nano 上。实验结果表明,Squeezed Edge YOLO模型尺寸优化了8倍,能效提高了76%,整个过程提高了3.3倍。0 35浏览¥ 9.90
- 本研究探讨了单阶段和两阶段二维目标检测算法的应用,如你只看一次(YOLO)、实时设计模型(RT-DETR)算法在自动物体检测中的应用,以提高奥地利道路上自动驾驶的道路安全性。YOLO算法是一种最先进的实时物体检测系统,以其效率和准确性而闻名。在驾驶环境中,其快速识别和跟踪物体的潜力对于高级驾驶辅助系统(ADAS)和自动驾驶汽车至关重要。该研究的重点是奥地利的道路状况和交通情况带来的独特挑战。该国多样化的景观、不同的天气条件和特定的交通法规需要一种量身定制的方法来进行可靠的物体检测。该研究利用了一个选择性数据集,包括在奥地利道路上拍摄的图像和视频,包括城市、农村和高山环境。0 44浏览¥ 9.90
- 低表面亮度星系(LSBG)是星系群中较暗的成员,被认为是众多的。然而,由于它们的表面亮度低,寻找广域LSBGs样本是困难的,这反过来又限制了我们充分了解星系的形成和演化以及星系关系的能力。边缘LSBG由于其独特的方向,为研究星系结构和星系成分提供了极好的机会。在这项工作中,我们利用You Only Look Once目标检测算法,通过在斯隆数字巡天(SDSS)中训练281个边缘LSBG来构建边缘LSBG检测模型gri-波段合成图像。该模型在测试集上的召回率为94.64%,纯度为95.38%。我们搜索了 938,046gri来自 SDSS 数据发布 16 的波段图像,发现了 52,293 个候选 LSBG。为了提高候选LSBG的纯度并减少污染,我们采用了深度支持向量数据描述算法来识别候选样品中的异常。最终,我们编制了一个包含 40,759 个边缘 LSBG 候选药物的目录。该样本与训练数据集具有相似的特征,主要由蓝色边缘的 LSBG 候选者组成。该目录可通过此 https URL 在线获取。0 27浏览¥ 9.90
- 番茄叶病对番茄种植者构成了重大挑战,导致作物产量大幅下降。及时准确地识别番茄叶病对于成功实施病害管理策略至关重要。本文介绍了一种基于变压器的模型,称为TomFormer,用于番茄叶病检测。该论文的主要贡献包括以下几点:首先,我们提出了一种检测番茄叶病的新方法,即采用结合视觉转换器和卷积神经网络的融合模型。其次,我们的目标是将我们提出的方法应用于Hello Stretch机器人,以实现番茄叶病的实时诊断。第三,我们通过将我们的方法与 YOLOS、DETR、ViT 和 Swin 等模型进行比较来评估我们的方法,证明其能够实现最先进的结果。为了进行实验,我们使用了三个番茄叶病数据集,即 KUTomaDATA、PlantDoc 和 PlanVillage,其中 KUTomaDATA 是从阿联酋阿布扎比的一个温室收集的。最后,我们对模型的性能进行了全面分析,并彻底讨论了我们方法固有的局限性。TomFormer 在 KUTomaDATA、PlantDoc 和 PlantVillage 数据集上表现良好,平均准确率 (mAP) 得分分别为 87%、81% 和 83%。mAP的比较结果表明,我们的方法0 21浏览¥ 9.90
- 传统的人工检测焊点缺陷在工业生产中不再适用,因为效率低、评估不一致、成本高、缺乏实时数据。针对工业场景表面贴装技术中焊点缺陷检测精度低、误检率高、计算成本高等问题,提出了一种新的方法。所提出的解决方案是专门为焊点缺陷检测算法设计的混合注意力机制,通过提高精度同时降低计算成本来改善制造过程中的质量控制。混合注意力机制包括一种增强的多头自注意力和协调注意力机制,增加了注意力网络感知上下文信息的能力,并增强了网络特征的利用范围。坐标注意力机制增强了不同通道之间的连接,减少了位置信息丢失。混合注意力机制增强了网络感知远距离位置信息和学习局部特征的能力。改进后的算法模型对焊点缺陷检测具有较好的检测能力,mAP达到91.5%,比“只看一次”第5版算法高4.3%,优于其他对比算法。与其他版本相比,平均平均精度、精度、召回率和每秒帧数指标也有所改进。在满足实时检测要求的同时,可以提高检测精度。0 42浏览¥ 9.90
- 以YOLO系列为代表的目标检测模型得到了广泛的应用,并在高质量的数据集上取得了很好的成绩,但并不是所有的工作条件都是理想的。为了解决在低质量数据集上定位目标的问题,现有方法要么训练新的目标检测网络,要么需要大量低质量数据集进行训练。然而,我们在本文中提出了一个框架,并将其应用于称为 DiffYOLO 的 YOLO 模型。具体来说,我们从去噪扩散概率模型中提取特征图,以增强训练有素的模型,这使我们能够在高质量数据集上微调YOLO,并在低质量数据集上进行测试。结果证明,该框架不仅可以证明在噪声数据集上的性能,还可以证明在高质量测试数据集上的检测结果。我们稍后将补充更多的实验(使用各种数据集和网络架构)。0 75浏览¥ 9.90
- 计算机视觉和遥感中最重要的问题之一是物体检测,它可以识别图片中不同事物的特定类别。公共安全的两个关键数据来源是无人驾驶飞行器(UAV)产生的热红外(TIR)遥感多场景照片和视频。由于目标尺度小,场景信息复杂,相对于可观看视频的分辨率较低,并且缺乏公开可用的标记数据集和训练模型,因此其目标检测过程仍然很困难。本研究提出了一种用于图片和视频的UAV TIR目标检测框架。用于收集地面TIR照片和视频的前视红外(FLIR)相机用于创建基于CNN架构的“你只看一次”(YOLO)模型。结果表明,在验证任务中,使用YOLOv7(YOLO版本7)最先进的模型\cite{1},检测人体的平均精度为IOU(Intersection over Union)= 0.5,为72.5%,而检测速度约为161帧/秒(FPS/秒)。该应用展示了YOLO架构的实用性,该应用根据YOLOv7模型从各种无人机的观察角度评估了无人机TIR视频中人员的交叉检测性能。本工作对使用深度学习模型的TIR图片和视频目标检测进行定性和定量评估得到了有利的支持。0 22浏览¥ 9.90
- 本文介绍了CowStallNumbers数据集,该数据集是从奶牛视频中提取的图像集合,旨在推进奶牛摊位数量检测领域。该数据集包括 1042 张训练图像和 261 张测试图像,摊位数范围为 0 到 60。为了增强数据集,我们对YOLO模型进行了微调,并应用了数据增强技术,包括随机裁剪、中心裁剪和随机旋转。实验结果表明,识别失速数的准确率为95.4%。0 16浏览¥ 9.90
- 所提出的YOLO-Former方法将Transformer和YOLOv4的思想无缝集成,创建了一个高精度、高效率的目标检测系统。该方法利用了 YOLOv4 的快速推理速度,并通过集成卷积注意力和 transformer 模块,融合了 transformer 架构的优势。结果验证了所提方法的有效性,在Pascal VOC数据集上的平均精度(mAP)为85.76\%,同时保持了较高的预测速度,帧速率为每秒10.85帧。这项工作的贡献在于展示了这两种最先进技术的创新组合如何导致目标检测领域的进一步改进。5 43浏览¥ 9.90
- 坑洼是常见的道路危险,会对车辆造成损坏并给驾驶员带来安全风险。卷积神经网络(CNN)的引入在业界广泛用于基于深度学习方法的目标检测,并在硬件改进和软件实现方面取得了重大进展。在本文中,提出了一种独特的更好算法,以保证使用低分辨率相机或低分辨率图像和视频源,通过超分辨率生成对抗网络(SRGAN)使用超分辨率(SR)进行自动坑洼检测。然后,我们继续使用 You Only Look Once (YOLO) 网络(即 YOLOv7 网络)在低质量和高质量行车记录仪图像上建立基线坑洼检测性能。然后,我们说明并检查了在对低质量图像进行放大实施后,在基准之上获得的速度和准确性。0 14浏览¥ 9.90
- 许多现有的无封面隐写术方法在封面图像和隐藏数据之间建立了映射关系。存在一个问题,即存储在数据库中的图像数量会随着隐写能力的增加而呈指数增长。对高隐写能力的需求使得构建图像数据库具有挑战性。为了提高隐写系统的图像库利用率和抗攻击能力,我们提出了一种基于动态匹配子串的高效无覆盖方案。YOLO用于选择最优对象,并在这些对象和加扰因子之间建立映射字典。借助该字典,每个图像都被有效地分配给特定的加扰因子,该因子用于加扰接收器的序列键。为了在有限的图像库中实现足够的隐写能力,加扰序列的所有子串都具有隐藏数据的潜力。完成秘密信息匹配后,将从数据库中获得理想数量的stego图像。实验结果表明,该技术在数据负载、传输安全性、隐藏能力等方面优于以往大多数工作。在典型的几何攻击下,它平均可以恢复79.85%的秘密信息。此外,只需要大约 200 个随机图像即可满足每个图像 19 位的容量。0 21浏览¥ 9.90
- 在集成传感和通信 (ISAC) 系统中,将雷达目标与通信用户设备 (UE) 相匹配可用于多种通信任务,例如主动切换和波束预测。在本文中,我们考虑了一种雷达辅助通信系统,其中基站(BS)配备了具有双重目标的多输入多输出(MIMO)雷达:(i)将车载雷达目标与通信波束空间中的车载设备(VE)相关联,以及(ii)根据雷达数据预测每个VE的波束成形矢量。建议的目标用户 (T2U) 关联包括两个阶段。首先,从距角图像中检测车辆雷达目标,并估计每个目标的波束成形矢量。然后,将推断出的每目标波束成形矢量与BS上用于通信的波束成形矢量进行匹配,以执行目标到用户(T2U)关联。通过修改“只看一次”(YOLO)模型,在模拟的距离角度雷达图像上进行训练,从而获得联合多目标检测和波束推理。不同城市车辆出行情景下的仿真结果表明,所提T2U方法提供了随BS天线阵列尺寸增加而增加的正确关联概率,突出了波束空间中VE可分离性的相应增加。此外,我们表明,改进后的YOLO架构可以有效地进行波束预测和雷达目标检测,在不同天线阵列尺寸下,后者的平均精度相似。0 13浏览¥ 9.90
- 优化普通种植作物的作物收获过程对于农业产业化的目标具有重要意义。如今,机器视觉的利用使农作物的自动识别成为可能,从而提高了收割效率,但挑战仍然存在。本研究提出了一个新框架,该框架结合了卷积神经网络(CNN)的两个独立架构,以便在模拟环境中同时完成作物检测和收获(机器人操作)的任务。模拟环境中的裁剪图像会进行随机旋转、裁剪、亮度和对比度调整,以创建用于数据集生成的增强图像。“你只看一次”算法框架与传统的矩形边界框一起使用,用于作物定位。随后,所提出的方法通过视觉几何组模型利用获取的图像数据,以揭示机器人操作的抓取位置。0 41浏览¥ 9.90
- You Only Look Once (YOLO) 系列探测器已成为高效实用的工具。但是,它们对预定义和训练对象类别的依赖限制了它们在开放场景中的适用性。为了解决这一局限性,我们引入了 YOLO-World,这是一种创新方法,通过视觉语言建模和大规模数据集的预训练,增强了 YOLO 的开放词汇检测功能。具体而言,我们提出了一种新的可重新参数化的视觉-语言路径聚合网络(RepVL-PAN)和区域-文本对比损失,以促进视觉和语言信息之间的交互。我们的方法擅长以零射程、高效率检测各种物体。在具有挑战性的 LVIS 数据集上,YOLO-World 在 V100 上以 52.0 FPS 实现了 35.4 AP,在准确性和速度方面都优于许多最先进的方法。此外,经过微调的 YOLO-World 在多个下游任务上取得了出色的性能,包括对象检测和开放词汇实例分割。0 171浏览¥ 9.90
- 在计算机视觉中,检测红外图像中从小到小的目标是一项具有挑战性的任务,尤其是在将这些目标与嘈杂或有纹理的背景区分开来时。与分割神经网络相比,YOLO 等传统目标检测方法难以检测微小目标,导致检测小目标时性能较弱。为了在保持高检测率的同时减少误报的数量,我们引入了反之亦然YOLO检测器训练的决策标准。后者利用了出乎意料的小目标,以区分他们与复杂背景。将这一统计标准添加到YOLOv7-tine中,弥合了用于红外小目标检测和目标检测网络的最先进的分割方法之间的性能差距。它还显著提高了YOLO在少镜头设置下的鲁棒性。0 50浏览¥ 9.90
- 简介 本研究探讨了使用最新的 You Only Look Once (YOLO V7) 物体检测方法,通过训练和测试医学图像格式上的改进 YOLO V7,来增强医学成像中的肾脏检测。方法 研究纳入878例肾细胞癌(RCC)不同亚型患者和206例肾脏正常患者。共检索到1084例患者的5657次MRI扫描。从回顾性维护的数据库中招募了 326 名患者,涉及 1034 个肿瘤,并在他们的肿瘤周围绘制了边界框。在 80% 的注释案例上训练了主要模型,其中 20% 用于测试(主要测试集)。然后使用最佳主要模型来识别其余 861 名患者的肿瘤,并使用该模型在他们的扫描中生成边界框坐标。创建了 10 个基准训练集,其中包含未分段患者的生成坐标。用于预测主要测试集中肾脏的最终模型。我们报告了阳性预测值(PPV)、灵敏度和平均精密度(mAP)。结果 初级训练集的平均PPV为0.94 +/- 0.01,灵敏度为0.87 +/- 0.04,mAP为0.91 +/- 0.02。最佳主要模型的 PPV 为 0.97,灵敏度为 0.92,mAP 为 0.95。最终模型的平均 PPV 为 0.95 +/- 0.030 19浏览¥ 9.90
- 即将到来的平方公里阵列(SKA)将为天文仪器产生的数据量设定一个新标准,这可能会挑战广泛采用的数据分析工具,这些工具无法与数据大小进行充分扩展。本研究旨在通过应用现代深度学习目标检测技术,为海量射电天文数据集开发一种新的源检测和表征方法。这些方法已经证明了它们在复杂的计算机视觉任务中的效率,我们试图确定它们在应用于天文数据时的具体优势和劣势。我们介绍了YOLO-CIANNA,这是一款专为天文数据集设计的高度定制的深度学习目标探测器。本文介绍了该方法,并描述了解决射电天文图像特定挑战所需的所有低级适应。我们使用来自 SKAO SDC1 数据集的模拟 2D 连续体图像演示了这种方法的功能。我们的方法优于特定 SDC1 数据集上所有其他已发表的结果。使用 SDC1 指标,我们将挑战获胜分数提高了 +139\%,将唯一其他挑战后参与的分数提高了 +61\%。我们的目录的检测纯度为 94%,同时检测的来源比以前的最高分结果多 40 至 60%。经过训练的模型还可以强制在后处理中达到 99% 的纯度,并且仍然比其他高分方法多检测 10% 到 30% 的来源。它还能够实时检测,在单个 GPU 上每秒0 15浏览¥ 9.90
- 在5G通信时代,消除影响通信的干扰源是一项资源密集型任务。计算机视觉的快速发展使无人机能够执行各种高空探测任务。由于天线干扰源的目标检测领域尚未得到充分探索,因此该行业缺乏针对该特定任务的专用学习样本和检测模型。本文创建了一个天线数据集,以解决重要的天线干扰源检测问题,并作为后续研究的基础。我们介绍了YOLO-Ant,这是一款专为天线干扰源检测而设计的轻量级CNN和变压器混合探测器。具体来说,我们最初为网络深度和宽度制定了轻量级设计,确保后续研究在轻量级框架内进行。然后,提出了一种基于深度可分离卷积和大卷积核的DSLK-Block模块,以增强网络的特征提取能力,有效提高小目标检测能力。为了解决天线检测中复杂的背景和较大的类间差异等挑战,我们构建了DSLKVit-Block,这是一个强大的特征提取模块,结合了DSLK-Block和变压器结构。考虑到其轻量级设计和精度,该方法不仅在天线数据集上实现了最佳性能,而且在公共数据集上也取得了具有竞争力的结果。0 23浏览¥ 9.90
- 目标检测是计算机视觉的一个关键方面,在准确性和鲁棒性方面取得了重大进展。尽管取得了这些进步,但实际应用仍然面临明显的挑战,主要是对小物体的不准确检测或漏检。在本文中,我们提出了基于YOLOv5的高级目标检测模型YOLO-TLA。我们首先在颈部网络金字塔架构中引入了一个额外的小物体检测层,从而生成了更大比例的特征图,以识别小物体的更精细特征。此外,我们将C3CrossCovn模块集成到骨干网中。该模块使用滑动窗口特征提取,有效地最小化了计算需求和参数数量,使模型更加紧凑。此外,我们还将全球关注机制纳入骨干网络。该机制将通道信息与全局信息相结合,以创建加权特征图。此特征图经过定制,可突出显示感兴趣对象的属性,同时有效地忽略不相关的细节。与基线YOLOv5s模型相比,我们新开发的YOLO-TLA模型在MS COCO验证数据集上显示出相当大的改进,在mAP@0.5中增加了4.6%,在mAP@0.5:0.95中增加了4%,同时将模型大小紧凑地保持在9.49M参数。进一步将这些改进扩展到 YOLOv5m 模型,增强版的 mAP@0.5 和 mAP@0.5:0.95 分别增加了 1.7% 和 1.90 156浏览¥ 9.90
- DETR 的训练范式很大程度上取决于在 ImageNet 数据集上预训练它们的骨干。然而,图像分类任务和一对一匹配策略提供的有限监督信号导致 DETR 的颈部预训练不足。此外,训练早期匹配的不稳定性导致DETR的优化目标不一致。为了解决这些问题,我们设计了一种创新的培训方法,称为分步培训。具体来说,在训练的第一阶段,我们采用经典的检测器,用一对多匹配策略进行预训练,以初始化端到端检测器的骨干和颈部。在训练的第二阶段,我们冻结了端到端检测器的骨干和颈部,因此需要从头开始训练解码器。通过分步训练的应用,我们引入了第一个实时端到端目标检测模型,该模型利用纯卷积结构编码器 DETR with YOLO (DEYO)。在不依赖任何补充训练数据的情况下,DEYO在速度和准确性上都超过了所有现有的实时目标检测器。此外,全面的 DEYO 系列可以使用单个 8GB RTX 4060 GPU 完成其对 COCO 数据集的第二阶段训练,从而大大降低了训练支出。源代码和预训练模型可在此 https URL 上找到。0 91浏览¥ 9.90
- 在计算机视觉领域,鉴于不同的环境条件和不同的物体外观所产生的固有复杂性,将先进技术集成到 RGB-D 相机输入的处理中是一项重大挑战。因此,本文介绍了FusionVision,这是一个详尽的管道,适用于RGB-D图像中对象的鲁棒3D分割。传统的计算机视觉系统在同时捕获精确的物体边界和在深度图上实现高精度物体检测方面存在局限性,因为它们主要用于RGB相机。为了应对这一挑战,FusionVision采用了一种集成的方法,将最先进的目标检测技术与先进的实例分割方法相结合。这些组件的集成可以对RGB-D数据进行整体(统一分析从颜色\textit{RGB}和深度\textit{D}通道获得的信息)解释,从而有助于提取全面准确的对象信息。所提出的FusionVision流水线采用YOLO来识别RGB图像域内的物体。随后,应用创新的语义分割模型FastSAM来划定对象边界,从而产生精细的分割掩码。这些组件之间的协同作用及其与 3D 场景理解的集成确保了对象检测和分割的紧密融合,从而提高了 3D 对象分割的整体精度。代码和预训练模型在此 https URL 上公开提供。0 27浏览¥ 9.90
- 目标检测和语义分割是生物医学图像分析中的关键组成部分。当前的单任务网络在检测和分割任务中都表现出可喜的结果。多任务网络因其能够同时处理分割和检测任务,同时加速分割推理而备受关注。然而,最近的多任务网络面临着明显的局限性,例如难以在准确性和推理速度之间取得平衡。此外,他们经常忽略跨尺度特征的集成,这对于生物医学图像分析尤为重要。在这项研究中,我们提出了一种高效的端到端多任务网络,能够同时执行对象检测和语义分割,称为YOLO-Med。我们的模型采用主干和颈部进行多尺度特征提取,并辅以两个特定于任务的解码器。采用跨尺度任务交互模块,促进各任务之间的信息融合。我们的模型在Kvasir-seg数据集和私人生物医学图像数据集上进行评估时,在平衡准确性和速度方面表现出有希望的结果。0 29浏览¥ 9.90
- 随着移动计算技术的快速发展,在移动设备上部署高效的目标检测算法成为计算机视觉的关键研究领域。本研究聚焦于优化 YOLOv7 算法,以提高其在移动平台上的运营效率和速度,同时确保高精度。利用群卷积、ShuffleNetV2 和 Vision Transformer 等先进技术的协同作用,该研究有效地减少了模型的参数计数和内存使用,简化了网络架构,并增强了资源受限设备的实时对象检测能力。实验结果表明,改进后的YOLO模型表现出优异的性能,显著提高了处理速度,同时保持了卓越的检测精度。0 63浏览¥ 9.90
- 近年来,异物闯入铁路和机场跑道的事件频发。这些物体可以包括行人、车辆、动物和碎片。本文介绍了一种改进的YOLOv5架构,该架构结合了FasterNet和注意力机制,以增强铁路和机场跑道上异物的检测。本研究提出了一个新的数据集,AARFOD(航空和铁路异物检测),它结合了两个公共数据集,用于检测航空和铁路系统中的异物。该数据集旨在提高异物目标的识别能力。该大型数据集的实验结果表明,与基线 YOLOv5 模型相比,所提出的模型具有显着的性能改进,从而降低了计算要求。改进后的YOLO模型在精度方面有1.2%的显著提高,召回率有1.0%的提高,mAP@.5的有0.6%的显著提高,而mAP@.5-.95保持不变。参数降低约25.12%,GFLOP降低约10.63%。在烧蚀实验中发现,FasterNet模块可以显著减少模型的参数数量,而注意力机制的参考可以减缓轻量化带来的性能损失。0 82浏览¥ 9.90
- 在本文中,我们提出了一种名为FogGuard的新型雾感知物体检测网络,旨在解决雾天气条件带来的挑战。自动驾驶系统严重依赖精确的物体检测算法,但恶劣的天气条件会严重影响深度神经网络 (DNN) 的可靠性。 现有方法分为两大类,1)图像增强,如IA-YOLO 2)基于域适应的方法。基于图像增强的技术试图生成无雾图像。但是,从有雾图像中检索无雾图像比在有雾图像中检测对象要困难得多。另一方面,基于域适应的方法不利用目标域中的标记数据集。这两类方法都试图解决更难的问题。我们的方法建立在 微调的基础上 我们的框架专门设计用于补偿场景中存在的雾气条件,确保均匀的性能。我们采用YOLOv3作为基线目标检测算法,并引入了一种新颖的师生感知损失算法,用于雾图像中的高精度目标检测。 通过对PASCAL VOC和RTTS等常见数据集的广泛评估,我们展示了我们的网络在性能方面的改进。我们证明 FogGuard 在 RTTS 数据集上实现了 69.43\% mAP,而 YOLOv3 为 57.78\%。 此外,我们表明,虽然我们的训练方法增加了时间复杂性,但与常规的YOLO网络相比,它在推理过程中不会引入任何额外0 15浏览¥ 9.90
- 包括雾霾、雪和雨在内的恶劣天气条件会导致图像质量下降,这通常会导致基于深度学习的检测网络的性能下降。大多数现有方法试图在执行目标检测之前校正朦胧图像,这增加了网络的复杂性,并可能导致潜在信息丢失。为了更好地整合图像恢复和目标检测任务,我们设计了一个带有注意力特征融合模块的双路由网络,同时考虑了朦胧和去雾特征。我们还提出了一个子网,为检测网络提供无雾霾特征。具体来说,我们的D-YOLO通过最小化清晰特征提取子网和检测网络之间的距离来提高检测网络的性能。在RTTS和FoggyCityscapes数据集上的实验表明,与最先进的方法相比,D-YOLO表现出更好的性能。它是一个强大的检测框架,用于弥合低水平去雾和高级检测之间的差距。0 44浏览¥ 9.90
- YOLOv9 是 You Only Look Once (YOLO) 系列的最新版本,它的推出使其在各种场景中被广泛采用。本文首次将YOLOv9算法模型应用于骨折检测任务,作为计算机辅助诊断(CAD),帮助放射科医生和外科医生解读X射线图像。具体而言,本文在GRAZPEDWRI-DX数据集上训练了模型,并使用数据增强技术扩展了训练集,以提高模型性能。实验结果表明,与当前最先进的(SOTA)模型的mAP 50-95相比,YOLOv9模型的值从42.16%提高到43.73%,提高了3.7%。实现代码在此 https URL 中公开提供。0 47浏览¥ 9.90
- 在本文中,我们探讨了零射大型多模态模型 (LMM) 在无人机感知领域的潜力。我们专注于人员检测和动作识别任务,并使用从鸟瞰图捕获的公开数据集评估两个著名的 LMM,即 YOLO-World 和 GPT-4V(ision)。传统的深度学习方法严重依赖大型和高质量的训练数据集。然而,在某些机器人环境中,在合理的时间范围内获取此类数据集可能是资源密集型的或不切实际的。基于提示的大型多模态模型 (LMM) 的灵活性及其卓越的泛化能力有可能彻底改变这些场景中的机器人应用。我们的研究结果表明,YOLO-World表现出良好的检测性能。GPT-4V 在准确分类动作类别方面遇到了困难,但在过滤掉不需要的区域建议和提供风景的一般描述方面取得了可喜的结果。这项研究代表了利用LMM进行无人机感知的第一步,并为该领域的未来研究奠定了基础。0 98浏览¥ 9.90
- 由于潜在的间距降低,半导体行业正在采用高数值孔径EUVL技术。然而,其低焦深给大批量制造带来了挑战。为了解决这个问题,供应商正在探索更薄的光刻胶和新的底层/硬掩模。这些可能受到 SNR 较差的影响,使缺陷检测复杂化。基于视觉的ML算法为半导体缺陷检测提供了一种很有前途的解决方案。然而,在没有明确训练的情况下,在各种图像分辨率上开发鲁棒的ML模型仍然是纳米级缺陷检测的挑战。本研究的目标是提出一种能够升级图像的尺度不变 ADCD 框架,以解决这个问题。我们提出了一个临时的ADCD框架,即SEMI-SuperYOLO-NAS,它建立在基线YOLO-NAS架构之上。该框架集成了一个 SR 辅助分支,以帮助通过缺陷检测主干学习 HR 特征,特别是用于从 LR 图像中检测纳米级缺陷实例。此外,SR 辅助分支可以从相应的缩小对应物递归生成放大图像,从而实现跨各种图像分辨率的缺陷检测推理,而无需显式训练。此外,我们还研究了改进的数据增强策略,旨在生成多样化和逼真的训练数据集,以提高模型性能。我们使用从两个不同过程获得并使用两种不同成像工具捕获的两个原始 FAB 数据集评估了我们提出的方法。最后,我们在0 24浏览¥ 9.90
- 我们介绍了 RealmDreamer,这是一种从文本描述中生成一般前向 3D 场景的技术。我们的技术优化了 3D 高斯 Splatting 表示,以匹配复杂的文本提示。我们通过利用最先进的文本到图像生成器来初始化这些溅射,将其样本提升为 3D,并计算遮挡体积。然后,我们使用图像条件扩散模型将这种表示优化为跨多个视图的 3D 修复任务。为了学习正确的几何结构,我们通过对内修模型中的样品进行调节,结合了深度扩散模型,从而给出了丰富的几何结构。最后,我们使用来自图像生成器的锐化样本对模型进行微调。值得注意的是,我们的技术不需要视频或多视图数据,可以合成各种不同风格的高质量 3D 场景,由多个对象组成。它的通用性还允许从单个图像进行 3D 合成。0 21浏览¥ 9.90
- 深度学习医学影像综述论文0 110浏览¥ 9.90
- Stable_Code_TechReport_release.pdf Stable Code技术,是由Stability AI Language Models团队精心打造的新一代代码语言模型,它不仅在代码补全、推理、数学计算等软件工程任务上表现出色,更以其小巧的体积和高效的性能,为我们打开了编程智能化的新篇章。 代码补全:Stable Code能够根据上下文自动完成代码片段,提高编程效率。 多轮对话:通过自然语言界面与模型交互,Stable Code能够理解和执行基于指令的任务。 数学理解:Stable Code在数学问题解决上展现出了先进的能力,能够理解和处理复杂的数学文本。 应用场景 开发工具:作为代码编辑器的内置AI助手,提供代码补全、问题解答和调试插件。 教育领域:帮助编程新手理解代码结构,提供交互式学习体验。 自动化测试:在软件开发中,Stable Code可以用于生成测试用例,提高软件质量。0 26浏览¥ 19.90
- 应博客粉丝响应,这里给出我的博客:https://zyunfei.blog.csdn.net/article/details/117911809?ydreferer=aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzE0NTk0MS9jYXRlZ29yeV8xMDYxMzQzMC5odG1sP3NwbT0xMDAxLjIwMTQuMzAwMS41NDgy 对应的毕业设计论文,这篇毕业设计共计80页左右,主要是将强化学习应用于无人机路径规划,有需要的可以付费购买(毕竟内容很多,知识付费是有必要的)。同时,这篇论文的开源代码地址:https://github.com/ZYunfeii/UAV_Obstacle_Avoiding_DRL 可以给我点个star。5 771浏览¥ 14.90
- YoloV8在制造、医疗、交通等领域的应用案例0 73浏览¥ 14.90
- 本文梳理了目标检测的相关背景,定义,挑战,损失函数及模型方法的发展,为希望学习相关知识的新手提供了相对比较全面易懂的简要介绍,同时结合本笔者自身研究方向的知识展开了相关的思考。 第一部分我们主要回答两个问题:目标检测在实际中有哪些应用以及为什么我们需要研究它的原因。 第二部分,我们主要会介绍目标检测的相关定义,挑战,经典的数据集以及相关的评价指标。在介绍数据集之前,我们会先结合目标检测的定义及挑战,以损失函数的角度概览目标检测的相关改进发展。从而使大家更好地理解后面所介绍的目标检测模型方法。 说明:无全面铺平水印 PDF版本涉及的相关博客:https://blog.csdn.net/qq_41895003/article/details/124961670 注:本文仅供学习,未经同意勿转。分享的PPT请勿二次传播,或者用于其他商用途径。若使用本文PPT请注明来源,感谢配合。5 258浏览¥ 9.90
- 人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例人工智能Sora提示词案例0 87浏览¥ 99.90