- 针对粘连、扭曲,且存在干扰噪声的验证码图像识别性能欠佳的问题,结合卷积神经网络提出一种通用的基于图像分割的验证码字符识别方法。首先对传统Otsu阈值分割算法的阈值选取策略进行改进,提出基于局部最优阈值分割的Otsu法对验证码图像进行二值化处理。其次,采用改进的融合字符积分投影特性的复杂验证码字符分割方法对存在粘连情况的字符进行二次分割。最后,将分割得到的单个字符归一化后直接输入到基于卷积神经网络的LeNet-5模型中进行训练和识别,并输出识别结果。大量网站验证码图像的实验测试结果表明,提出的方法对粘连、扭曲,且存在干扰噪声的字符验证码图像有着较高的识别率和适应性,有效克服经典方法对于不同种类验证码识别的针对性和局限性。0 216浏览会员免费
- 本文通过介绍整个系统以及在这个系统上实现的简单的手势识别,使大家更好地了解此系统在图像识别和文字识别方面的强大功能和易用性。0 244浏览会员免费
- 在水下机器人被广泛应用的背景下,能够实现水下自主导航的机器人具有极高的应用价值。为了打破水下机器人运行需要人为干预的瓶颈,更好地发挥小型机器人水下的灵活性,设计并制作了一种可自主导航的水下机器人系统。该系统机械上采用Pro/E作为三维造型软件,用快速成型设计并制造了水下机器人的主体;硬件上使用摄像头采集数据,并使用红外测距模块及电子罗盘模块实现定位功能;嵌入式软件层将传感器数据进行采集后,对数据进行相应的图像识别和处理,最终识别障碍物并做出相应动作;同时,数据和视频流可通过无线模块传送到上位机,上位机将数0 176浏览会员免费
- Python之成为图像处理任务的最佳选择,是因为这一科学编程语言日益普及,并且其自身免费提供许多最先进的图像处理工具。本文主要介绍了一些简单易懂最常用的Python图像处理库。 当今世界充满了各种数据,而图像是其中高的重要组成部分。然而,若想其有所应用,我们需要对这些图像进行处理。图像处理是分析和操纵数字图像的过程,旨在提高其质量或从中提取一些信息,然后将其用于某些方面。 图像处理中的常见任务包括显示图像,基本操作(如裁剪、翻转、旋转等),图像分割,分类和特征提取,图像恢复和图像识别等。 Python之成为图像处理任务的最佳选择,是因为这一科学编程语言日益普及,并且其自身免费提供许多最先进的图0 291浏览会员免费
- 为更好地提取烟雾图像的全局特征,提出一种基于膨胀卷积和稠密连接的烟雾识别方法。依次堆叠膨胀率不同的膨胀卷积,扩大卷积核的感受野,使得卷积核能够感知更广泛的烟雾图像区域,在不同膨胀卷积层之间设计稠密连接机制,促进卷积层之间的信息流通,实现烟雾图像局部特征和全局特征的融合。在此基础上,构造应用于烟雾识别的深度卷积神经网络,并在训练样本和标签的凸组合上完成训练以增强模型的泛化能力。实验结果表明,与 Alexnet、vGG16等方法相比,该方法具有较好的烟雾特征表达能力,能在提高烟雾识别效果的同时,减小模型尺寸效果,其实用性较好。0 175浏览会员免费
- 随着计算机技术和模式识别等相关技术的飞速发展, 使运用当今先进技术来研制安全监测系统成为可能, 人脸识别是安全监测系统中身份识别的一种最方便、最直接的方法。传统的人脸图像识别系统是由大规模或超大规模集成电路来完成的, 图像采集依赖于较大型设备, 速度比较慢, 实时性较差, 在小范围内使用价格比较昂贵。随着数字信号处理器DSP的飞速发展, 它以其高速、准确的性能为图像获取带来了新的途径, 而且用硬件来实现人脸图像识别价格比较低廉。 DSP(digital signal processor)是一种独特的微处理器,是以数字信号来处理大量信息的器件。其工作原理是接收模拟信号,转换为0或1的数字0 299浏览会员免费
- 主要有以下步骤: 1、人脸检测 2、人脸预处理 3、从收集的人脸训练机器学习算法 4、人脸识别 5、收尾工作 人脸检测算法: 基于Haar的脸部检测器的基本思想是,对于面部正面大部分区域而言,会有眼睛所在区域应该比前额和脸颊更暗,嘴巴应该比脸颊更暗等情形。它通常执行大约20个这样的比较来决定所检测的对象是否为人脸,实际上经常会做上千次。 基于LBP的人脸检测器基本思想与基于Haar的人脸检测器类似,但它比较的是像素亮度直方图,例如,边缘、角落和平坦区域的直方图。 这两种人脸检测器可通过训练大的图像集找到人脸,这些图像集在opencv中存在XML文件中以便后续使用。 这些级联分类检测器通常至少需0 424浏览会员免费
- 互联网数据中心(IDC)介绍了的运维工作关键而又繁重,运营商迫切需要考虑如何引入巡检机器人进而提升智能运维水平。介绍了巡检机器人业界发展现状与技术成熟度,提出了巡检机器人数据采集系统总体架构。结合互联网数据中心巡检机器人实际现网需求情况,深入探讨互联网数据中心智能化运维方面的技术突破点以及对采集数据的挖掘与应用。0 97浏览会员免费
- 通过图像识别分析方法,时时分析驾驶员精神状态, 对各种危险驾驶行为以及疲劳驾驶给出警告,减少由于疲劳驾驶导致的交通事故安森美图像传感器提供同类最佳的全局快门捕捉运动姿态 • 与脉冲光同步0 122浏览会员免费
- 植物是生命的主要形态之一,其种类已达40多万种,对其进行分类识别在生物多样性保护,生态农业,生物安全中有着重要的意义。不同的种类的植物一般有着不同的叶片形状,因此叶片的形状特征在植物分类中扮演着重要的角色。作为计算机视觉的一个重要应用的植物叶片图像识别,近些年来受到了学者们的关注,产生了大量的研究成果。但由于植物种类巨大,叶片图像存在的类内差异大、类间差异小和叶片的自遮挡等问题等诸多问题,使得叶片图像的识别仍然是目前计算机视觉应用研究的一个热点。对近些年来的基于形状特征的叶片图像识别算法进行了综述和比较,对现有的算法进行了分类,对目前各类最先进的识别算法进行了分析和比较。此外,还介绍了常用的叶片图像测试集和性能评估方法,并将各类算法进行了实验结果的比较研究。研究工作既为现有的植物叶片识别算法的实际应用提供了指导,又为今后进一步研究新的高性能的识别算法提出了努力的方向。0 180浏览会员免费
- 为了提高植物叶片图像识别的准确率,提出一种基于差异性值监督局部线性嵌入(D-LLE)算法的多特征植物叶片图像识别方法。该方法提取叶片的颜色、形状和纹理作为叶片多特征,在加权局部线性嵌入(WLLE)算法中引入样本的差异性值构成差异性值监督LLE算法(D-LLE)对叶片高维特征进行降维,在低维空间采用最近邻分类器实现叶片的识别。该方法所用的叶片多特征比单一特征像素值更能描述叶片图像,同时差异性值能够充分挖掘样本的类别信息。基于实拍的叶片图像数据库的实验结果表明,该方法有效提高了叶片的识别精度。0 151浏览会员免费
- 人脸检测中的AdaBoost算法,供大家参考,具体内容如下 第一章:引言 2017.7.31。英国测试人脸识别技术,不需要排队购票就能刷脸进站。据BBC新闻报道,这项英国政府铁路安全标准委员会资助的新技术,由布里斯托机器人实验室(Bristol Robotics Laboratory) 负责开发。这个报道可能意味着我们将来的生活方式。虽然人脸识别技术已经研究了很多年了,比较成熟了,但是还远远不够,我们以后的目标是通过识别面部表情来获得人类心理想法。 长期以来,计算机就好像一个盲人,需要被动地接受由键盘、文件输入的信息,而不能主动从这个世界获取信息并自主处理。人们为了让计算机看到这个0 230浏览会员免费
- 针对目前矿井外因火灾监测方法大都没有火源定位功能的问题,提出了基于双目视觉的矿井外因火灾感知与定位方法。在有电缆、胶带和机电设备的巷道、硐室及采掘工作面多点设置矿用可见光双目摄像机或近红外双目摄像机,采集监控区域图像;对采集到的图像进行预处理,通过阈值分割得到二值化图像;计算图像中的圆形度、矩形度和尖角数量,根据圆形度、矩形度和尖角数量对图像进行火焰识别,若图像检测区域有火焰,发出火灾报警信号,并融合温度、烟雾、二氧化碳、一氧化碳、氧气和红外传感器信息,提高报警准确性;通过矿用可见光双目摄像机或近红外双目摄像机对火源进行测距,结合摄像机位置对火源进行定位,并输出火源位置信息,控制火源附近灭火装置灭火。也可采用远红外双目摄像机进行火灾感知和火源定位,但成本高。基于双目视觉的矿井外因火灾感知与定位方法既可感知火灾又可定位火源,具有监控范围广、成本低、响应快、可视化等优点,解决了矿井外因火灾火源定位的难题。0 147浏览会员免费
- ocr OpenCV 想必做过程图像识别的同学们都对这两个词不陌生吧。 ocr (optical character recognition ,光学字符识别) 是指电子设备(例如扫描仪或数码相机)检查纸上的字符,通过检测暗,亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。 这样就给我编程提供了接口,我们可以识别图片的文字了 (有些文档我们通过手机拍照的,直接生成word )身份证识别,银行卡识别等。 opencv 是什么呢 OpenCV的全称是:Open Source Computer Vision Library。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机0 331浏览会员免费
- 针对电缆隧道内积水的问题,提出了一种改进的基于区域建议的卷积神经网络(Faster R-CNN)方法,并将其应用在电缆隧道积水定位识别中。考虑到Softmax分类方法的正则化参数选取会引起概率计算产生问题,改用支持向量机(SVM)进行图像分类,以增强分类的置信度。使用区域建议网络(RPN)提取隧道积水原图中的区域建议,然后用Fast R-CNN检测网络在建议框中进行图像识别、SVM分类和位置精修。实验结果表明,所提方法计算速度快、识别精度高,在实际工程中表现出较高的效率。0 171浏览会员免费
- 线列红外推扫探测器扫描帧率低,存在带状噪声,为此,提出一种基于Robinson-Guard滤波器和像素聚拢度的小目标检测方法。在红外图像上均匀布置采样窗口,令采样窗口根据图像亮度梯度聚集到高亮区域。融合红外图像的目标能量信息、局域对比度、目标像素聚拢度等多种特征,将采样窗口的加权叠加作为目标概率图。使用全局阈值分割获取目标,最终实现红外小目标的检测。实验结果表明,该算法可以检测中小尺寸的红外目标,且有效对抗探测器带来的带状噪声。0 268浏览会员免费
- 提出了一种在极坐标下进行特征提取的方法,并将其应用于树木叶片图像识别中。该方法首先将目标图像二值化并映射到极坐标下,提取具有旋转、缩放、平移不变性的曲线面积比率、跨度比、饱和度和高度变化率等特征。然后通过最小欧式距离对叶片进行计算、识别。该方法克服了直角坐标系下特征提取方法计算量大,花费的时间长的缺陷。基于该方法的叶片特征提取算法的时间复杂度为[O(n)]。对于叶型有区分,且需要快速进行树叶识别的树叶数据集有很好的效果。该方法在常见的13种树木叶片中进行测试,平均正确识别率达到90%以上。0 134浏览会员免费
- 针对粘连、扭曲,且存在干扰噪声的验证码图像识别性能欠佳的问题,结合卷积神经网络提出一种通用的基于图像分割的验证码字符识别方法。首先对传统 Otsu阈值分割算法的阈值选取策略进行改进,提出基于局部最优阈值分割的 Otsu法对验证码图像进行二值化处理。其次,采用改进的融合字符积分投影特性 的复杂验证码字符分割方法对存在粘连情况的字符进行二次分割。最后,将分割得到的单个字符归一化后直接输入到基于卷积神经网络的LeNet-5模型中进行训练和识别,并输出识别结果。大量网站验证码图像的实验测试结果表明,提出的方法对粘连、扭曲,且存在干扰噪声的字符验证码图像有着较高的识别率和适应性,有效克服经典方法对于不同种类验证码识别的针对性和局限性。0 424浏览会员免费
- 神经网路, 图像识别0 151浏览会员免费
- 针对目前塑料制品缺陷检测主要还是依靠人工检测和分拣,效率不高和生产过程自动化程度的不足,采用了一种基于FPGA的注塑制品缺陷检测的方法。通过CMOS图像传感器对注塑制品进行图像数据采集,然后利用Verilog HDL语言进行图像处理识别算法建模。下位机完成注塑制品图像数据的采集与处理,上位机完成图像的显示和工作模式的配置,上、下位机之间通过USB2.0进行数据的通信。实验证明,基于FPGA的注塑制品缺陷检测系统,检测精度高达98%以上。系统检测精度高,具有广阔的应用前景。0 271浏览会员免费
- 变电站红外图像的分割是对其进行进一步分析处理的基础。本文介绍了变电站红外图像的特点,并通过对现有分割方法的分析,提出了适合实际图像特点的彩色图像区域生长法。实验结果表明,该方法能较好的实现红外图像的分割,有利于后期的图像识别和特征数据的提取,适合于在变电站自动监控系统中应用。0 293浏览会员免费
- MEMS传感器是令人惊奇的小器件,大小仅为几平方毫米,通常包含两个芯片。一个是传感器芯片,通常来说MEMS器件提供运动或压力信息,但它也可以用作磁性固态传感器。0 74浏览会员免费
- 针对智能视频监控告警功能进行研究,通过OpenCV、C++及相关算法来更有效地进行图像识别,达到智能捕获可疑异常情况及告警功能。该系统包括图像采集模块,图像预处理模块,运动检测模块,人脸检测,人脸识别模块,短信模块等。通过对以上模块的研究与实验,达到了设计要求。0 195浏览会员免费
- 本文在介绍体系结构概念的基础 上, 对体系结构的发展进行了归纳总结, 分析指出体系结构刚性是当前信息系统灵活性和高效能无 法兼备的问题本质, 提出了以软件定义互连和软件定义节点为特征的新一代软件定义体系结构, 基 于软件定义体系结构实现了 Web 服务、口令字恢复和图像识别 3 种典型系统, 对比测试表明, 软件 定义体系结构系统较传统通用系统性能提升 29.4∼344.5 倍, 效能提升 13.7∼315.4 倍, 证明了软件定 义体系结构的高灵活性和高效能.0 119浏览会员免费
- 图像识别技术,连接着机器和这个一无所知的世界,帮助它越发了解这个世界,并最终代替我们完成更多的任务。0 213浏览会员免费
- 深度神经网络 (DNN) 是使用多个隐藏层的强大人工神经网络 (ANN) 类型。 它们最近在语音转录和图像识别社区中获得了相当大的关注,因为它们具有卓越的预测特性,包括对过度拟合的鲁棒性。 然而,它们在算法交易中的应用以前没有被研究过,部分原因是它们的计算复杂性。 本文描述了 DNN 在预测金融市场运动方向中的应用。 特别地,我们描述了配置和训练方法,然后展示了它们在 5 分钟间隔内对 43 种不同商品和外汇期货中间价格的简单交易策略进行回溯测试的应用。 本文中的所有结果都是使用英特尔至强融核协处理器上的 C 实现生成的,其速度比串行版本快 11.4 倍,并使用 Python 策略回溯测试环境,两者均作为作者编写的开源代码提供。0 127浏览会员免费
- CS5220原理图,CS5220参考设计电路,CS5220是HDMI转VGA内置flash可更新FW方案的高性能,低成本解决方案,用于实现HDMI1.4高分辨率视频转VGA转换器。5 218浏览会员免费
- 前言 人脸识别在LWF(Labeled Faces in the Wild)数据集上人脸识别率现在已经99.7%以上,这个识别率确实非常高了,但是真实的环境中的准确率有多少呢?我没有这方面的数据,但是可以确信的是真实环境中的识别率并没有那么乐观。现在虽然有一些商业应用如员工人脸识别管理系统、海关身份验证系统、甚至是银行人脸识别功能,但是我们可以仔细想想员工人脸识别管理,海关身份证系统的应用场景对身份的验证功能其实并没有商家吹嘘的那么重要,打个比方说员工上班的时候刷脸如果失败了会怎样,是不是重新识别一下,如果还是误识别,或是识别不出,是不是就干脆刷卡或是其他方式登记上班,然后骂一句他娘的,本人那0 323浏览会员免费
- 结合染色校正和卷积神经网络的细胞图像识别方法,杨金鑫,杨辉华,细胞图像识别是医学图像处理中的重要组成部分。由于医学图像具有尺寸较大,细胞形状各异等特性导致细胞识别工作通常费时费力。因0 351浏览会员免费
- 现有煤矸分选主要有人工分选和机械分选,这些方式存在劳动强度大、能耗高、易造成环境污染等问题。近年来,煤矸分选机器人的研究受到业内广泛关注。对煤矸分选机器人而言,煤矸的准确识别是一个关键且具有较大难度的问题。研究了基于图像的煤矸识别方法,并在此基础上开发了识别系统。介绍了煤矸分选机器人中图像识别系统的硬件组成,研究了实际工况条件下各部件的选择和安装方式;在实验室搭建图像采集系统,选取韩城矿区的煤和矸石为样本,由所搭建的系统获取样本图像,建立了样本图像库;对样本图像采用3种不同的滤波器进行降噪处理,对比分析得出非线性低通滤波处理效果最佳;基于煤和矸石表面物理特性在灰度和纹理两方面有一定的区别,分别对煤和矸石样本图像的4个灰度参数和5个纹理参数进行分析对比,得出在灰度方面灰度均值和最大频数对应的灰度值2个参数区分度更高,在纹理方面纹理对比度和熵2个参数区分度更高;选用最小二乘支持向量机(LS-SVM)为煤和矸石图像识别分类器,以灰度均值和最大频数对应的灰度值组成的灰度特征、纹理对比度和熵组成的纹理特征、最大频数对应的灰度值和纹理对比度组成的联合特征作为分类器的输入向量分别对分类器进行训练和对0 176浏览会员免费
- 烟草物流中心工作量大,枯燥单一,导致分拣过程中经常出现多拿、少拿以及错拿等错误分拣现象,这极大的影响了分拣的效率,甚至导致一些不必要的损失。针对此现象,设计了一种基于HALCON与SURF的多特征融合条烟识别系统。不但提出了新的条烟图像特征描述方法,同时针对分拣生产线的特点,对识别策略进行了相应的改进设计。实验表明,此方案具有较好的应用前景。0 147浏览会员免费
- 针对旅游景区人流统计、人流疏导管理的需求,文中基于计算机图像识别技术对人流密度监测的相关算法进行了研究,设计了人流密度监测系统。系统包括了图像采集、特征提取、密度判别3个算法功能模块。系统在人群图像的特征提取时,使用灰度矩阵共生法获取图像的纹理特征信息,提取了灰度图像的能量、熵、对比度、相关性等特征向量,在降低分类器输入特征向量的复杂度的同时提高了密度判别的准确度。系统经过训练和测试,识别准确率达到95.4%以上,具有广阔的应用前景。0 229浏览会员免费
- 卷积神经网络在GPU上的实现,陈浩,别红霞,卷积神经网络是目前机器学习领域的热点,其在图像识别领域有着广泛的应用。虽然卷积神经网络在各个方面都有不错的表现,但实际运0 236浏览会员免费
- 针对复杂场景下行人检测效果差的问题,采用基于深度学习的目标检测中领先的研究成果,提出了一种基于改进Mask R-CNN框架的行人检测算法。首先,采用K-means算法对行人数据集的目标框进行聚类得到合适的长宽比,通过增加一组长宽比(2∶5)使12种anchors适应图像中行人的尺寸;然后,结合细粒度图像识别技术,实现行人的高定位精度;其次,采用全卷积网络(FCN)分割前景对象,并进行像素预测获得行人的局部掩码(上半身、下半身),实现对行人的细粒度检测;最后,通过学习行人的局部特征获得行人的整体掩码。为了验证改进算法的有效性,将其与当前具有代表性的目标检测方法(如更快速的区域卷积神经网络(Faster R-CNN)、YOLOv2、R-FCN)在同数据集上进行对比。实验结果表明,改进的算法提高了行人检测的速度和精度,并且降低了误检率。0 840浏览会员免费
- 针对基于深度学习的Wi-Fi人体行为识别技术存在抗噪声能力弱、信号尺寸不兼容和特征提取不充分等问题,提出了一种基于连续图像深度学习的识别方法。首先把时变Wi-Fi信号重构为若干个连续图像帧,确保输入尺寸一致;进而设计低秩分解算法,对噪声湮没的关键运动信息进行分离;同时提出一种时间域和空间域信息融合的深度模型,自动捕捉变长图像序列的时空域特征,并在WiAR数据集和自主采集数据集上对所提方法进行验证。实验结果表明,所提方法平均识别精度分别为0.94和0.96,具备普适场景下的高精度和稳健性。0 314浏览会员免费
- 支持向量机是一种在统计学习理论的基础上发展而来的机器学习方法[1],通过学习类别之间分界面附近的精确信息,可以自动寻找那些对分类有较好区分能力的支持向量,由此构造出的分类器可以使类与类之间的间隔最大化,因而有较好的泛化性能和较高的分类准确率。由于支持向量机具有小样本、非线性、高维数、避免局部最小点以及过学习现象等优点,所以被广泛运用于故障诊断、图像识别、回归预测等领域。但是如果缺少了对样本进行有效地特征选择,支持向量机在分类时往往会出现训练时间过长以及较低的分类准确率,这恰恰是由于支持向量机无法利用混乱的样本分类信息而引起的,因此特征选择是分类问题中的一个重要环节。特征选择的任务是从原始的特征集合中去除对分类无用的冗余特征以及那些具有相似分类信息的重复特征,因而可以有效降低特征维数,缩短训练时间,提高分类准确率。0 156浏览会员免费
- 摘 要: 提出了一种基于人眼微动机理的边缘提取算法。通过模拟眼球的微动,提取图像的微动边缘,同时为了减少伪边缘的产生,对其微动边缘图像进行均值滤波处理,最后应用非极大值抑制和双阈值检测边缘连接提取图像的二值化边缘。实验结果显示,该算法边缘提取效果较好,达到了预期的效果。 图像边缘是图像不同属性区域之间交接的地方,是区域属性发生突变的地方。图像的边缘包含了图像大部分的信息,是图像识别和分类的重要依据,也是图像处理研究的重要内容。各国学者提出了许多图像边缘提取算法,如经典的Sobel、Prewitt、LOG、Canny等算法[1]。这些算法原理简单易于实现,但是由于它们大多都是基于局部窗口的0 105浏览会员免费
- 摘 要:详细介绍了CMOS图像传感器芯片OV5017的基本性能和编程特点,以及计算机并行口的性能和使用。在此基础上,分析并给出了基于OV5017的计算机并口图像采集系统的硬件组成和软件实现。实验表明,该系统设计合理,硬件电路简洁,软件编程容易,具有较高的实用价值。 关键词:CMOS图像传感器;OV5017;计算机并口;图像采集 1 引言 图像采集是数字图像处理、图像识别的基础,其应用领域非常广泛。传统的图像采集是采用图像采集卡或视霸卡将CCD摄像机的模拟视频信号经A/D采集、存储后送计算机进行处理。这种方法使用普遍,技术比较成熟,但也存在一些问题。0 151浏览会员免费
- 针对现有工具箱无法满足对微小工具的准确检测以及工具检测唯一性的要求,设计开发了一款基于安卓的智能工具检测系统。该系统由智能终端硬件系统、基于ARM处理芯片的安卓系统以及基于WEB的远程信息管理系统3部分组成;利用图像识别技术对微小工具进行检测,检测结果准确、快速,并能确保工具检测的唯一性,同时还可以实现远程监控。通过实验验证,该智能工具检测系统能对实验的5种异形工具进行准确、快捷地检测。该检测系统在维修工具的各个领域有广泛的应用和推广价值。0 96浏览会员免费
- iOS版微信的一项功能:当你在朋友圈发照片的时候,就可以根据照片的拍摄地点显示地理位置。消息一出,网友们便纷纷开始尝试新功能的玩法。 在微信朋友圈上传图片时,点击位置可以自动识别照片拍摄的地理位置。 过去我们发送朋友圈时,可以显示自己所在的位置信息,而现在自动读取照片拍摄位置让不少人联想到了图像识别技术。事实上,微信所做的并没有这么复杂,有业内人士告诉雷锋网新功能是基于图片位置信息(即Exif的GPS定位信息)实现的。 什么是Exif? Exif(Exchangeable Image File)是一种图像文件格式,它最早是由日本电子和信息技术协会(JEITA)为相机相机厂商制定一套标准。0 734浏览会员免费
- 摘要:阐述了基于CY7C68013和ADNS-3080的两自由度振动偏移量实时采集设备的设计与实现。详细分析了采用ADNS-3080完成图像采集、分析,并得出终有效数据△x和△y值的方法;采用CY7C68013进行数据处理并通过SPI总线和USB总线进行数据传输的过程;以及上位机的数据存储、分析、显示和网络传输的软件设计。 光电鼠标的工作机理是采用一种基于CMOS成像的图像识别方法,通过一个感光眼,不断的对物体进行拍照,并将前后两次图像进行DSP处理,得到移动的方向和间隔,因此,光电鼠标芯片具有一种传感器的基本功能。振动的检测,其基本原理可以归结到一种位移的检测。只是此种位移是围绕某个基0 92浏览会员免费
- 针对人耳识别中存储量和计算速度的要求,同时考虑远距离拍摄时低分辨率人耳识别问题,探讨了低分辨率人耳图像识别性能,给出了分辨率与识别率的关系。首先采用高斯金字塔对人耳图像进行不同层的分解,然后对每一层图像应用广义判别分析方法(GDA)提取特征,最后计算样本间的余弦距离,通过阈值法分类识别。实验结果表明,当人耳图像分辨率降低为36×24时系统识别性能最好,满足实时生物识别系统的要求。0 117浏览会员免费
- 小波域声纳图像识别,声纳图像的最主要缺点是所受噪声干扰大,针对这个问题,设计了一种抗噪性强的声纳图像识别算法0 53浏览会员免费
- 利用卷积神经网络和最先进的图像识别技术,经典老电影将有可能重现光彩。神经网络可以优化图像质量,减少电影噪声,并为老化图像上色。《乱世佳人》剧照 来源:谷歌历史上第一部电影诞生于19世纪晚期,在电影摄影机上使用赛璐珞胶片拍摄而成。时间来到2018年,全球电影市场产值已高达417亿美元。电影具有娱乐性、文化性和社会性,是一项至关重要的文化遗产,值得人类保护。但保护过程并没有那么简单。这主要是因为当代电影都是通过数码技术制作和放映,胶片技术早已过时。电影保护面临的挑战包括欧洲委员会在内的许多组织都曾强调保护老电影文化遗产所面临的挑战以及保护的重要性。欧洲委员会指出,如果没有合适的播放设备,人们可能无0 1102浏览会员免费
- ①安装PIL:pip install Pillow(之前的博客中有写过) ②安装pytesser3:pip install pytesser3 ③安装pytesseract:pip install pytesseract ④安装autopy3: 先安装wheel:pip install wheel 下载autopy3-0.51.1-cp36-cp36m-win_amd64.whl【点击打开链接】 执行命令:pip install E:\360安全浏览器下载\autopy3-0.51.1-cp36-cp36m-win_amd64.whl ##使用pip install autopy3时会报错如下0 259浏览会员免费
- 原作:Parul Pandey铜灵 编译整理量子位 出品 | 公众号 QbitAI 在图像处理领域,一库在手,相当于天下已有。 最近,有一位搞数据科学的小姐姐Parul Pandey,整理了一份实用Python图像处理工具,内含十大经典Python库。 这份资源中的工具可用于图像处理中的常见任务,包括裁剪、翻转、旋转、图像分割、分类和特征提取、图像恢复和图像识别等。可谓干货满满,图像处理提升效率必备。 量子位取其重点,将文章翻译整理如下: 1、scikit Image scikit-image是一个与numpy数组配合使用的开源Python包,在学术研究、教育和行业领域都可应用。 即使是那0 324浏览会员免费
- 0 引言 目前,具有自动驾驶功能的智能车越来越引起人们的重视。智能车装备了各种传感器来采集路况信息,通过计算机的控制可以实现自适应巡航,并且又快又稳、安全可靠。智能车不仅能在危险、有毒、有害的环境里工作,而且能通过计算机的控制实现安全驾驶,能大幅度降低车祸的发生率。智能车的设计关键是路况信息的采集,传统的方案多采用红外光电传感器,此方案不仅噪声较大,而且与主控CPU的连接电路复杂,传输速率慢。本文研究的智能小车系统选用了TSL1401CL线性CCD图像采集模块,该模块采用串行通信方式与主控CPU连接,不仅电路简单、性能稳定,而且采集速率快。通过实验测试,本文设计的智能车能根据采集到的图像分析0 210浏览会员免费
- 机器视觉在工业产品质量控制中的应用越来越广,针对LED晶粒的质量检测问题,提出了一种基于亚像素精度阈值分割的方法进行LED晶粒图像的识别。首先通过图像增强及预处理,然后通过基于亚像素精度的阈值分割方法进行晶粒图像的预处理,再通过K值聚类算法进行感兴趣的区域提取,最后通过NCC归一化的方法进行晶粒位置的识别及定位。实验结果表明,提出的亚像素精度阈值分割和NCC归一化定位算法相结合的方法应用在LED分拣机中,能准确地识别出LED晶粒图像。0 404浏览会员免费
- 原文编注:近日,中科院院士、清华大学人工智能研究院院长张钹教授接受记者采访时认为,目前基于深度学习的人工智能在技术上已经触及天花板。从长远来看,必须得走人类智能这条路,最终要发展人机协同,人类和机器和谐共处的世界。未来需要建立可解释、鲁棒性的人工智能理论和方法,发展安全、可靠和可信的人工智能技术。 张钹院士:AI奇迹短期难再现 深度学习技术潜力已近天花板 在Alphago与韩国围棋选手李世石对战获胜三年过后,一些迹象逐渐显现,张钹院士认为到了一个合适的时点,并接受了此次的专访。 深度学习目前人工智能最受关注的领域,但并不是人工智能研究的全部。张钹认为尽管产业层面还有空间,但目前基于深度学习的0 255浏览会员免费
- 随着小程序开放越来越多的类目,越来越多的企业将各种各样的需求开发成小程序,而基于图像识别的名片识别、身份证识别或者普通文字的 OCR 也越来越多的被应用于各种场景中,基于此,腾讯云微信小程序解决方案团队将腾讯万象优图的身份证识别和文字印刷体 OCR 封装进 wafer2-node-sdk 中,使得用户可以快速调用使用图片识别。 现在,通过 图像识别 Demo ,一起来完成身份证和印刷体识别的快速开发吧! 首先需要到腾讯云的万象优图控制台开通万象优图功能,并且创建 Bucket。创建的 Bucket 最好为公有读私有写的权限。 以下文档基于图像识别 Demo 进行介绍,目前图像识别接口只有 No0 346浏览会员免费
- 使用分层全卷积网络通过CT图像识别肺结节0 141浏览会员免费
- 基于Fisher判别法的人脸图像识别,舒予,,本文描述了人脸识别的两大步骤——特征提取和样本分类,介绍了K-L变换在人脸图像特征提取方面的运用,重点讲解了应用广泛的Fisher判0 176浏览会员免费
- 从生物神经元的电化学特性出发,基于积分发放(I&F)电路理论模型,提出了一种新型的结构紧凑的脉冲编码 CMOS神经元电路,模仿神经元细胞体输出连续脉冲串。该模型的优点在于大大简化了模型结构,其运行结果很好地拟合了神经元的生理特性,且在工艺参数不可调节的情况下,可通过输入信号灵活控制电路结构,改变输入耦合权重,从而实现对输入信号的脉冲编码。HSPICE仿真结果表明,该电路可以通过输出脉冲串频率实现对多端输入的二进制方波信号的权重识别,在自适应耦合调整的信息传递,图像识别神经网络构建和信号调制方面具有很大的应0 82浏览会员免费
- 前言 上一篇博文与大家分享了简单的图片人脸识别技术,其实在实际应用中,很多是通过视频流的方式进行识别,比如人脸识别通道门禁考勤系统、人脸动态跟踪识别系统等等。 下面话不多说了,来一起看看详细的介绍吧 案例 这里我们还是使用 opencv 中自带了 haar人脸特征分类器,通过读取一段视频来识别其中的人脸。 代码实现: # -*- coding: utf-8 -*- __author__ = "小柒" __blog__ = "https://blog.52itstyle.vip/" import cv2 import os # 保存好的视频检测人脸并截图 def CatchPICFromV0 268浏览会员免费
- 为了提高香烟在线生产的效率,提出了一种烟包封条缺陷检测方法,开发了基于图像识别技术的烟包封条缺陷检测系统.所开发系统首先对采集到的烟包图像进行中值滤波和边缘检测;然后对边缘图像进行Radon变换;进而通过检测烟包小标上特征直线的角度和位置来判断烟包小标的粘贴是否合格;最后用PLC控制将判别不合格的烟包剔除出香烟生产线.中烟公司某烟厂长周期的应用结果表明:该检测方法具有判别速度快、易于实现等优点,所开发的系统可行、有效.0 105浏览会员免费
- 针对类圆形目标图像识别方法的不足,以轧钢厂成捆棒材图像为实例,提出了不规则类圆形团块目标模式识别新方法,设计了边缘检测、中心增强和重心聚合等一系列算法,以实现计算机对类圆形目标图像的自动识别与检测。研究结果表明:以新算法为核心技术的软件能够对直径为12~40cm的棒材进行计数,点支准确的捆精度达到99%,且每捆计数时间少于3s。0 129浏览会员免费
- 工程技术大小:1MB在光学相关识别中,对相关输出结果进行后处理是保证图像识别准确性的关键之一。研 究者通常采用神经网络技术对相关输出结果进行处理,并取得了较好的效果,但它需要预先准备 大量的相关峰和噪声峰训练样本。根据极坐标变换能将笛卡尔坐标系下的旋转转变成平移的性质 以及傅里叶变换的平移不变性,提出一种基于傅里叶-极坐标变换的相关结果后处理方法。验证结 果表明:目标的旋转图像与目标自身的傅里叶-极坐标变换的相似度较大,而干扰图像与目标的傅 里叶-极坐标变换的相似度较小。本文的方法在后处理阶段可对目标和干扰进行有效的分类识别在光学相关识别中,对相关输出结果进行后处理是保证图像识别准确性的关键之一。研 究者通常采用神经网络技术对相关输出结果进行处理,并取得了较好的效果,但它需要预先准备 大量的相关峰和噪声峰训练样本。根据极坐标变换能将笛卡尔坐标系下的旋转转变成平移的性质 以及傅里叶变换的平移不变性,提出一种基于傅里叶-极坐标变换的相关结果后处理方法。验证结 果表明:目标的旋转图像与目标自身的傅里叶-极坐标变换的相似度较大,而干扰图像与目标的傅 里叶-极坐标变换的相似度较小。本文的方法在后处理阶段可对目标和干扰进行有效的分类识别0 196浏览会员免费
- 基于飞思卡尔MPC5604B智能平衡车的设计与实现,李晓强,,设计以MPC5604B为核心控制器的光电智能平衡车,该智能车以线性CCD作为路径识别装置,通过图像识别提取路径信息。并对飞思卡尔半导体�0 230浏览会员免费
- 构建了一个基于FPGA的图像存储与回放系统,该系统能够记录红外热像仪输出的数字视频信号,回放时以原格式输出,同时还输出标准PAL格式的电视信号。介绍系统硬件设计及FPGA内部各模块的逻辑功能,并论述设计中的几个关键点。0 84浏览会员免费
- 本文来自于oschina,文章介绍了卷积神经网络原理,基于dl4j定型一个卷积神经网络来进行手写数字识别等相关内容。最近一直在研究深度学习,联想起之前所学,感叹数学是一门朴素而神奇的科学。F=G*m1*m2/r2万有引力描述了宇宙星河运转的规律,E=mc2描述了恒星发光的奥秘,V=H*d哈勃定律描述了宇宙膨胀的奥秘,自然界的大部分现象和规律都可以用数学函数来描述,也就是可以求得一个函数。神经网络可以逼近任何连续的函数,那么神经网络就有无限的泛化能力。对于大部分分类问题而言,本质就是求得一个函数y=f(x),例如:对于图像识别而言就是求得一个以像素张量为自变量的函数y=F(像素张量),其中y=猫0 315浏览会员免费