- 鲁棒特征提取与行为识别,侯晏龙,李志刚,本文主要研究基于视频的行为识别技术。所论述的方法主要用于识别时空混合的视频数据中的人类行为活动,它不同于其他二维图像识别0 199浏览会员免费
- 板料成形极限试验一直是评价板料塑性成形性能的主要途径,而试验过程的标准化是影响板料成形极限试验的试验结果可比性与复现性的重要因素。笔者按ISO/WD 12004标准对板料成形极限试验的试样进行了加工,设置了试验参数。在试验过程中采用双目测量散斑的图像识别技术来进行应变测量及数据采集,并按ISO标准编制了计算机程序对应变数据进行了处理,将ISO标准的拟合算法与试验数据进行了验证分析。形成了一种能够实现在线测量、标准化处理的板料成形性能试验系统。0 43浏览会员免费
- JupyterNotebook大小:143MBSegumetationTask_of_RiceBlast [摘要]研究生院的研究主题是blast,我想使用图像识别技术提取受影响的区域。这次,使用语义分割(Segnet)提取受影响的区域,这是一种区域识别方法。 开发环境 Ubuntu 18.04.5 LTS Google Colabratory Tensorflow Ver2.3 如何使用 来自Github的克隆 将源代码从Github克隆到本地PC。 $ git clone git@github.com:K-out-A/SegumetationTask_of_RiceBlast.git 执行源文件 并上传文件夹(SegumetationTask_of_RiceBlast)。 打开test.ipynb并从顶部开始按顺序执行单元格。 执行结果 当您将图像加载到imgs文件夹中时,推理开始。 输出将分为黑色,绿色和红色。 背景,树SegumetationTask_of_RiceBlast [摘要]研究生院的研究主题是blast,我想使用图像识别技术提取受影响的区域。这次,使用语义分割(Segnet)提取受影响的区域,这是一种区域识别方法。 开发环境 Ubuntu 18.04.5 LTS Google Colabratory Tensorflow Ver2.3 如何使用 来自Github的克隆 将源代码从Github克隆到本地PC。 $ git clone git@github.com:K-out-A/SegumetationTask_of_RiceBlast.git 执行源文件 并上传文件夹(SegumetationTask_of_RiceBlast)。 打开test.ipynb并从顶部开始按顺序执行单元格。 执行结果 当您将图像加载到imgs文件夹中时,推理开始。 输出将分为黑色,绿色和红色。 背景,树0 37浏览会员免费
- ZIP大小:336MB饮料营销AR应用 一款饮料营销应用程序尝试使用最新的增强现实技术营销其新产品,从而为用户带来清新的空气。 它使用户可以可视化新产品,并在应用程序中阅读并与之交互。 ![替代文字] 测试 找到apk并使用给定的图像进行图像识别 使用的技术 Arcore,Unity 2019.4,Visual Studio,DoTween,Blender 原型说明 它是任何产品营销应用程序的原型。 它具有各种功能,例如 • 3D图像目标–单击咖啡馆顶部的咖啡模型时,它将要求提供图像,并在检测到该图像时,将在该图像目标的顶部放置一个3D模型。单击该模型将对其进行描述。 •平面检测中的3D对象–在检测平面时,如果在检测到的平面上单击任何位置,则会将3d模型放置在检测到的平面上。 •与3D对象的交互-可以根据用户需要旋转和缩放放置在场景中的所有3D模型。 用户可以用一根手指轻扫以旋转建筑物,然后用两根手指捏合饮料营销AR应用 一款饮料营销应用程序尝试使用最新的增强现实技术营销其新产品,从而为用户带来清新的空气。 它使用户可以可视化新产品,并在应用程序中阅读并与之交互。 ![替代文字] 测试 找到apk并使用给定的图像进行图像识别 使用的技术 Arcore,Unity 2019.4,Visual Studio,DoTween,Blender 原型说明 它是任何产品营销应用程序的原型。 它具有各种功能,例如 • 3D图像目标–单击咖啡馆顶部的咖啡模型时,它将要求提供图像,并在检测到该图像时,将在该图像目标的顶部放置一个3D模型。单击该模型将对其进行描述。 •平面检测中的3D对象–在检测平面时,如果在检测到的平面上单击任何位置,则会将3d模型放置在检测到的平面上。 •与3D对象的交互-可以根据用户需要旋转和缩放放置在场景中的所有3D模型。 用户可以用一根手指轻扫以旋转建筑物,然后用两根手指捏合0 60浏览会员免费
- 随着转炉冶炼过程的推进,炉口火焰图像在不同的冶炼阶段呈现较为明显的差别。根据火焰图像判断冶炼所处阶段的问题,其关键在于如何准确提取火焰的主要特征,提出了火焰边缘线不变矩特征,火焰图像Laws纹理能量特征,以及图像色彩特征,并研究了它们的变化过程。最后,利用广义回归神经网络(GRNN)建立图像特征和冶炼阶段之间的分类模型。实验结果表明,该方法能有效进行基于图像识别的转炉冶炼状态判断,具有较高的实用价值。0 96浏览会员免费
- 在数字图像识别条形码过程中,整形是很重要的环节。分析了EAN-13条码采集并二值化后图像的噪音特点,结合EAN-13条码的构造,从理论上研究了模块中值法。这是一种利用条形码的构造特点,降低二值化后图像噪音,并易于后续条形码识别的整形方法。0 35浏览会员免费
- pytorch大小:11KB移动设备的实时网络 谷歌 学习可扩展的体系结构以实现可扩展的图像识别 MnasNet:面向平台的神经体系结构搜索移动 MobileNets:用于移动视觉应用的高效卷积神经网络 MobileNetV2:残差和线性瓶颈 MorphNet:快速和简单的深度网络资源受限结构学习 搜索MobileNetV3 非官方实现 高效网络:卷积神经网络模型缩放的反思。 MixNet:混合深度卷积内核官方TF回购非官方pytporch EfficientNetV2:较小的型号和更快的培训arxiv2021 EfficientNetV2 微软研究院 深度神经网络IGCV的交错组卷积 IGCV2:交错结构的稀疏卷积神经网络IGCV2 IGCV3:高效的深度神经网络的交错低秩组卷积IGCV3 使用空间瓶颈模块arxiv2018加速深度神经网络 动态卷积:注意卷积内核arxiv2019 Faceb移动设备的实时网络 谷歌 学习可扩展的体系结构以实现可扩展的图像识别 MnasNet:面向平台的神经体系结构搜索移动 MobileNets:用于移动视觉应用的高效卷积神经网络 MobileNetV2:残差和线性瓶颈 MorphNet:快速和简单的深度网络资源受限结构学习 搜索MobileNetV3 非官方实现 高效网络:卷积神经网络模型缩放的反思。 MixNet:混合深度卷积内核官方TF回购非官方pytporch EfficientNetV2:较小的型号和更快的培训arxiv2021 EfficientNetV2 微软研究院 深度神经网络IGCV的交错组卷积 IGCV2:交错结构的稀疏卷积神经网络IGCV2 IGCV3:高效的深度神经网络的交错低秩组卷积IGCV3 使用空间瓶颈模块arxiv2018加速深度神经网络 动态卷积:注意卷积内核arxiv2019 Faceb0 71浏览会员免费
- 基于概率神经网络的人脸图像识别,倪洽凯,杨静,本文介绍了概率神经网络的算法原理及其在人脸图像识别的应用。人脸图像经过小波分解和离散余弦变换后,将提取的图像特征值分别送0 61浏览会员免费
- 针对冷轧带钢表面缺陷图像模式识别中存在的问题,提出了基于改进支持向量机的冷轧带钢典型表面缺陷分类识别方法。根据带钢表面缺陷图像识别的特点,对渐进直推式支持向量机在其基本原理基础上加以改进,设计了一种冷轧带钢表面缺陷图像模式识别的分类器。通过实验确定了分类器的结构,给出了相关参数选择的方法。对几种生产现场出现频率较高的典型缺陷图像进行了计算机实验研究。研究结果显示,这种分类器很好地克服了传统支持向量机中存在的推广性能差以及当类别距离过近时准确率下降的问题,具有更好的适应性和准确性。0 66浏览会员免费
- Swift大小:557KBAI工具箱 用Swift编写的AI模块工具箱:图形/树,线性回归,支持向量机,神经网络,PCA,KMeans,遗传算法,MDP,高斯混合,逻辑回归 除Linux软件包版本外,此框架使用Accelerate库来加快计算速度。 为Swift 3.0编写。 早期版本与Swift 2.2兼容 从公共域LIBSVM存储库移植的SVM请参阅了解更多信息 金属神经网络将金属框架用于使用GPU的神经网络。 尽管可以在初步测试中使用,但该类可以做更多的工作 使用XCTest文件获取有关如何使用类的示例 提供线性回归,SVM和神经网络的游乐场。 现在可在macOS和iOS版本中使用。 ### New-卷积程序对于深度网络类,请查看使用AIToolbox库进行图像识别的项目。 新的Swift软件包-与Mac和Linux兼容! 该软件包是完整框架的子集。 需要GCD或LAPACK的类尚未移植。 我正在研究有关AI工具箱 用Swift编写的AI模块工具箱:图形/树,线性回归,支持向量机,神经网络,PCA,KMeans,遗传算法,MDP,高斯混合,逻辑回归 除Linux软件包版本外,此框架使用Accelerate库来加快计算速度。 为Swift 3.0编写。 早期版本与Swift 2.2兼容 从公共域LIBSVM存储库移植的SVM请参阅了解更多信息 金属神经网络将金属框架用于使用GPU的神经网络。 尽管可以在初步测试中使用,但该类可以做更多的工作 使用XCTest文件获取有关如何使用类的示例 提供线性回归,SVM和神经网络的游乐场。 现在可在macOS和iOS版本中使用。 ### New-卷积程序对于深度网络类,请查看使用AIToolbox库进行图像识别的项目。 新的Swift软件包-与Mac和Linux兼容! 该软件包是完整框架的子集。 需要GCD或LAPACK的类尚未移植。 我正在研究有关0 73浏览会员免费
- 受监督的与数据相关的内核稀疏性保留投影,用于图像识别0 26浏览会员免费
- 针对复杂背景下弱小目标识别困难,实时性要求高等难题,提出了弱小目标分割算子;并引入特征匹配,设计了二者相融合的自动图像识别机制。该方案基于H-S分割与图像融合,再结合形态学滤波与特征匹配,解决弱小目标难识别的问题。该方案计算量小并基于经过汇编优化的OpenCV实现,解决实时性要求高等难题。实验结果表明,相对于传统方法,该方案应用在自动图像识别上可以达到较好的效果,在工程上应用是可行的。0 187浏览免费
- 图像显著性检测是一种通过对图像颜色、强度、方向等特征进行分析生成图像显著性图的技术。其生成的显著性图可以用于图像分割、图像压缩以及图像识别等图像处理领域,从而改善图像处理的性能。为了对图像显著性检测技术及其发展有一个全面深入的了解,使用文献研究法和比较研究法对其概念及方法进行了探究。针对几种具有代表性的图像显著性检测算法进行了简要的概述和分析,用流程图简明扼要地表示显著性检测算法的基本框架。研究结果显示,图像显著性检测技术的效率在不断提升,算法越来越多样化,在图像处理领域的应用越来越广泛,这些对于图像处理0 75浏览会员免费
- 随着机器学习热度的增加和其中“中国力量”的逐渐强大,在各大顶级会议上有越来越多的中国组织排名靠前,大有争夺头把交椅的势头。 比如,本次ICML,清华大学有 12 篇论文被收录;华裔作者的数量也令人惊讶,如佐治亚理工学院终身副教授、机器学习中心副主任宋乐署名的就有8篇论文。 而宋乐教授的另外一个身份,就是蚂蚁金服人工智能部研究员。 蚂蚁金服成为ICML 上“中国力量”的代表之一,为大会奉献了8篇论文。其中,六篇含金量十足的Oral Paper,成为议程上研讨会的主角,接受与会专家的热烈讨论。 这些论文几乎每篇署名作者都有世界级学术专家。比如人工智能教父,蚂蚁金服科学智囊团主席迈克尔·欧文·乔丹 (Michael I. Jordan),以及上面提到的佐治亚理工学院机器学习中心副主任,在蚂蚁金服人工智能部担任研究员的宋乐教授等。 不仅如此,蚂蚁金服还在本届大会上展示了多项核心技术和产品:基于强大的深度学习能力开发的定损宝、自研的图结构处理Graph Embedding 技术,以及基于图像处理和自然语言理解技术开发的智能客服等。特别是定损宝,将图像识别技术和车险领域首次结合,每年有望为中国保险公司节约数十亿元人民币成本,备受参与ICML 2018 的业界人士关注。 和顶级学术界人才深度合作,凸显蚂蚁金服在机器学习方面的能力,而将学术成就快速转化为商业级产品更是证明了蚂蚁金服的的决心——人才的吸引力和学术商用的两手并重,让首次参会的蚂蚁金服就成为了这场顶级学术会议上的耀眼新星。 本下载是第七篇论文——《W1-Feature Propagation on Graph- A New Perspective to Graph Representation Learning》0 115浏览会员免费
- 条烟图像识别系统中的预处理,曾弈,时良平,条烟图像识别系统是用于在条烟分拣过程中,对包装好的整条条烟的品牌、种类进行识别,通过计算机完成自动复查功能,提高条烟分拣0 63浏览会员免费
- 采用联合动态稀疏表示方法构造一种新型的多图像人脸识别模型。该模型在多张人脸图像的稀疏表示矩阵上,利用动态数集得到联合动态稀疏表示矩阵,识别多图像的人脸。在多张人脸图像作为测试样本的情况下,利用多图像之间的关联性提高人脸图像识别的准确率。最后利用CMU人脸图像库对该算法进行仿真,结果表明其识别率较其他算法有很大的提高。0 35浏览会员免费
- machine-learning大小:60KB由于描述的一些实现错误(非常感谢@pminervini),我论文中先前对Cora,Citeseer和Pubmed的评分是错误的。 我将尽快更正那些内容。 记忆相关的差异学习 记忆相关的差分学习(MAD学习)学习数据之间的差分功能,而不是从输入到输出的映射。 它是一种灵活的学习范例,可以应用于一元情况(图像识别),二元情况(链接预测)和三元情况(知识图)。 目前,MAD Learning在上取得了竞争。 重现性 平日预测挑战 运行以下命令以在工作日预测挑战中尝试MAD学习 python3 weekday.py 您可以从第116行到第126行编辑weekday.py文件,以修改MAD Learning的超参数或使用MLP进行此实验。 图像识别 python3 cifar_mnist.py cifar10 conv 第三和第四参数是数据集和方法。 可用数据集:cifar10 / ci由于描述的一些实现错误(非常感谢@pminervini),我论文中先前对Cora,Citeseer和Pubmed的评分是错误的。 我将尽快更正那些内容。 记忆相关的差异学习 记忆相关的差分学习(MAD学习)学习数据之间的差分功能,而不是从输入到输出的映射。 它是一种灵活的学习范例,可以应用于一元情况(图像识别),二元情况(链接预测)和三元情况(知识图)。 目前,MAD Learning在上取得了竞争。 重现性 平日预测挑战 运行以下命令以在工作日预测挑战中尝试MAD学习 python3 weekday.py 您可以从第116行到第126行编辑weekday.py文件,以修改MAD Learning的超参数或使用MLP进行此实验。 图像识别 python3 cifar_mnist.py cifar10 conv 第三和第四参数是数据集和方法。 可用数据集:cifar10 / ci0 40浏览会员免费
- ZIP大小:75KBHippocrates, 真正有用的实现 分支 Linux Windows母版 开发 可视化工具由 @Mafii实验图像识别目前正在 https://github.com/IDPA16/Hippocrates 添加。miHippocrates, 真正有用的实现 分支 Linux Windows母版 开发 可视化工具由 @Mafii实验图像识别目前正在 https://github.com/IDPA16/Hippocrates 添加。mi0 61浏览会员免费
- 在多方向二维主成分分析法MD2DPCA和无迭代双边二维主成分分析(NIB2DPCA)的基础上,提出了多方向无迭代双边二维主成分分析(MDNIB2DPCA)的特征抽取新方法。该方法可以对图像矩阵在多个方向上进行特征抽取,与MD2DPCA方法相比也提高了特征抽取速度。在灰度人脸图像库上的对比实验表明,所提的方法可以提高灰度图像识别率两个百分点以上;进一步地,在基于NIB2DPCA的彩色图像识别方法的基础上,提出了将所提的MDNIB2DPCA替换NIB2DPCA的彩色图像处理的新方法。在彩色人脸库上的对比实验表明,所提方法的识别正确率也可提高约一个百分点。0 95浏览免费
- 机器学习 (ML) 和人工智能 (AI) 已经存在多年。 然而,在过去的 5 年中,使用多层神经网络在图像识别、语音识别和机器翻译等不同领域取得了显着进展。 人工智能是一种通用技术,可能会影响许多行业。 在本章中,我将考虑机器学习的可用性如何影响提供 AI 服务的公司和采用 AI 技术的行业的行业组织。 我的目的不是提供这个快速发展领域的广泛概述,而是提供一些起作用的力量的简短摘要,并描述一些可能的未来研究领域。0 56浏览会员免费
- 为了防止机器人频繁登陆网站或者破坏分子恶意登陆,很多用户登录和注册系统都提供了图形验证码功能。 验证码(CAPTCHA)是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。可以防止恶意破解密码、刷票、论坛灌水,有效防止某个黑客对某一个特定注册用户用特定程序暴力破解方式进行不断的登陆尝试。 图形验证码的历史比较悠久,到现在已经有点英雄末路的味道了。因为机器学习、图像识别的存在,机器人已经可以比较正确0 114浏览会员免费
- Python大小:51MB使用AI的非侵入式考勤系统 我们今年暑期实习的项目属于IoT(物联网)研究领域。 最初,指导者要求我们找到现实生活中的问题,我们将尝试使用信息技术工具来解决这些问题。 我们被允许以三人一组的形式进行讨论和工作。 我们选择了一个设计出勤监控系统的问题,该系统可以使用图像识别以非侵入性的方式标记学生在大房间中的存在,例如礼堂或我们大学的演讲厅。 我们的项目分为两个阶段,将在随后的段落中进行说明。 第一阶段涉及通过各种真实的研究论文和现有的库对工具和技术进行文献调查,这将使我们能够为项目设计后端结构。 然后,我们开发了一个流程图,该流程图由过程的两个模块组成,程序将通过这些模块。 第一个模块涉及通过使用特定人的各种图像对分类器进行训练来对基于机器学习的分类器进行初始训练。 第二个模块涉及真实环境中的测试部分,其中涉及面部检测和面部识别。 摄像机将拍摄现场观众的帧/图像。 然后,将对这些帧进行预处使用AI的非侵入式考勤系统 我们今年暑期实习的项目属于IoT(物联网)研究领域。 最初,指导者要求我们找到现实生活中的问题,我们将尝试使用信息技术工具来解决这些问题。 我们被允许以三人一组的形式进行讨论和工作。 我们选择了一个设计出勤监控系统的问题,该系统可以使用图像识别以非侵入性的方式标记学生在大房间中的存在,例如礼堂或我们大学的演讲厅。 我们的项目分为两个阶段,将在随后的段落中进行说明。 第一阶段涉及通过各种真实的研究论文和现有的库对工具和技术进行文献调查,这将使我们能够为项目设计后端结构。 然后,我们开发了一个流程图,该流程图由过程的两个模块组成,程序将通过这些模块。 第一个模块涉及通过使用特定人的各种图像对分类器进行训练来对基于机器学习的分类器进行初始训练。 第二个模块涉及真实环境中的测试部分,其中涉及面部检测和面部识别。 摄像机将拍摄现场观众的帧/图像。 然后,将对这些帧进行预处0 49浏览会员免费
- ZIP大小:103MBAR常见问题解答 要运行该项目,请导航至HackathonGenysisAR / Assets / Scenes / MainScene.unity 为了训练我们的知识库,我们在machainelearning支持的语音到文本转换中总共使用了56个文档。 使用户可以在网络连接下将语音实时转换为文本。 它可以识别120种语言,但是免费试用只能得到一种。 语音到文本也随文本到语音一起出现。 因此,当您享受AR时,您仍然会捕获信息。 在增强现实领域中也将Vuforia API用作图像识别。 结果是您的问题的答案被大声读出,并输出相应的视频或3d图像。AR常见问题解答 要运行该项目,请导航至HackathonGenysisAR / Assets / Scenes / MainScene.unity 为了训练我们的知识库,我们在machainelearning支持的语音到文本转换中总共使用了56个文档。 使用户可以在网络连接下将语音实时转换为文本。 它可以识别120种语言,但是免费试用只能得到一种。 语音到文本也随文本到语音一起出现。 因此,当您享受AR时,您仍然会捕获信息。 在增强现实领域中也将Vuforia API用作图像识别。 结果是您的问题的答案被大声读出,并输出相应的视频或3d图像。0 75浏览会员免费
- 提出了一种新型的图像分类识别方法,该方法不依赖于对图像内容文字信息的提取,而是直接采用图像的颜色信息和图形边缘特征来构造用于图像模式分类的统计模型。通过在公开数据集上的实验结果表明,提出的模型对图像型垃圾邮件具有良好的分类能力,分类性能优于现有相关方法。由于该方法对图像型垃圾邮件的分类准确率高,且不受图像文字识别干扰技术的影响,具有良好的应用前景。0 90浏览会员免费
- 引入差异演化(DE)算法来弥补基本概率神经网络的不足,从而提出一种基于差异演化概率神经网络的纹理图像识别方法。首先用树形结构小波包变换提取纹理图像的能量特征,用基于统计的纹理特征方法提取统计均值、平均能量、标准差和平均残余特征,得到纹理图像的特征矢量;然后用差异演化概率神经网络训练纹理图像的特征矢量,从而实现纹理图像的识别。实验结果表明:该方法较BP神经网络、RBF神经网络和基本的PNN有更高的识别正确率,且收敛更快。0 120浏览会员免费
- Python大小:218KB<在此处包括CircleCI状态徽章> 项目概况 在本项目中,您将应用在本课程中获得的技能来操作机器学习微服务API。 您将获得一个经过预先训练的sklearn模型, sklearn模型已经过训练,可以根据一些功能来预测波士顿的房价,例如房屋中的平均房间和有关高速公路通行性的数据,师生比例等等。 您可以上阅读有关数据的更多信息,这些数据最初来自Kaggle。 此项目测试您在提供的文件app.py中运行Python flask应用程序的能力,该文件可通过API调用提供有关房价的预测(推断)。 该项目可以扩展到任何预先训练的机器学习模型,例如用于图像识别和数据标记的模型。 项目任务 您的项目目标是使用来运行此工作的机器学习微服务,这是一个用于自动化容器化应用程序管理的开源系统。 在此项目中,您将: 使用linting测试您的项目代码 完成一个Dockerfile来容器化此应用程序 使用Do<在此处包括CircleCI状态徽章> 项目概况 在本项目中,您将应用在本课程中获得的技能来操作机器学习微服务API。 您将获得一个经过预先训练的sklearn模型, sklearn模型已经过训练,可以根据一些功能来预测波士顿的房价,例如房屋中的平均房间和有关高速公路通行性的数据,师生比例等等。 您可以上阅读有关数据的更多信息,这些数据最初来自Kaggle。 此项目测试您在提供的文件app.py中运行Python flask应用程序的能力,该文件可通过API调用提供有关房价的预测(推断)。 该项目可以扩展到任何预先训练的机器学习模型,例如用于图像识别和数据标记的模型。 项目任务 您的项目目标是使用来运行此工作的机器学习微服务,这是一个用于自动化容器化应用程序管理的开源系统。 在此项目中,您将: 使用linting测试您的项目代码 完成一个Dockerfile来容器化此应用程序 使用Do0 62浏览会员免费
- 主要为大家详细介绍了JavaSE图像验证码简单识别程序,具有一定的参考价值,感兴趣的小伙伴们可以参考一下0 54浏览会员免费
- Python大小:2KB面部识别 Python中的面部识别。 训练特定的图像,然后可以从更多图像或实时网络摄像头中识别人脸。 使用OpenCV。 用法 所有代码都应放在__main__ : 首先,定义一个FaceRecogition实例,并清除当前训练过的面Kong: fr = FaceRecogition() fr.clear_faces() 火车脸 fr.train_face('[PATH_TO_IMAGE]', { "name": "[NAME_OF_FACE]" }) 通过图像识别脸 print(fr.recognize_faces('[PATH_TO_IMAGE]')) 通过实时网络摄像头识别人脸 fr.webcam() 跑步 在项目目录的根目录中: $ python3 face_rec.py面部识别 Python中的面部识别。 训练特定的图像,然后可以从更多图像或实时网络摄像头中识别人脸。 使用OpenCV。 用法 所有代码都应放在__main__ : 首先,定义一个FaceRecogition实例,并清除当前训练过的面Kong: fr = FaceRecogition() fr.clear_faces() 火车脸 fr.train_face('[PATH_TO_IMAGE]', { "name": "[NAME_OF_FACE]" }) 通过图像识别脸 print(fr.recognize_faces('[PATH_TO_IMAGE]')) 通过实时网络摄像头识别人脸 fr.webcam() 跑步 在项目目录的根目录中: $ python3 face_rec.py0 58浏览会员免费
- JavaScript大小:216KB认可度 它是基于ReactJS并使用ECMA6的图像识别对象的应用程序 识别: build-包含build.js文件,该文件包含在html页面上 src 应用-包含源js文件 www-包含html和演示数据文件 跑步: 1)git clone https://github.com/Ghbnxby/recognict 2)npm start 3)open http://localhost:3000认可度 它是基于ReactJS并使用ECMA6的图像识别对象的应用程序 识别: build-包含build.js文件,该文件包含在html页面上 src 应用-包含源js文件 www-包含html和演示数据文件 跑步: 1)git clone https://github.com/Ghbnxby/recognict 2)npm start 3)open http://localhost:30000 15浏览会员免费
- 嵌入式汽车纵向碰撞预警系统研究,在嵌入式硬件平台上采用Linux操作系统研究了防止汽车碰撞的预警算法。在车辆的图像识别基础上,利用透视投影变换原理实现本车与前车的间距测量,依据图像序列帧与本车速度信息确定前车的行驶状态,基于前车状态确定安全系数权重,建立汽车纵向碰撞预警模型。车辆行驶实验表明,纵向碰撞预譬模型能够对处于最小安全车距的汽车给以准确预警,并使其计算的最小安全车距符合驾驶员的习惯车距。0 62浏览会员免费
- 实现了静态图像压缩标准-JPEG算法在TMS320C6711DSP上的移植,采用了软件流水,内联函数等代码优化措施,实现了基本的数据压缩。使用了DSP外设接口HPI与PC机进行数据交换,在保证图像质量的前提下,获得了较高的压缩比。0 86浏览会员免费
- 扩展程序大小:1MB语言:English (United States) 识别并阻止色情和挑逗性图像。 通过报告图像来帮助我们更好地检测色情。 通过标记实际上不是色情的图像来帮助我们改善自动色情检测功能,以便我们将其做得更好! 注意:此工具并非旨在用作家长控制或责任制软件。 在Chrome中很容易禁用它。 目标是收集图像以改进现有技术,以便可靠的色情检测可以在所有设备上实时工作。 **为什么我们要创建此** **具有计算机视觉的色情检测是一个困难的问题,其成功水平各不相同。 如今,最好的色情侦查技术非常擅长正确识别色情内容,但也可以将许多图像识别为假阳性。 这可以归因于用于训练的数据集。 可以很容易地抓取色情图片的网站,并训练分类器正确地将那些图像识别为色情内容,并带有用于确保分类器在图像中找到特定特征的控制图像样本。 在色情的情况下,假设特定的身体部位将是确定图像是否为色情的特征。 问题是,如果控制图像选择不当,功能实际上可能太宽泛,无法将图像归类为甚至没有密切关系的色情。 例如,NSFW移动分类器当前将一些火箭和香蕉的图像分类为色情。 一个合理的观察者可以推测为什么会这样。 我们假设还有大量其他类型的语言:English (United States) 识别并阻止色情和挑逗性图像。 通过报告图像来帮助我们更好地检测色情。 通过标记实际上不是色情的图像来帮助我们改善自动色情检测功能,以便我们将其做得更好! 注意:此工具并非旨在用作家长控制或责任制软件。 在Chrome中很容易禁用它。 目标是收集图像以改进现有技术,以便可靠的色情检测可以在所有设备上实时工作。 **为什么我们要创建此** **具有计算机视觉的色情检测是一个困难的问题,其成功水平各不相同。 如今,最好的色情侦查技术非常擅长正确识别色情内容,但也可以将许多图像识别为假阳性。 这可以归因于用于训练的数据集。 可以很容易地抓取色情图片的网站,并训练分类器正确地将那些图像识别为色情内容,并带有用于确保分类器在图像中找到特定特征的控制图像样本。 在色情的情况下,假设特定的身体部位将是确定图像是否为色情的特征。 问题是,如果控制图像选择不当,功能实际上可能太宽泛,无法将图像归类为甚至没有密切关系的色情。 例如,NSFW移动分类器当前将一些火箭和香蕉的图像分类为色情。 一个合理的观察者可以推测为什么会这样。 我们假设还有大量其他类型的0 25浏览会员免费
- 主要为大家详细介绍了C#图像识别,微信跳一跳机器人,具有一定的参考价值,感兴趣的小伙伴们可以参考一下0 69浏览会员免费
- Java大小:15MB机器学习图像识别 对于./gradlew fetchInceptionFrozenModel bootrun使用Tensorflow前提条件提供Web服务进行图像识别的用户:运行./gradlew fetchInceptionFrozenModel bootrun ,导航至并上传图像。 后端将对图像进行分类,并将结果与概率一起输出。 为什么 Tensorflow很难缠住他的头。 它有几个部分,涉及准备数据,定义和训练模型,最后输出模型,然后将其用于分类(推断)其他数据。 其中涉及数学,需要学习新词汇,最重要的是,一个围绕Python的工具链。 该项目仅解决为Tensorflow预训练图像分类模型提供服务的问题,否则称为Inception模型。 先决条件 JDK 8 跑步 ./gradlew fetchInceptionFrozenModel bootrun 导航到并上传图像。 后端将机器学习图像识别 对于./gradlew fetchInceptionFrozenModel bootrun使用Tensorflow前提条件提供Web服务进行图像识别的用户:运行./gradlew fetchInceptionFrozenModel bootrun ,导航至并上传图像。 后端将对图像进行分类,并将结果与概率一起输出。 为什么 Tensorflow很难缠住他的头。 它有几个部分,涉及准备数据,定义和训练模型,最后输出模型,然后将其用于分类(推断)其他数据。 其中涉及数学,需要学习新词汇,最重要的是,一个围绕Python的工具链。 该项目仅解决为Tensorflow预训练图像分类模型提供服务的问题,否则称为Inception模型。 先决条件 JDK 8 跑步 ./gradlew fetchInceptionFrozenModel bootrun 导航到并上传图像。 后端将0 37浏览会员免费
- JavaScript大小:92KB使用Tensorflow进行Radanalytics图像识别 生成并运行应用程序 安装所有python依赖项 pip install -r requirements.txt 安装并构建所有js依赖项 npm install npm run build 启动应用 python server.py 现在可以从0.0.0.0:8081访问0.0.0.0:8081 开发与测试 发生前端文件更改时重建Webpack npm run dev 依存关系 其余的api将结果存储在jdg缓存中。 您将需要docker运行。 要运行JDG,您需要执行以下操作: ./run-jdg-docker.sh 要运行图像识别应用程序: docker run -p 8081:8081 docker.io/zmhassan/tensorflow-image-recognition 要在openshift使用Tensorflow进行Radanalytics图像识别 生成并运行应用程序 安装所有python依赖项 pip install -r requirements.txt 安装并构建所有js依赖项 npm install npm run build 启动应用 python server.py 现在可以从0.0.0.0:8081访问0.0.0.0:8081 开发与测试 发生前端文件更改时重建Webpack npm run dev 依存关系 其余的api将结果存储在jdg缓存中。 您将需要docker运行。 要运行JDG,您需要执行以下操作: ./run-jdg-docker.sh 要运行图像识别应用程序: docker run -p 8081:8081 docker.io/zmhassan/tensorflow-image-recognition 要在openshift0 53浏览会员免费
- 针对智能身份管理系统中的指纹图像识别问题,提出了一种在形状上下文特征提取算法的前提下,基于多种现有度量算法相结合的联合度量策略的图像识别机制。首先,描述了基于形状上下文的指纹图像的特征提取过程;其次,在分析现行图像识别方法的基础上,提出了基于经典的欧式距离度量算法和TPS薄板样条法进行的联合度量策略的总体思路;而后讨论了基于联合度量策略机制的识别算法在图像识别中的可行性及识别精度,其识别率达到87.5%,并具备较高的稳定性;最后,将该算法应用在实际的指纹图像的识别系统中,指纹图像识别率达到82.5%,实验结果表明所提出的方法是有效的。0 101浏览会员免费
- 针对主流指纹识别算法对缺失指纹图像识别率非常低的问题,提出了一种地统计关联特征与多子集匹配的算法(GS-MS)。首先对指纹图像进行Gabor滤波增强以及二值化、细化预处理,然后将图像均匀划分为N个子集,分别提取各子集的地统计学关联特征与分叉点、端点等细节特征点,最后以待识别指纹图像子集为基准,与指纹库子集进行匹配识别。采用完整与缺失两种指纹数据集进行测试,GS-MS算法均取得了较优的识别精度,而且没有大幅度增加运行时间。0 140浏览会员免费
- Java大小:46KB奇怪的是,它不是那样工作的,您尝试这样做,陷入困境,寻求帮助。 我们会尽力提供帮助。如果您需要代码,则必须在其他地方提出要求,并支付特权。 尝试使用vWorker(用于rentacoder),但要知道您所支付的费用是:支付花生,获取猴子。奇怪的是,它不是那样工作的,您尝试这样做,陷入困境,寻求帮助。 我们会尽力提供帮助。如果您需要代码,则必须在其他地方提出要求,并支付特权。 尝试使用vWorker(用于rentacoder),但要知道您所支付的费用是:支付花生,获取猴子。0 29浏览会员免费
- Java大小:328KB牙齿推车 我们正在进行一次奇怪的冒险! 重返计算机视觉世界! 这次,采用专为机器人眼睛和图像识别设计的算法。牙齿推车 我们正在进行一次奇怪的冒险! 重返计算机视觉世界! 这次,采用专为机器人眼睛和图像识别设计的算法。0 40浏览会员免费
- nodejs大小:2MB图像识别即服务 网站预览 问题描述 :clipboard: :high_voltage: 该项目旨在构建一个弹性的Web应用程序,该应用程序可以通过使用云资源按需且经济高效地自动扩展和扩展。 :high_voltage: 使用的资源来自Amazon Web Services。 它是一种图像识别应用程序,作为Rest Service公开给客户端访问。 :high_voltage: 该应用程序拍摄图像并通过使用AWS资源进行计算,运输和存储来通过深度学习模型返回预测的输出。 因此,这些任务涉及设计体系结构,实现RESTful Web服务,一个负载均衡器,该负载均衡器根据用户的需求在App Tier上扩展和扩展EC2实例。 贡献 :light_bulb: 步骤1 选项1 :fork_and_knife: 分叉这个仓库! 选项2 :people_with_bunny_ears: 将此仓库克隆到本地计算机。 第2步 建立你的代码 :hammer: :hammer: :hammer: 第三步 :clockwise_vertical_arrows: 创建一个新的请求请求。 团队图像识别即服务 网站预览 问题描述 :clipboard: :high_voltage: 该项目旨在构建一个弹性的Web应用程序,该应用程序可以通过使用云资源按需且经济高效地自动扩展和扩展。 :high_voltage: 使用的资源来自Amazon Web Services。 它是一种图像识别应用程序,作为Rest Service公开给客户端访问。 :high_voltage: 该应用程序拍摄图像并通过使用AWS资源进行计算,运输和存储来通过深度学习模型返回预测的输出。 因此,这些任务涉及设计体系结构,实现RESTful Web服务,一个负载均衡器,该负载均衡器根据用户的需求在App Tier上扩展和扩展EC2实例。 贡献 :light_bulb: 步骤1 选项1 :fork_and_knife: 分叉这个仓库! 选项2 :people_with_bunny_ears: 将此仓库克隆到本地计算机。 第2步 建立你的代码 :hammer: :hammer: :hammer: 第三步 :clockwise_vertical_arrows: 创建一个新的请求请求。 团队0 79浏览会员免费
- 系统开源大小:125MB颜色分类leetcode 嘿沃尔多 该存储库包含用于分类和图像识别问题的 Where's Waldo 拼图的标记图像,我精心手工标记了这些图像。 与标记图像一起是 19 个原始图像,以及用于创建较小标记图像的 Python 脚本。 标记图像的彩色、灰度和黑色或白色版本作为数据集的一部分。 图像格式 256 x 256 像素(317 张图像) 128 x 128 像素(1344 幅图像) 64 x 64 像素(5376 张图像) 讨论 我决定将图像标记为包含 Waldo,而不管 Waldo 在图像中的位置。 因此,有些被标记为 Waldo 的图像严格来说并不是谜题的一部分。 Waldo 长相相似的人,例如那些具有不同发型或眼镜的人,也被标记为 Waldo。 这只是由于我决定解决问题的方式,因此请根据您的需要和解释随意重新标记图像。 由于 Waldo 的可变大小(缩放问题)、重复模式(其他物体上出现红色/白色条纹)、遮挡(Waldo 经常被其他人或物体挡住)以及图像的性质,对这些图像进行分类是一个难题。数据,这是不平衡的(大多数图像不包含 Waldo)。 这是一个艰难但有趣的应用程序,我邀颜色分类leetcode 嘿沃尔多 该存储库包含用于分类和图像识别问题的 Where's Waldo 拼图的标记图像,我精心手工标记了这些图像。 与标记图像一起是 19 个原始图像,以及用于创建较小标记图像的 Python 脚本。 标记图像的彩色、灰度和黑色或白色版本作为数据集的一部分。 图像格式 256 x 256 像素(317 张图像) 128 x 128 像素(1344 幅图像) 64 x 64 像素(5376 张图像) 讨论 我决定将图像标记为包含 Waldo,而不管 Waldo 在图像中的位置。 因此,有些被标记为 Waldo 的图像严格来说并不是谜题的一部分。 Waldo 长相相似的人,例如那些具有不同发型或眼镜的人,也被标记为 Waldo。 这只是由于我决定解决问题的方式,因此请根据您的需要和解释随意重新标记图像。 由于 Waldo 的可变大小(缩放问题)、重复模式(其他物体上出现红色/白色条纹)、遮挡(Waldo 经常被其他人或物体挡住)以及图像的性质,对这些图像进行分类是一个难题。数据,这是不平衡的(大多数图像不包含 Waldo)。 这是一个艰难但有趣的应用程序,我邀0 125浏览会员免费
- 传统色情视频识别方法大多是色情图像识别方法的直接扩展,没有考虑到“行为”这一包含在色情视频中的关键信息。光流上下文直方图能描述运动物体的连续动作,基于此,提出了一种新的用于描述行为的特征——光流上下文直方图(OFCH),并采用主成分分析(PCA)进行特征降维,得到的PCA-OFCH特征用于训练敏感行为识别器;同时采用基于直方图技术的贝叶斯肤色预测模型对视频中是否含有足够的肤色信息进行判断,以降低对正常行为的误报率。实验结果表明,提出的基于PCA-OFCH特征结合肤色检测能有效地对色情视频和正常视频进行鉴别,为色情视频识别提供了新的思路。0 58浏览会员免费
- .net源码大小:976KB一、源码描述 这是一款比较经典的连连看游戏源码,规则比较简单,将相同的两张牌用三根以内的直线连在一起就可以消除, 全部消除完成即为胜利。整个源码还算完整,所有的图片和音效文件都在Images和Sounds目录下面并且游戏启动 时会有相应的加载动画,并且点击相同的图像以后还会有一个爆炸消除的效果,感兴趣的朋友可以下载试玩下哦。 二、玩法介绍 该源码主要通过鼠标点击图标,在规定的时间内消除所有的图标就可以过关。 三、游戏特点 本源码实现了随机重排和背景以及点击音效。总共有初级、中级和高级三个难度可以设置, 不同的等级主要是背景不同,高级模式下有三层背景能够对玩家图像识别进行干扰。 四、注意事项 1、开发环境为Visual Studio 2010,无数据库,使用.net 2.0开发。 2、该源码比较适合新手学习交流使用。一、源码描述 这是一款比较经典的连连看游戏源码,规则比较简单,将相同的两张牌用三根以内的直线连在一起就可以消除, 全部消除完成即为胜利。整个源码还算完整,所有的图片和音效文件都在Images和Sounds目录下面并且游戏启动 时会有相应的加载动画,并且点击相同的图像以后还会有一个爆炸消除的效果,感兴趣的朋友可以下载试玩下哦。 二、玩法介绍 该源码主要通过鼠标点击图标,在规定的时间内消除所有的图标就可以过关。 三、游戏特点 本源码实现了随机重排和背景以及点击音效。总共有初级、中级和高级三个难度可以设置, 不同的等级主要是背景不同,高级模式下有三层背景能够对玩家图像识别进行干扰。 四、注意事项 1、开发环境为Visual Studio 2010,无数据库,使用.net 2.0开发。 2、该源码比较适合新手学习交流使用。0 19浏览会员免费
- 我一直对人工智能识别技术非常感兴趣,因为我无法想象这究竟是一种什么样的算法,什么样的分析过程。无论是声音识别、人脸识别或其它种识别,人们的外貌、说话的方式都是如此不同,一种图片你可以用不同的方式、从不同的角度拍摄,我不能理解这些识别技术是如何做到的。有个叫做“面具”的游戏也使用了这种识别技术,我想对于脸部识别技术也应该研究一下。Facebook使用了这种技术,在手势控制中也能用到它,所以,你网站上也会有应用的地方。 我找到的一个可以用于人脸识别的JavaScript程序包是Face Detection,它是由Jay Salvat和Liu Liu开发的。它是一个标准的jQuery插件,通过对提供0 226浏览会员免费
- 当前人工智能在管理和组织研究中的理论和研究的扩展使组织决策的理论和研究重新焕发活力。 特别是,深度学习 (DL) 算法的最新进展有望为组织内的决策带来好处,例如帮助员工进行信息处理,从而增强他们的分析能力,并可能帮助他们过渡到更具创造性的工作。 我们将使用 DL 算法结果(例如来自非结构化数据的预测或稳健模式)增强的组织中的决策过程概念化为深度学习增强决策 (DLADM)。 我们通过 (a) 提供有关 DL 算法的可访问教程和 (b) 用两个案例研究说明 DLADM,这些案例研究借鉴了在 Zalando 的数据集上执行的图像识别和情感分析任务,从而有助于理解和应用 DL 在组织中进行决策,分别是欧洲电子商务公司和电影评论聚合网站烂番茄。 最后,还讨论了 DLADM 的前景和挑战,以及对管理人员应对这些挑战的建议。0 69浏览会员免费
- 开源软件大小:2MBDFK:重复文件杀手将在用户指定的目录/驱动器中搜索任何类型的重复文件。 它将最终利用图像识别进行图像比较,将音频匹配算法用于声音文件匹配以及CRC / MD5哈希测试。DFK:重复文件杀手将在用户指定的目录/驱动器中搜索任何类型的重复文件。 它将最终利用图像识别进行图像比较,将音频匹配算法用于声音文件匹配以及CRC / MD5哈希测试。0 64浏览会员免费
- 系统开源大小:12MB颜色分类leetcode FCN-for-Semantic-Segmentation 实现和测试 FCN-16 和 FCN-8 的性能。 除此之外,CRF 被用作后处理技术并比较结果。 参考文献: 用于语义分割的全卷积网络 作者:乔纳森·朗、埃文·谢尔哈默、特雷弗·达雷尔 链接: 用于大规模图像识别的非常深的卷积网络 作者:凯伦·西蒙尼安、安德鲁·齐瑟曼 链接: 具有高斯边缘势的全连接 CRF 的有效推理 作者:菲利普·克雷恩布尔、弗拉德伦·科尔通 链接: 实施步骤: 1. 将分类器转换为密集 FCN : 用于语义分割任务的模型源自 VGG。 VGG 本身就是用于分类任务。 因此,为了使模型适合密集预测,我们删除了 VGG 的最后一个全连接层,并用卷积替换它们。 我们附加了一个通道维度为 21 的 1x1 卷积来预测每个粗输出位置处每个 PASCAL 类(包括背景)的分数,然后是一个反卷积层,将粗输出双线性上采样到像素密集输出。 2. 将低层的特征转移到高层 我们为分割定义了一个新的全卷积网络 (FCN),它结合了特征层次结构的层并改进了输出的空间精度。 虽然完全卷积化的分类器可以微调颜色分类leetcode FCN-for-Semantic-Segmentation 实现和测试 FCN-16 和 FCN-8 的性能。 除此之外,CRF 被用作后处理技术并比较结果。 参考文献: 用于语义分割的全卷积网络 作者:乔纳森·朗、埃文·谢尔哈默、特雷弗·达雷尔 链接: 用于大规模图像识别的非常深的卷积网络 作者:凯伦·西蒙尼安、安德鲁·齐瑟曼 链接: 具有高斯边缘势的全连接 CRF 的有效推理 作者:菲利普·克雷恩布尔、弗拉德伦·科尔通 链接: 实施步骤: 1. 将分类器转换为密集 FCN : 用于语义分割任务的模型源自 VGG。 VGG 本身就是用于分类任务。 因此,为了使模型适合密集预测,我们删除了 VGG 的最后一个全连接层,并用卷积替换它们。 我们附加了一个通道维度为 21 的 1x1 卷积来预测每个粗输出位置处每个 PASCAL 类(包括背景)的分数,然后是一个反卷积层,将粗输出双线性上采样到像素密集输出。 2. 将低层的特征转移到高层 我们为分割定义了一个新的全卷积网络 (FCN),它结合了特征层次结构的层并改进了输出的空间精度。 虽然完全卷积化的分类器可以微调0 137浏览会员免费
- 针对冷轧板带材常见表面缺陷图像识别的特点,提出了板带材表面缺陷多特征优化组合方法,该方法以直方图统计特征、小波变换特征、灰度共生矩阵特征、不变矩特征等4类特征共26维特征向量为基础,依据类间类内距离差的类别可分离性判据对特征进行优化,选出最优特征向量组合。对6类典型板带材表面缺陷进行实验,实验结果表明,采用多特征优化组合方法选择出的特征向量具有较好的分离效果,显著地提高了表面缺陷的识别率。0 75浏览免费
- 扩展程序大小:2MB语言:Deutsch,English,Français,español,português (Brasil) Malwareai浏览器安全扩展在浏览Internet时提供了更多的安全性。 malware.ai浏览器安全为Chrome当您通过检查恶意软件时打开可疑文件或与文档链接时,避免感染和其他不需要的结果。 Malware.ai是智能图像识别机制和自学习神经网络的组合,以检测恶意软件。Malware.ai浏览器安全性是从上下文菜单中访问的Chrome的扩展名。它瞬间扫描内联文档,下载文档和链接到文档,如果找到恶意内容,则阻止它们。特征: - 完全免费 - 防止对恶意文件的链接 - 保护打开恶意内联文件 - 块下载恶意文件 - 在查看之前扫描文件 - 在下载之前扫描文档 - 在从Internet下载之前,扫描最多16MB的档案 - 提供跳过扫描的可能性 - 提供手动阻止/取消阻止的可能性下载UND INLINE文档语言:Deutsch,English,Français,español,português (Brasil) Malwareai浏览器安全扩展在浏览Internet时提供了更多的安全性。 malware.ai浏览器安全为Chrome当您通过检查恶意软件时打开可疑文件或与文档链接时,避免感染和其他不需要的结果。 Malware.ai是智能图像识别机制和自学习神经网络的组合,以检测恶意软件。Malware.ai浏览器安全性是从上下文菜单中访问的Chrome的扩展名。它瞬间扫描内联文档,下载文档和链接到文档,如果找到恶意内容,则阻止它们。特征: - 完全免费 - 防止对恶意文件的链接 - 保护打开恶意内联文件 - 块下载恶意文件 - 在查看之前扫描文件 - 在下载之前扫描文档 - 在从Internet下载之前,扫描最多16MB的档案 - 提供跳过扫描的可能性 - 提供手动阻止/取消阻止的可能性下载UND INLINE文档0 84浏览会员免费
- 瑞萨(Renesas Technology Corp.)宣布推出用于下一代汽车导航设备等高性能车载信息终端的SuperH Family SH7774 SoC(系统级芯片)。该器件是全球第一个具备图像识别处理功能的汽车导航SoC,其运行频率为600MHz,多样化而全面的外设模块包括地图绘制2D图形引擎、音频编码器和以太网接口。 SH7774是瑞萨科技汽车导航SoC阵容中的第二阶段产品,其前面的产品是SH7770(运行于400MHz)。从2006年8月开始,瑞萨科技还计划推出一个有助于用户实现有效系统开发的参考平台。 SH7774可提供以下一些功能。(1)全球第一个具备片上图像识别处理I0 117浏览会员免费
- 道路交通标志的背景相当复杂,颜色失真严重并存在不同程度的几何失真现象。不变矩是图像的一种统计特征,具有平移不变性、旋转不变性和比例缩放不变性,被广泛的应用于图像识别中。在研究了Hu矩和Zerni-ke矩基础上,提出基于Zernike矩与BP网络相结合的道路交通标志识别方法。识别过程分别对图像进行了Hu矩和Zernike矩特征提娶BP网络训练与测试、对形变图像进行分类识别。结果表明:基于Zernike矩和BP网络的交通标志识别方法具有很强的抗图像平移、缩放和旋转识别能力,实现简单、训练速度快、识别率高等特点0 56浏览会员免费
- machine-learning大小:147MB机器学习概览 该项目是机器学习的一些有趣的项目,从机器学习到深度学习的过渡,包括但不仅限于文本挖掘、图像识别、kaggle比赛等等。 Pytorch4NLP Cython tutorial nlp-paper(BERT,Transformer)机器学习概览 该项目是机器学习的一些有趣的项目,从机器学习到深度学习的过渡,包括但不仅限于文本挖掘、图像识别、kaggle比赛等等。 Pytorch4NLP Cython tutorial nlp-paper(BERT,Transformer)0 43浏览会员免费
- 神经网络是机器学习的重要分支,是智能计算的一个主流研究方向,长期受到众多科学家的关注和研究,它植根于很多学科,结合了数学、统计学、物理学、计算机科学和工程学已经发现,它能够解决一些传统意义上很难解决的问题,也为一些问题的解决提供了全新的想法. 在传统的研究成果中,有很多表达数据的统计模型,但大都是比较简单或浅层的模型,在复杂数据的学习上通常不能获得好的学习效果.深度神经网络采用的则是一种深度、复杂的结构,具有更加强大的学习能力,目前深度神经网络已经在图像识别、语音识别等应用上取得了显著的成功.这使得这项技术受到了学术界和工业界的广泛重视,正在为机器学习领域带来一个全新的研究浪潮.0 134浏览会员免费
- Api大小:85KBApi-go-tensorflow-image-recognition.zip,go中使用tensorflow的图像识别api go中使用tensorflow的图像识别api,一个api可以被认为是多个软件设备之间通信的指导手册。例如,api可用于web应用程序之间的数据库通信。通过提取实现并将数据放弃到对象中,api简化了编程。Api-go-tensorflow-image-recognition.zip,go中使用tensorflow的图像识别api go中使用tensorflow的图像识别api,一个api可以被认为是多个软件设备之间通信的指导手册。例如,api可用于web应用程序之间的数据库通信。通过提取实现并将数据放弃到对象中,api简化了编程。0 139浏览会员免费
- 扩展程序大小:42KB语言:English (United States) 根据图像内容批量下载并命名图像。 是否曾经想从网页上获取所有图像而不必单独单击它们? 通过使用非描述性的随机字母和数字命名下载的图像,其他批处理下载工具是否达不到要求? 这个工具适合您! 要使用:1.导航到包含图像的任何页面2.单击浏览器右上角的Grab'n Tag图标。3.键入单个标签以搜索(例如,狗)-键入“ all”或保留搜索框为空白以下载页面上的所有图像。4.单击“抓紧!”。 或按Enter键。5,请注意,将自动命名并下载搜索词所标识的所有图像。背景:Grab'n Tag使用一种称为人工神经网络(ANN)的机器学习形式来分析网络上的图像。 -页。 通过向ANN提供大量样本数据(在这种情况下,这些图像已经为其内容添加了标签),ANN被训练为具有高度准确性。 训练后,ANN会分析单个图像并返回它认为与之相关联的标签列表。 我们自己的ANN服务器正在开发中,因此与此同时,Grab'n Tag利用Clarifai的图像识别API来获取与图像相关联的标签。 Grab'n Tag具有非侵入式界面,可输入搜索词来过滤批量下载。 图标版权归语言:English (United States) 根据图像内容批量下载并命名图像。 是否曾经想从网页上获取所有图像而不必单独单击它们? 通过使用非描述性的随机字母和数字命名下载的图像,其他批处理下载工具是否达不到要求? 这个工具适合您! 要使用:1.导航到包含图像的任何页面2.单击浏览器右上角的Grab'n Tag图标。3.键入单个标签以搜索(例如,狗)-键入“ all”或保留搜索框为空白以下载页面上的所有图像。4.单击“抓紧!”。 或按Enter键。5,请注意,将自动命名并下载搜索词所标识的所有图像。背景:Grab'n Tag使用一种称为人工神经网络(ANN)的机器学习形式来分析网络上的图像。 -页。 通过向ANN提供大量样本数据(在这种情况下,这些图像已经为其内容添加了标签),ANN被训练为具有高度准确性。 训练后,ANN会分析单个图像并返回它认为与之相关联的标签列表。 我们自己的ANN服务器正在开发中,因此与此同时,Grab'n Tag利用Clarifai的图像识别API来获取与图像相关联的标签。 Grab'n Tag具有非侵入式界面,可输入搜索词来过滤批量下载。 图标版权归0 40浏览会员免费
- 煤层裂隙影响煤的力学性能和渗透性,且对于一个煤矿的安全生产具有重要意义。针对现有裂隙测量方法较低效且易受自然环境条件影响的问题,通过对煤壁裂隙拍照,结合数字图像处理技术,批量处理拍摄的照片,提取图片中的裂隙参数,得到煤壁上裂隙的倾角;然后根据采面、运输巷和回风巷之间的空间关系建立几何模型,可以求出裂隙的产状,为煤层裂隙系统的快速统计提供了一种新方法。经过实例验证,该方法高效准确且具有一定的实用性。0 88浏览会员免费
- tesseract大小:2MBTesseract OCR 包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式(--oem 0),可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。 Tesseract具有Unicode(UTF-8)支持,并且可以“开箱即用”地识别100多种语言。 Tesseract支持多种输出格式:纯文本,hOCR(HTML),PDF,仅不可见文本的PDF,TSV。master分支还对ALTO(XML)输出提供了实验性支持。 安装Tesseract: 您可以通过预建的二进制软件包安装正方体 或从源代码编译它。 支持的编译器是: GCC 4.8及以上 lang 3.4及以上 MSVC 2015、2017、2019年 其他编译器可能可以工作,但未得到官方支持。Tesseract OCR 包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式(--oem 0),可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。 Tesseract具有Unicode(UTF-8)支持,并且可以“开箱即用”地识别100多种语言。 Tesseract支持多种输出格式:纯文本,hOCR(HTML),PDF,仅不可见文本的PDF,TSV。master分支还对ALTO(XML)输出提供了实验性支持。 安装Tesseract: 您可以通过预建的二进制软件包安装正方体 或从源代码编译它。 支持的编译器是: GCC 4.8及以上 lang 3.4及以上 MSVC 2015、2017、2019年 其他编译器可能可以工作,但未得到官方支持。0 87浏览会员免费
- 图像的边缘检测是提取图像信息的主要方法,是计算机视觉和图像识别的基础,传统的边缘检测大都是基于各种算子的,这些算子在检测边缘的同时特别是对含噪图像的边缘检测难以达到理想的效果.充分利用小波变换的特点,提出一种基于层内相关性的小波相位边缘检测方法,利用小波变换后边缘点与周围局部范围内各点在相位上的相关性提取边缘.实验结果表明,本文方法在很好的检测出边缘的同时,并有较强的去噪功能.0 30浏览会员免费
- 使用常规X射线或CT扫描进行图像处理,研究裂隙结构时,主裂隙不易提取,其特征不明显,不能直接反映主裂隙构造与流体速度关系。运用高清相机拍摄井下煤壁X形真实裂隙进行数字化处理,并运用AutoCAD软件提取裂隙特征,将图片矢量化导入Comsol Mutiphysics仿真模拟软件进行计算,模拟得到瓦斯分布压力场和渗流速度场云图。结果表明:含X形裂隙煤样中,瓦斯自入口开始,渗流压力从左至右递减,裂隙通道内瓦斯压力均匀分布,是一段压力缓冲区;非裂隙区渗流速度场分布不均匀,X形裂隙支流处较汇流处瓦斯渗流更为活跃,瓦斯的流向和裂隙走向的夹角对渗流速度有明显的影响,瓦斯自下边界流入时的最大渗流速度是自左边界流入的29.5倍;裂隙通道内的渗流速度与裂隙的尺度成单调递减对数函数关系,裂缝尺度越大,达西渗流速度越低,当裂隙尺度为0.68~1.23 mm时对渗流速度影响最明显。研究成果可直观地了解煤裂隙内瓦斯渗流特征。0 53浏览会员免费
- 提出了一种新的识别灰度级图像的方法,该方法基于矢量量化的基本思想,通过对图像的分割,将灰度级图像映射成神经元仅取少数几种状态(低态)的Hopfield神经网络模型。理论和模拟实验证明:这种低状态的Hopfield网络模型与传统灰度级图像识别模型相比,不仅神经元的数目较少,互连密度较低,而且网络具有较好的联想能力。0 62浏览会员免费