- NeRF、Mip-NeRF、Instant-NGP、NeRF++0 18浏览免费
- 内容概要:本文提出了GFP-GAN框架,利用预训练生成对抗网络(GAN)中的丰富生成人脸先验进行盲面修复任务。通过多分辨率特征的空间变换和身份保留损失,实现了高真实感和高保真度的面部修复与颜色增强。实验结果表明,GFP-GAN在合成数据和实际数据集上的表现均优于现有方法。 适合人群:计算机视觉领域的研究人员和技术开发者。 使用场景及目标:适用于低质量面部图像的修复任务,特别是那些需要恢复面部细节和色彩的应用。如历史照片修复、影视后期处理等。 其他说明:本文不仅关注于生成逼真的面部图像,还特别强调了保持面部特征的身份一致性。此外,模型的多分辨率特征变换机制有效避免了修复过程中的人工痕迹,提高了最终结果的真实性和自然感。0 14浏览会员免费
- 内容概要:本文详细介绍了Kibana在构建高级可视化中的应用,涵盖Elastic Geo类型(geo_point和geo_shape)的定义和使用方法,以及Elastic Maps的介绍。此外,文章还详细讲解了Vega的声明式语法及其在Kibana中的应用场景,帮助读者了解如何通过编写Vega语句实现复杂的自定义可视化。 适合人群:熟悉Kibana和Elasticsearch的基础操作,希望深入了解地理空间数据可视化和自定义图表的技术人员。 使用场景及目标:①在Elasticsearch中定义和使用geo_point和geo_shape类型;②利用Elastic Maps进行地理空间数据的分析和可视化;③通过Vega创建复杂的自定义图表,满足特定的可视化需求。 其他说明:文章提供了详细的示例代码和实际应用案例,帮助读者更好地理解和应用Kibana的高级可视化功能。0 25浏览免费
- 内容概要:本文详细介绍了共轭梯度法的基本概念、算法步骤及其在求解线性方程组和矩阵方程(如李雅普诺夫方程和Sylvester方程)中的应用。文章首先概述了共轭梯度法作为一种迭代算法的特点和应用场景,然后给出了具体的求解过程,包括初始设置、残差计算、迭代更新等关键步骤。文中还提供了使用Python中的NumPy工具包实现的具体代码示例。 适合人群:对机器学习和数值计算有一定基础,特别是对线性代数和迭代算法感兴趣的研发人员和技术爱好者。 使用场景及目标:帮助读者理解共轭梯度法的工作原理,掌握如何利用该方法求解实际问题中的大规模线性方程组和矩阵方程。适用于科研项目、工程实践以及数据科学任务中涉及此类问题的解决。 其他说明:文章提供了详细的数学推导和实例代码,适合自学或团队培训。通过理解和实践这些内容,可以有效提高解决复杂计算问题的能力。此外,文章还推荐了一本数值计算的经典书籍《矩阵计算》,帮助读者深入了解相关理论和方法。0 7浏览免费
- 机器学习_CP张量分解0 5浏览免费
- You-Tube公布的推荐系统论文0 2浏览会员免费
- 谷歌公布的推荐系统论文0 3浏览会员免费
- 此文档包含了应用于对接的 UniMol Docking V2 完整的测评文档,包括:模型介绍、模型性能、模型内置案例测试结果、我们自定义案例的测试结果、以及可运行的项目代码,以及从实际应用角度上对模型真实性能的总结。适合人群:计算机辅助药物设计研究人员,或者对 AI4Science 感兴趣科研工作者。需要具备基础的 Linux、conda 即可运行,在项目中使用。如有任何问题和想法,欢迎后台私信。0 8浏览会员免费
- 内容概要:本文介绍了Transformer模型,一种全新的序列转换模型,完全基于注意力机制,取代了传统的递归神经网络(RNN)和卷积神经网络(CNN),显著提高了并行化能力和训练速度。文章详细描述了Transformer模型的架构和各个组件的功能,包括多头注意力机制、前馈神经网络和位置编码。实验结果显示,Transformer在机器翻译任务上取得了超越以往最佳模型的性能,并在英语构成解析任务上表现良好。 适合人群:深度学习研究人员、自然语言处理工程师和技术爱好者,特别是对注意力机制及其应用感兴趣的读者。 使用场景及目标:适用于需要高效并行计算的序列到序列任务,如机器翻译和文本解析。目标是提供一种新的方法来解决长距离依赖问题,并减少模型训练时间。 其他说明:文章还包括详细的实验设置、数据集选择、训练策略以及超参数调整等内容,有助于读者理解和复现模型的优秀性能。此外,还提供了部分可视化结果,展示了注意力机制的具体工作方式。0 28浏览会员免费
- 北理工 人工智能课程期末考试 2009级人工智能基础期末试题A卷 含答案.pdf0 5浏览¥ 14.90
- 北理工 人工智能课程期末考试 研究生2011年人工智能期末试题.pdf0 6浏览¥ 9.90
- 北理工 人工智能课程期末考试 研究生2010年人工智能期末试题 含答案.pdf0 8浏览¥ 14.90
- 北理工 人工智能课程期末考试 研究生2013年人工智能期末试题 含答案.pdf0 8浏览¥ 14.90
- 北理工 人工智能课程期末考试 2011级人工智能基础期末试题A卷 含答案.pdf0 5浏览¥ 14.90
- 北理工 人工智能课程期末考试试题 2009级_人工智能基础(A卷)_含标准答案.pdf0 13浏览¥ 14.90
- 北理工 人工智能课程期末考试试题 人工智能(研究生)2010年试题 含答案.pdf0 5浏览¥ 14.90
- 北理工 人工智能课程期末考试试题 人工智能(研究生)2013年试题_含标准答案.pdf0 6浏览¥ 14.90
- 北理工 人工智能课程期末考试试题 2011级_人工智能基础(A卷)_含标准答案.pdf0 4浏览¥ 14.90
- 内容概要:本文详细介绍了2023年同等学力研究生的航空系统容量分析结课大作业。主要内容涉及单跑道机场容量的蒙特卡洛仿真,包括虚拟进港和离港航路点的设置、流量比例和尾流类型的人为设定与调整、空中和地面规则的应用、飞机性能模型的选择、仿真次数的执行以及仿真数据的统计与分析。最后,需要根据仿真数据计算跑道容量并与理论模型进行对比。 适合人群:航空工程专业研究生或从事航空系统研究的技术人员。 使用场景及目标:适用于单跑道机场的容量分析和优化项目,旨在提高机场运营效率和安全性,减少延误。通过本次仿真,学生可以深入理解单跑道机场的各种复杂因素及其对整体系统的影响。 阅读建议:在阅读过程中,重点理解各个仿真环节的设计思路和技术细节,特别是蒙特卡洛方法在实际应用中的具体实施步骤。同时,结合提供的参考文献和相关规章,确保仿真模型的科学性和实用性。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 3浏览¥ 19.90
- 内容概要:本文档为马来西亚科学大学计算机科学学院CPT111课程的一份编程评估报告,介绍了如何开发一个从多个文件获取书籍及其评论信息的程序。该程序需要能够读取三个输入文件(Book List、Rating List、Average Rating),并提供以下功能:列出所有书评、用户名和平均评分,支持用户新增书评,并自动更新平均评分。程序应具有交互性菜单,方便用户操作。此外,还要求学生提交详细的程序设计文档,包括问题分析、需求规格说明、伪代码和流程图等。禁止使用C++内置的数据结构,如vector、list等。 适合人群:适用于正在学习CPT111课程的学生,特别是对文件处理和数据管理有兴趣的学习者。 使用场景及目标:本项目旨在帮助学生掌握文件读写、数据管理和基本的用户界面设计技能,同时加深对程序设计原理的理解。 阅读建议:学生应仔细阅读文档中的每一部分,确保对项目要求有全面的理解,并按步骤进行实现。建议在实现过程中多进行测试,确保程序的健壮性和正确性。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 5浏览¥ 14.90
- 内容概要:本文利用自然语言处理技术和机器学习模型(如XGBoost和SHAP),探索福州市57个传统村落的建成环境对游客情感的影响。研究表明,开放度、绿色植物比例和色彩复杂度对游客的情感体验有显著正向影响,而地面曝光度和其他因素则有负面影响。通过对不同变量的交互分析,揭示了这些环境特征对游客情感的具体机制。 适合人群:城乡规划师、景观设计师、旅游研究人员以及相关领域的学者和从业人员。 使用场景及目标:本文的研究成果可为传统村落的可持续发展提供科学依据,特别是在提升游客情感体验方面。适用于优化传统村落的空间配置、改善基础设施建设、增强生态体验等方面。 其他说明:本研究采用了大量的社会媒体数据和图像数据进行量化分析,通过多种方法验证了研究成果的可靠性。同时,也为其他地区的农村环境评估提供了参考框架。-可实现的-有问题请联系博主,博主会第一时间回复!!!0 6浏览¥ 19.90
- 内容概要:本文针对球头铣刀在复杂表面上铣削时瞬时切削力建模的难题,提出了一种改进的Z-MAP方法。该方法通过齐次坐标变换建立刀齿的运动轨迹,识别刀-工瞬时接触区,计算瞬时未变形切屑厚度,并通过试验验证了该建模方法的有效性和可靠性。 适合人群:机械工程领域的研究人员和技术人员,特别是从事铣削力建模和加工参数优化的工程师。 使用场景及目标:①适用于复杂表面加工中切削力预测;②帮助提高刀具寿命、加工表面质量和加工稳定性;③用于加工参数的选择和优化。 其他说明:本文提出的建模方法不仅适用于垂直加工,还能应对倾斜加工等多种工况。试验结果表明,预测结果与实际测量结果具有较高的吻合度,证明了方法的有效性。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 9浏览¥ 9.90
- 内容概要:本文探讨了低空经济的发展及其在物流领域的应用,特别是基于无人机的城市低空物流配送系统。详细介绍了无人机配送的现状、前景以及面临的挑战,并提出了针对物流派送公司在不同条件下的路径优化问题解决方案,涵盖单无人机送单、多无人机协同以及有限无人机数量情景下的路径规划。 适合人群:物流行业从业者、科研机构人员和技术开发者。 使用场景及目标:帮助物流公司在利用无人机进行高效快速配送时,通过合理的路径规划降低成本,提高运营效率。 其他说明:本文提供了具体的数学模型和实例计算,适用于理论研究和实际应用中的决策支持。对于想要进入低空物流市场的公司和个人来说,本论文提供的数据和方法论具有重要的指导意义。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 9浏览¥ 9.90
- 内容概要:本文旨在分析不同国家对中国品牌市场情绪的变化趋势,并预测未来中国经济价值的发展方向。研究利用2018年至2024年社交媒体用户数据进行情感分析和时间序列预测,构建了集成情感认知推理的BERT模型和LSTM模型,提高了情感监控的准确性,并提供了中国品牌国际传播策略的理论基础和实证支持。同时,采用GeoPandas库对情感数据进行地理可视化,帮助品牌管理者实时调整营销策略,最终通过均方误差(MSE)确保预测效果的可靠性。 适合人群:对品牌管理和市场营销有兴趣的研究人员、学生、企业管理人员。 使用场景及目标:适用于企业进行品牌国际化传播战略制定、市场情绪监测、消费者偏好分析以及行业趋势预测。 其他说明:本文通过结合深度学习技术和数据分析方法,为企业提供了一种科学的品牌沟通效果评估框架,有助于优化品牌的全球市场传播策略。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 5浏览¥ 9.90
- 内容概要:本文提出了利用AWD-LSTM进行智能合约多类别分类的方法,主要针对Suicidal(自杀)、Prodigal(挥霍)和Greedy(贪婪)三类安全漏洞进行分类,解决了传统检测工具计算成本高的问题,实验结果显示该模型在大规模智能合约数据集上取得了较高的加权平均Fbeta分数(90.0%)。此外,模型在不同类别中的识别精度和召回率也表现出色。 适合人群:区块链安全研究人员、机器学习工程师、智能合约开发者。 使用场景及目标:① 使用预训练的语言模型对智能合约的安全性进行自动评估,减少人为错误和漏检的风险;② 在部署新的智能合约之前,快速高效地检测合同中的安全隐患;③ 培养技术人员对智能合约安全性评估的能力和技术储备。 其他说明:研究不仅介绍了模型的设计思路和训练方法,还讨论了实际应用场景中可能遇到的问题和未来研究的方向。文中提及的数据集和源代码已公开,可供复现研究结果并进一步改进算法性能。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 5浏览¥ 9.90
- 内容概要:本文档详细介绍了《ECSE 446/546:Realistic/Advanced Image Synthesis》课程第四个作业的内容,主要任务是在 Taichi 渲染器中实现隐式和显式路径追踪算法。此外,还需要加入俄罗斯轮盘赌(Russian Roulette)终止方法来减少偏差以及实现折射效果和支持全反射。文中还提供了提交政策、延期政策和学术诚信相关的重要信息。 适合人群:本课程的学生,尤其是对图像渲染有研究兴趣的学习者。 使用场景及目标:帮助学生掌握路径追踪的基本理论及其在实际渲染中的具体实现方法。通过完成这项作业,学员能够更好地理解和应用蒙特卡罗估计、递归全局光照计算和光学原理。 阅读建议:在实践中结合理论讲解进行操作,特别关注各部分之间的相互关系。遇到难点时及时查阅课程提供的资料和技术文档。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 4浏览¥ 9.90
- 本文档包含了深度对接模型GAABind 的测评文档以及完整项目可运行代码,包括:模型介绍、模型性能介绍、环境安装、内置案例分析、自定义案例分析、以及从实际应用角度上对模型真实性能的总结。适合人群:计算机辅助药物设计研究人员,或者对 AI4Science 感兴趣科研工作者。需要具备基础的 Linux、conda 即可运行,在项目中使用。如有任何问题和想法,欢迎后台私信。0 12浏览免费
- 内容概要:本文介绍了一种名为LoRa-Fine-Tuning-aware Quantization(LoftQ)的新量化框架,专为预训练的大规模语言模型设计。LoftQ通过交替应用量化和低秩逼近来近似原始高精度预训练权重,为后续的LoRA微调提供良好的初始化点,显著改善下游任务性能,尤其在低比特量化的挑战环境中表现优异。文章通过对自然语言理解和生成等多个任务的实验证明了LoftQ在不同量化方法和模型上的有效性,尤其是在2位混合精度情况下取得了显著成果。 适合人群:对自然语言处理、大规模语言模型量化及其优化感兴趣的研究人员和技术从业者。 使用场景及目标:适用于需要对大型预训练语言模型进行高效压缩和优化的应用场景,如资源受限的部署环境,以及希望在保持高性能的同时减少存储和计算成本的任务。主要目标是提升量化后的模型在各种下游任务上的性能和稳定性。 其他说明:作者们还讨论了不同的优化步骤(T值)对性能的影响,发现适度的步长可以有效提升性能,而过大的步长则可能带来边际效益递减的现象。同时,他们将LoftQ与现有的全精度LoRA和其他剪枝方法进行了对比,证明了LoftQ在多个基准测试上的优越性能。0 4浏览¥ 9.90
- 内容概要:本文深入探讨了文本到图像扩散模型(如Stable Diffusion)的数据复制问题。作者首先分析了训练集中数据重复对模型输出的影响,发现文字条件化在数据复制中扮演着重要角色。实验结果显示,增加文字描述的多样性和随机化可以在一定程度上减轻数据复制行为。文章还提出了几种缓解数据复制的技术,如多图注释、高斯噪声、随机词替换等。此外,通过对不同数据集复杂度的分析,揭示了简单图像更容易被模型记住。 适合人群:机器学习研究员、深度学习开发者、AI安全专家。 使用场景及目标:适用于开发高质量、低风险的扩散模型应用,确保模型不违反版权法规。同时,为研究人员提供理论支持和技术指导,提高模型的鲁棒性和安全性。 其他说明:本文提供了详尽的实验设置和结果分析,推荐读者仔细阅读相关章节以全面理解研究方法和结论。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 5浏览¥ 9.90
- 内容概要:本文探讨了现代扩散模型是否会在生成过程中直接复制训练集中的图像内容。作者提出了基于不同特征提取器的方法来检测这种数据复制现象,并系统地分析了几种不同的扩散模型。实验涵盖了多个训练集规模的数据,并对Stable Diffusion进行了深入的研究,展示了其存在大量复制行为,尤其是在训练集样本量较小的情况下。随着训练数据规模增大,部分复制现象减弱,但在大规模数据上仍然可能发生局部复制。 适合人群:对于深度学习、视觉生成模型、数据安全与隐私等领域感兴趣的研究人员和技术开发者。 使用场景及目标:帮助研究者和开发者评估扩散模型的创新能力和潜在的法律伦理风险,优化生成模型以减少不必要的内容重复。 其他说明:文章提供了详细的实验方法、数据集选择和评估指标解释,便于相关领域的研究人员复现和扩展研究。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 8浏览¥ 9.90
- 内容概要:本文提出了一种新的任务——生成身份遗忘(Generative Identity Unlearning),旨在从预训练的生成对抗网络(GAN)中彻底移除特定身份信息。研究解决了隐私泄露的问题,尤其是在人脸图像方面。提出的框架GUIDE能够在仅利用一张源图片的情况下有效实现这一目标。GUIDE通过两部分实现:一是寻找合适的优化目标点来去标识源潜在代码;二是引入新型损失函数,在不显著影响模型整体性能的前提下实现身份遗忘。 适合人群:机器学习研究者、数据隐私保护研究人员、图像生成领域的开发者和技术爱好者。 使用场景及目标:该方法适用于需要确保个人隐私的数据集,如面部图像。通过这种方法,可以防止预训练模型生成特定身份的图像,同时保持整体生成质量。此外,该方法也可用于版权问题的解决。 其他说明:该方法不仅适用于预训练的模型,还可以应用于未见过的图片,从而提供更广泛的适用性和灵活性。实验结果显示GUIDE在多个评估指标上表现优异,实现了生成模型中的状态级表现。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 2浏览¥ 9.90
- 内容概要:本作业旨在测试学生对电气功率系统中单位制计算、稳态分析及同步发电机建模的理解。主要任务分为两部分:一是进行同步发电机的单位值计算和稳态分析,涉及各种电感和电阻参数的计算及其在不同工况下的应用;二是通过SIMULINK实现dq0变换,并验证计算结果的有效性。 适合人群:电气工程专业的研究生以及相关领域的研究人员。 使用场景及目标:通过完成本次作业,学生将深入理解同步发电机的工作原理及其在电力系统稳定性控制中的作用,掌握单位制计算和SIMULINK仿真的具体方法和技术。 其他说明:报告需要严格按照IEEE格式撰写,包括封面页、摘要、目录、引言、计算结果和讨论、结论、参考文献和附录。评分标准涵盖了各个方面,从内容质量到写作规范都有明确的要求。严禁使用ChatGPT等生成式AI工具,并确保无抄袭行为。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 13浏览¥ 9.90
- 内容概要:本文提出了一种使用长短期记忆(LSTM)模型对智能合约进行安全威胁检测的方法。实验结果表明,LSTM模型在620,000份智能合约上能够快速检测新攻击趋势,达到99%的测试准确率,并有效处理了大量复杂的智能合约。该方法不仅在准确性上超过了现有的符号化工具Maian,还能够在保持恒定分析时间的同时,处理越来越复杂的智能合约。 适合人群:区块链开发人员、智能合约安全研究人员和技术管理者。 使用场景及目标:用于智能合约的安全审计和漏洞检测,帮助开发者发现潜在的安全威胁并提高合约的安全性。 其他说明:与传统的符号化工具相比,LSTM模型在处理大规模数据集时表现出更好的性能和扩展能力。尽管存在一些局限性,但LSTM模型仍然是一种有效的智能合约安全性评估工具。-可实现的-有问题请联系博主,博主会第一时间回复!!!0 6浏览¥ 9.90
- 内容概要:本文提出了一种基于Lyapunov回步方法构建控制屏障函数(CBF)的新方法。主要结果是在确保安全约束的同时实现动力行为的动态控制。特别地,该方法将物理约束表示为CBF,并通过二次规划(QP)控制器将其与控制李亚普诺夫函数(CLF)统一起来,以实现稳定行走。具体应用到7自由度双足机器人AMBER2上,展示了该方法的有效性,确保了机器人在模拟过程中实现稳定的周期性行走。 适合人群:对机器人控制系统特别是双足步行感兴趣的机械工程专业研究生以及相关领域的研究人员。 使用场景及目标:用于双足机器人的动力行走研究,旨在实现既满足物理限制又保持系统稳定性的真实场景应用。 其他说明:本文详细介绍了CBF和CLF的数学背景和理论推导,提供了具体的仿真参数设置和实验结果分析。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 8浏览¥ 9.90
- 内容概要:本文档详细介绍了23级学生的信号与系统大作业任务与报告撰写说明,重点讲解了电网谐波信号的数学表示、傅里叶分析方法的应用以及频谱泄漏现象的影响。文档还探讨了矩形时窗截断对频谱的影响,提出了减少频谱泄漏的方法。同时,给出了具体的任务和评价标准,指导学生完成相关的大作业。 适合人群:适用于正在进行“信号与系统”课程学习的大学生及对傅里叶变换和信号处理感兴趣的科研人员。 使用场景及目标:帮助学生理解和掌握电网谐波信号的傅里叶分析方法,培养解决实际问题的能力,提升对信号处理理论与技术的理解和应用能力。 其他说明:文档强调了任务的选择与执行标准,提醒学生注意数据的独创性和规范的报告撰写要求,确保高质量完成大作业。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 9浏览¥ 9.90
- 内容概要:本文研究了大规模语言模型(LLMs)作为自动评估器在自然语言任务质量评估中的表现。现有的直接评分方法存在与人类判断不一致的问题,即使校准也无法完全解决这一问题。为此,作者提出了Pairwise-preference Search (PAIRS),一种不确定性引导的搜索方法,通过成对比较候选文本并有效地进行排序,提高了评估的准确性。实验结果显示,PAIRS不仅显著优于传统的直接评分方法,在多个基准测试中还达到了最先进的性能。 适合人群:从事自然语言处理、机器学习研究的技术人员及研究人员。 使用场景及目标:在自然语言生成任务的质量评估中,尤其是在大规模数据集上,使用PAIRS可以更高效地获取与人类判断更为一致的评估结果,提升评估的鲁棒性和准确性。 其他说明:PAIRS利用了LLMs在强化学习中从人类反馈训练得到的偏好数据,通过成对比较和不确定性的引导,有效解决了评估标准不一致的问题。文章详细介绍了PAIRS的工作机制及其与其他方法的对比实验结果。0 8浏览会员免费
- 内容概要:本文介绍了一种名为Qwen-Audio的大规模音频语言模型,旨在支持各种任务、语言和音频类型的通用音频理解能力。Qwen-Audio采用了单一编码器处理不同类型的音频数据,并通过大规模多任务预训练和监督指令微调相结合的方法,提升了其在多个基准任务上的性能。模型设计了一个多层次的标签条件解码器框架,以促进知识共享并避免多种任务间的干扰。此外,作者还提出了语音识别与词级时间戳预测(SRWT)的任务,进一步提高了模型对音频信号的理解能力和自动语音识别的性能。实验结果显示,Qwen-Audio在不需要特定任务微调的情况下,在多种任务上均取得了显著优于现有模型的性能。同时,基于Qwen-Audio,作者开发了Qwen-Audio-Chat,能够灵活处理来自音频和文本的输入,支持多轮对话和多样化的音频场景应用。 适合人群:研究和开发人员,特别是从事自然语言处理、语音识别和多模态交互领域的研究人员和技术开发者。 使用场景及目标:①用于大规模音频数据集的统一多任务预训练;②提升多种音频任务的性能,如自动语音识别、翻译、音频事件检测、情感识别等;③支持多语言和多轮对话系统,增强人机交互体验。 其他说明:Qwen-Audio及其衍生的Qwen-Audio-Chat模型均已开源,有助于推动音频-文本多模态社区的发展。0 9浏览会员免费
- 内容概要:本文介绍了 VisionZip 方法,用于减少视觉语言模型(VLM)中的冗余视觉令牌,从而提高模型效率而不牺牲性能。作者发现现有的视觉编码器生成的视觉令牌存在大量冗余,因此提出了一种简单而有效的方法来选择和合并有信息量的视觉令牌。VisionZip 不仅显著提高了模型推理速度,还使得大型语言模型(如 13B 的 LLaVA)比 7B 的版本表现更好,同时降低了内存和计算成本。 适合人群:具备一定深度学习和自然语言处理背景的研究人员和开发者。 使用场景及目标:适用于图像理解和视频理解任务,尤其是在需要高效多轮对话的实际应用场景中。 其他说明:VisionZip 是一种即插即用的方法,可以直接应用于现有的大型语言模型,不需要额外的训练时间。该方法不仅提高了模型性能,还显著减少了内存占用和推理时间。0 8浏览会员免费
- 内容概要:本文引入了“容量密度”的概念,用于评估大型语言模型(LLMs)的质量,并描述了LLMs的发展趋势。容量密度被定义为有效参数量与实际参数量之比。研究表明,自2023年以来,开源基础LLMs的最大容量密度呈现指数增长趋势,每三个月翻一番。文中详细介绍了如何计算容量密度,并展示了几个广泛使用的LLM基准测试结果。此外,文章还探讨了容量密度增长对推理成本、模型压缩等方面的影响。 适合人群:从事大规模语言模型研究与开发的技术人员,以及关注AI发展趋势的研究人员和学者。 使用场景及目标:帮助研究人员量化不同规模LLMs的质量,指导未来LLMs的发展方向,特别是在提高效率的同时保持性能方面。 其他说明:该研究揭示了一个重要的模式——即尽管随着参数规模的增加,模型性能可以提升,但受制于有限的计算资源和快速响应的需求,单纯追求更大参数规模并非最佳选择。因此,研究人员和开发者应该努力提高模型的成本效益,实现在最小推理成本下达到最优性能。0 10浏览会员免费
- 本文探讨了在何种情况下不再需要更大的视觉模型,提出多尺度处理的小模型能够达到甚至超越大规模模型的性能。 【方法】:作者采用Scaling on Scales (S^2)方法,通过在多个图像尺度上运行预训练且冻结的小型视觉模型(如ViT-B或ViT-L)。 【实验】:实验在各种任务上(包括分类、分割、深度估计、多模态LLM基准测试和机器人操作)证明了S^2方法的有效性,并在V*基准测试中实现了对详细理解的多模态任务的最先进性能,数据集名称未在摘要中明确提及。作者还展示了多尺度小模型具有与大规模模型相当的学习能力,并且通过S^2预训练的小模型可以匹配或超过大规模模型的优点。0 9浏览会员免费
- 内容概要:本文提出了一个名为AttentionMGT-DTA的新模型,用于预测药物-靶点亲和力(DTA)。该模型基于图变换器和注意力机制,通过结合药物分子图和蛋白质口袋图,利用AlphaFold2预测的高质量蛋白质结构数据,提高了DTA预测的性能和解释性。与现有的方法相比,该模型在两个基准数据集上表现优越,并在冷启动情况下表现出色。 适合人群:从事生物信息学、药物发现与设计领域的研究人员和技术人员。 使用场景及目标:① 为药物发现提供高精度和可解释性的DTA预测;② 在没有足够已知药物或蛋白质数据的情况下进行有效的冷启动预测。 其他说明:该研究不仅展示了在DTA预测方面的优势,还强调了多模态数据融合的重要性和预训练语言嵌入的引入对提高模型性能的作用。此外,模型的联合注意模块有助于更好地理解和解释药物-靶点相互作用的具体机制。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 10浏览¥ 9.90
- 内容概要:本文提出了一种基于Transformer的多尺度目标检测模型,用于解决传统目标检测方法在多尺度目标检测中的局限性。利用自注意力机制,该模型可以有效捕捉图像中不同尺度的目标特征。实验在COCO数据集上进行,通过引入多尺度特征融合策略和优化多头注意机制以及特征金字塔网络(FPN),最终模型在COCO验证集上的平均精度(AP)达到41.2%,并在小目标、中目标和大目标检测的准确性方面显著提升。此外,模型的训练效率也得到了评估,展示了良好的收敛性和稳定的检测性能。 适合人群:对计算机视觉尤其是目标检测感兴趣的科研人员和技术开发者。 使用场景及目标:适用于自动驾驶、视频监控、智能安全和无人机侦察等实际应用场景中的多尺度目标检测任务。旨在提高复杂环境中小目标和多种尺寸目标的检测精度和鲁棒性。 其他说明:文中详细介绍了模型的设计、优化策略以及实验结果,为未来的研究提供了方向。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 12浏览¥ 9.90
- 内容概要:本文提出了一种新的锂离子电池(LIB)退化诊断方法,利用卷积神经网络(CNN)对增量容量曲线(IC曲线)进行图像表示。首先将IC曲线转换为动态时间弯曲(DTW)图像,然后通过训练CNN模型来预测主要退化机制。实验结果表明,与现有的最先进方法相比,该方法的准确性更高,在不同电池配置下表现稳定。此外,该方法还成功应用于实际商业电池数据的退化诊断。 适合人群:能源存储领域的研究人员,特别是从事锂离子电池老化和健康状态评估工作的专业人士。 使用场景及目标:①用于锂离子电池的老化诊断和寿命预测;②通过识别不同的退化模式,提高电池的可靠性和安全性。 其他说明:本文的研究不仅展示了深度学习在电池诊断中的潜力,还提供了一个可以应用于不同类型电池的有效方法。未来的工作将进一步探索迁移学习的应用以及从充电周期扩展到放电周期的数据分析。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 11浏览¥ 9.90
- 内容概要:本文提出了一种新的几何感知互连图神经网络(GIANT)用于蛋白质-配体结合亲和力的预测。GIANT由两部分组成:3D几何图学习网络(3DG-NET)和成对互动学习网络(PI-NET)。3DG-NET在迭代节点-边交互过程中更新嵌入表示,同时保持原子间的三维空间距离、极角和二面角信息。PI-NET则通过全局互动学习整合元素类型的互动和分子级别的互动信息,进一步提升模型性能。实验结果表明,GIANT在两个基准数据集上表现优于现有方法。 适合人群:计算化学、生物信息学、深度学习研究者以及从事药物发现的相关科研人员。 使用场景及目标:应用于结构化药物发现任务中,提高蛋白质-配体结合亲和力的预测精度,加速药物筛选进程。 其他说明:本研究强调了三维几何信息在结合亲和力预测中的重要性,并提出了新颖的方法来建模这种复杂交互。通过详尽的实验验证,证明了GIANT的有效性和泛化能力。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 10浏览¥ 9.90
- 内容概要:本文提出了一种基于神经网络的毫米波雷达血压测量和波形重建方法。通过预处理毫米波雷达信号,使用扩展的微分交叉相乘算法和平均值滤波提取相位信息,并通过小波滤波减少高频噪声和基线漂移,从而获得高质量的脉搏波信号。接着,构建了一个两阶段递进式特征融合与映射网络,使用 MultiResUNet和自注意力机制提取脉搏波的多尺度特征并重建血压波形,最后通过卷积神经网络和长短期记忆网络实现脉搏波特征到血压值的映射。实验结果表明,所提方法对收缩压和舒张压的测量误差分别为3.49±5.75 mmHg和2.40±3.59 mmHg,均达到了BHS标准的A级要求,证明了方法的有效性。 适合人群:具备一定编程基础和医疗设备研发背景的科研人员和工程师。 使用场景及目标:适用于心血管疾病预防和监测领域,特别是在家庭健康管理、远程医疗服务等场景中,可以通过非接触方式实现血压的精准测量和波形重建,提高用户体验。 其他说明:本文详细介绍了毫米波雷达信号预处理和神经网络模型的设计过程,提供了详细的实验结果和比较,有助于理解和优化无接触血压测量技术。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 13浏览¥ 9.90
- 内容概要:本文档介绍了2024年秋季机器学习最终比赛的指南,旨在利用机器学习技术对古代中国书画作品进行时代预测。比赛的主要任务是图像分类,提供了一个包含3600张图片的数据集,其中包括900张AI生成的图片。模型需要识别图片属于唐朝、宋朝、元朝、明朝、清朝或AI生成六个类别之一。训练数据存在噪声,其中一半的AI生成图像有明确标签,另一半则随机分配到非AI类别。 适合人群:对机器学习、图像分类感兴趣的科研人员和学生。 使用场景及目标:通过参与竞赛,学习并应用机器学习技术和图像分类方法,提高对中国古代艺术作品的理解与识别能力。主要目标是在竞赛中取得好成绩,并提交高质量的代码和报告。 阅读建议:详细阅读比赛规则和评价指标,合理设计和优化模型,特别是在处理噪声和不平衡数据方面多下功夫。积极参与讨论,但避免作弊行为,确保代码和模型的可复现性和原创性。0 10浏览¥ 9.90
- 内容概要:本文研究了大型多模态模型(LMMs)的内部神经表示及其解释方法。作者提出了一种利用稀疏自编码器(SAE)解缠和解释开放语义特征的方法,并介绍了一个自动解释管道,该管道能够识别和解释由LMMs自身学到的特征。此外,本文还展示了如何通过调整特定特征来干预模型的行为,从而解决具体问题或诱导所需输出。实验结果表明,这些特征可以有效指导LMMs的行为,提高模型的理解力和可靠性。 适用人群:具备一定深度学习背景的研究人员和技术人员,对多模态模型有浓厚兴趣的数据科学家。 使用场景及目标:① 解析大型多模态模型的内部神经表示,理解其决策机制;② 通过调整特定特征值,纠正模型的错误行为;③ 提高多模态模型的可靠性和可解释性。 其他说明:本文提出的方法不仅有助于学术研究,还可应用于工业界,为大型多模态模型的开发提供支持。作者开源了所有代码和模型参数,方便研究人员进一步探索和验证。0 10浏览会员免费
- 内容概要:本文提出了一种新的强化学习框架——自然语言强化学习(NLRL),该框架将传统的数学模型转化为自然语言表示,通过利用大型语言模型(LLMs)的能力来增强决策制定过程。作者详细介绍了如何重新定义传统RL的关键概念,如任务目标、策略、价值函数、贝尔曼方程和广义策略迭代,使其符合人类自然语言的表达方式。实验部分展示了该方法在表格型马尔科夫决策过程(MDPs)中的有效性和高效性,同时解决了传统RL中存在的样本效率低、解释性差和监督信号稀疏等问题。 适合人群:具备基本自然语言处理和机器学习知识的研究人员和从业人员,尤其是对强化学习和大型语言模型感兴趣的读者。 使用场景及目标:① 结合自然语言表示和强化学习,优化决策制定过程;② 提高决策制定过程的解释性和透明度;③ 减少样本量需求,提高学习效率。 其他说明:尽管NLRL框架初步显示了良好的效果,但当前存在一些局限性,如大型语言模型的幻觉问题,未来的工作将进一步解决这些问题并扩展实验范围。0 13浏览会员免费
- 人工智能发展报告(2024年)【中国信息通信研究院编写】,可供参考学习,禁止用于商业目的哦。0 0浏览会员免费
- 波士顿房价预测是一个经典的机器学习问题。波士顿住房数据集包含了美国马萨诸塞州波士顿不同郊区的住房信息,这些信息被用于预测房屋价格的中位数。该数据集共有 506 个样本,每个样本包含 13 个特征,比如犯罪率、住宅平均房间数、到就业中心的加权距离等,目标是预测房屋价格的中位数,这是一个典型的回归问题。0 7浏览会员免费
- 从互联网到AI云产业的重构和演进-贾扬清0 3浏览免费
- 内容概要:本文介绍了Classification and Regression Diffusion (CARD) 模型,这是一种结合去噪扩散条件生成模型和预训练条件均值估计器的方法,用于准确预测响应变量 y 在给定协变量 x 下的分布。文章展示了 CARD 在多模态条件下优于现有方法的表现,并提出了一种新的评估指标 QICE 来更好地评价回归模型对完整分布的捕捉能力。同时,CARD 还利用生成模型的随机性质为分类任务提供实例级别的模型置信度评估。 适合人群:从事机器学习、统计学习、深度学习领域的研究人员和工程师。 使用场景及目标:适用于需要准确预测连续或类别响应变量 y 的条件分布,尤其是在数据具有多模态特性的情况下。可以用于回归和分类任务中的不确定性量化。 阅读建议:本文详细介绍了 CARD 模型的技术背景和实验验证,重点解释了模型的设计思路和具体算法实现。建议重点关注模型的优势以及与现有方法的对比分析,这对于理解和应用模型有重要帮助。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 11浏览¥ 19.90
- 内容概要:该课程作业(COMP1036)任务二详细描述了用Hack Assembly Language编写的程序任务。主要分为两部分,一是从RAM指定地址读取值并进行运算得出Z值,二是依据Z值对指定内存范围内的整数数组进行升序或降序排序。具体规则包括基于X、Y是否为偶数或奇数来决定Z值,进而选择排序方式或不排序。同时,任务还包括一系列的边界情况处理和技术要求,如代码结构、注释等。 适合人群:具有一定的程序设计基础的学生,尤其是熟悉Hack Assembly语言的学员。 使用场景及目标:本课程作业旨在帮助学生深入理解低级编程语言的实际应用和具体实现细节,提高他们解决复杂编程问题的能力。 阅读建议:学生需要仔细阅读题目要求,确保程序能够满足所有测试案例的要求,并关注代码的质量,如注释、伪代码和效率优化等方面。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 25浏览¥ 14.90
- 内容概要:本文介绍了控制理论在具有惯性负载的电动机中的应用,包括电机的工作原理及其数学模型的建立。文中还讨论了系统的状态反馈控制设计、观测器设计和最优控制等方面的内容。具体地,通过状态方程建模、Simulink仿真的方式进行实验验证。 适合人群:自动化工程专业学生和研究者、电机控制系统工程师等。 使用场景及目标:适用于教学环境中作为实践课程教材,帮助学习者掌握电动机控制的基本概念和技术手段;也可以用于工业应用场景中提高电动机的性能与稳定性。 其他说明:文档还探讨了关于系统可控性和可观察性的理论,同时提供了详细的推导过程。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 40浏览¥ 19.90
- 内容概要:本文档提供了2024年CS3AM课程的个人课程作业指导,旨在帮助学生理解和完成任务。具体要求包括:选择一个新的数据集,定义一个问题,构建并评估两个机器学习模型(其中一个必须使用TensorFlow/PyTorch实现的深度学习模型),最终形成一份详细的报告,其中包括数据集描述、数据预处理、模型训练与评估、结果对比及结论等环节。同时,作业提交方式和格式也有明确规定,报告必须在规定时间内通过Blackboard Learn平台在线提交,并包含所有相关文件。 适合人群:计算机科学专业的高年级本科生或研究生,尤其是对人工智能和机器学习有一定基础知识的学生。 使用场景及目标:该作业帮助学生掌握数据处理、模型构建与评估的方法,提高解决实际问题的能力。学生可以在实际操作中应用理论知识,理解不同算法的特点及其应用场景。 其他说明:文档强调了作业的独立性和原创性,要求学生自行完成并避免抄袭。此外,还包括详细的评分标准和预期的作业时间投入。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 11浏览¥ 14.90
- 内容概要:本文档为CS3AM模块的人工智能与机器学习课程提供了详细的作业指南。作业要求学生选择一个数据集,提出一个需要解决的问题,构建并比较两个不同的机器学习模型(其中一个必须基于深度学习架构),并基于实验结果进行结论和推荐。作业评分标准分为数据选择与预处理、建模、评估、代码质量和报告质量五个部分。提交的材料应包括一份报告、所用数据集以及带有注释的Python脚本。课程讲师规定了20小时的工作时间,提交截止日期为2024年12月9日中午。 适合人群:正在修读计算机科学相关专业,尤其是对人工智能与机器学习感兴趣的学生。 使用场景及目标:①帮助学生深入了解机器学习模型的构建与评估过程;②提高学生的数据分析和编程能力;③培养独立解决问题的能力,确保学生能够完成从选题到建模的全过程。 其他说明:作业需要在规定时间内独立完成,不得抄袭他人的工作,同时需要注意学术诚信。提供的链接可以帮助学生找到合适的公开数据集。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 17浏览¥ 9.90
- 内容概要:本文档详细介绍了2024年神经人因工程数据挑战的任务和评估标准。主要内容涵盖实验背景、任务描述(主任务和附加任务)、数据要求以及提交指南。数据挑战的目标是训练学生进行假设检验和数据分析的基本技能,特别是在fNIRS成像背景下研究外科手术的认知表现。主任务要求对预处理的数据进行分割和整合分析,验证特定的假设,如新手和资深医生在前额叶激活模式上的差异。附加任务则要求从原始数据开始,设计并实施自定义的处理和分析管道,进一步验证分析结果。 适用人群:神经科学、生物医学工程及相关领域的研究生及研究人员。 使用场景及目标:适用于学术研究项目,帮助学生掌握fNIRS数据处理和分析技巧,提升实验设计和数据解读能力。同时,通过对实际数据的操作,增强学生的批判性和创造性思维。 其他说明:文档提供了详细的评分标准和提交指南,确保参与者能够明确了解期望成果及其评价方式。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 10浏览¥ 9.90
- 内容概要:本文探讨了扩散模型作为统一表示学习器在图像生成和分类任务中的性能。研究人员发现,通过适当选择噪声步长、特征块号和池化大小,扩散模型能够提取有用的特征用于图像分类任务。在ImageNet上进行的线性探测实验表明,与BigBiGAN相比,扩散模型在无条件图像生成和分类任务上均表现出色。此外,研究还比较了不同数据集下的细粒度视觉分类(FGVC)性能,展示了扩散模型在不同任务中的广泛适应性。 适合人群:计算机视觉和深度学习领域的研究人员、工程师和技术爱好者。 使用场景及目标:① 提供一种新的方法将扩散模型应用于图像分类任务;② 探索不同超参数对特征提取的影响;③ 为未来的自我监督学习模型提供理论支持。 其他说明:本文提出了多项改进措施,如多层感知机(MLP)、卷积神经网络(CNN)和注意力机制等,进一步提高了分类任务的性能。未来的研究可以集中于自动选择和组合特征,以提高迁移学习的可靠性。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 7浏览¥ 9.90
- 内容概要:本文档介绍了澳门大学EIE440选修实验课“电子电路计算机辅助设计”的课程安排和实验内容。主要涉及OrCAD软件的基本操作和电路仿真技巧,包括电路绘制、参数设置、直流特性分析、交流小信号频率响应、瞬态分析等。课程旨在培养学生的实际操作能力和解决问题的能力,提高对电子电路设计的理解和掌握。 适合人群:适用于具有基础电路知识并希望深入学习电子电路仿真分析的本科生或研究生。 使用场景及目标:本课程通过一系列实验帮助学生掌握OrCAD/Capture和PSpice的功能及其应用场景,从而能够独立完成电路设计和仿真实验,为未来的研究和工程实践打下坚实的基础。 其他说明:课程评价标准包括实验成绩(10%)、期中考试(20%)和期末考试(50%),并且每个实验完成后需要撰写实验报告。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 6浏览¥ 9.90
- 内容概要:本文主要探讨了自适应麦克风排列和数量的多通道语音分离技术,特别是解决麦克风位置变化带来的不稳定性问题。作者提出了一种基于滤波求和网络(FaSNet)的新方法——变换平均连接法(TAC)。这种方法可以在多个麦克风输入的情况下,有效提高语音分离性能,尤其是在随机分布的麦克风阵列配置下。通过对多种模型配置的实验,证明了TAC不仅适用于固定几何阵列,还能在不同数量和排列的麦克风情况下保持鲁棒性和高效性。 适合人群:对多通道信号处理和深度学习在语音处理中的应用感兴趣的科研人员和技术开发者。 使用场景及目标:① 针对复杂声场环境下的多通道语音分离任务,如噪声抑制和混响去除;② 提高不同麦克风配置下系统的稳定性和鲁棒性。 其他说明:本文提供了详细的实验结果和比较,展示了TAC在不同条件下的优越性能。同时,讨论了TAC模块的设计理念及其在现有模型中的无缝集成方法。 -可实现的-有问题请联系博主,博主会第一时间回复!!!0 6浏览¥ 9.90