- 机器翻译技术的发展为跨语言沟通提供了强大的工具。从基于规则的系统到统计学习方法,再到现代的神经网络模型,每一代技术都为解决语言障碍带来了新的解决方案。随着深度学习技术的不断进步,预训练语言模型的出现,机器翻译将继续在准确性和自然性方面取得突破。通过本文的介绍和代码示例,读者应该能够对机器翻译的技术有了更深入的了解,并能够在实际项目中应用这些技术。随着技术的不断发展,机器翻译将继续在NLP领域扮演重要角色。0 7浏览会员免费
- 内容概要:本文详细介绍了如何编写高质量的AI提示词,主要内容涵盖了四大要素:指令、上下文、输出格式和角色。文章强调了每一个要素的具体含义和实际应用方法,并通过多个实例展示了清晰的指令、完整的上下文、明确的输出格式和合适的角色设定如何共同作用以提高AI生成内容的质量。此外,还讨论了提示词工程的常见策略和技术,如撰写清晰的指令、给模型‘思考’的时间、将复杂任务拆分为简单任务、接入外部工具和资料等,帮助读者更好地利用AI进行各类任务。 适合人群:AI开发者、提示词工程师、自然语言处理研究者、技术内容创作者。 使用场景及目标:适用于需要利用AI生成高质量文本的场景,旨在帮助用户编写高效的提示词,提高AI生成内容的准确性和实用性。 其他说明:文章原创作者宝玉,原文下载地址https://baoyu.io/blog/how-to-write-good-prompt0 15浏览免费
- ReST-MCTS*: LLM Self-Training via Process Reward Guided Tree Sea0 10浏览会员免费
- LongReward: Improving Long-context Large Language Models with AI0 8浏览会员免费
- python ai pytorch.pdf0 7浏览免费
- 内容概要:本文介绍了 AI 在业务和组织发展中起到的重要作用及其实际应用案例。UMU 创始人李东朔分享了他在 AI 方面的探索经历,重点讨论了大模型在提高工作效率、优化人才发展等方面的应用。文章强调了 AI 力的重要性,提出通过角色扮演、技能指导等方式与大模型有效互动,解锁其最大潜能。文中还提出了 AI 使用的五级评估体系,提倡建构式地使用大模型而非仅仅复制粘贴其输出。 适合人群:企业管理人员、HR 从业者、IT 人员、培训与发展领域的专业人士。 使用场景及目标:① 提高个体与团队的生产力和创新能力;② 优化销售培训和客服服务质量;③ 构建高效的学习平台,推动个人和组织的持续进步。 其他说明:文章呼吁大家开放心态接受 AI 技术,积极尝试和实践,通过有效的提示词设计提升工作效能。同时提醒,在使用 AI 时应注意区分事实与虚构,避免滥用,确保伦理和法律层面的正确性。0 15浏览¥ 19.90
- 联想H100 GPU服务器0 13浏览会员免费
- 与英文综述文章的定位不同,中文版书籍更注重为大模型技术的入门读者提供讲解,为此我们在内容上进行了大幅度的更新与重组,力图展现一个整体的大模型技术框架和路线图。本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的技术书籍。0 16浏览免费
- 随机信号处理课程课件(西电)0 7浏览会员免费
- 全面深入探讨了ChatGPT这一强大自然语言处理模型的基础理论、实现方法、应用场景及其未来发展,包括自媒体行业、IT行业中的具体应用和挑战。书中通过丰富的实例和详细的案例解析,揭示了ChatGPT强大的自然语言生成能力,同时强调了技术的伦理性与安全性,以及未来的潜在机遇。本文展示了ChatGPT在对话生成、文本生成、推荐系统等领域的广泛用途,同时指出了在隐私保护等方面的技术挑战。 适合人群:对自然语言处理感兴趣的研究者、技术人员、高校学生及相关行业的从业人员。 使用场景及目标:了解和掌握ChatGPT的技术细节、应用场景,以及如何在实践中运用ChatGPT提高工作效率,优化业务流程,尤其是在自媒体、IT开发等领域的具体实践。0 11浏览会员免费
- 内容概要:本文详细介绍了云原生技术和AI结合的应用实践,包括Serverless与AI、AI原生应用架构、函数计算在不同场景下的应用、AI可观测体系、容器存储与网络的高级监控技术。重点讲述了阿里云的多项技术创新和服务能力,如Serverless基础设施的弹性特性、AI在开发过程中的智能化辅助、以及多云场景下的容器可观测能力建设。 适合人群:具备云计算基础知识的研发人员和技术管理人员。 使用场景及目标:适用于需要将AI和云原生技术结合的企业和个人开发者,特别是在面对高峰流量、大数据处理、机器学习等复杂业务场景时,可以通过本文了解到相关技术的应用方法和最佳实践。 其他说明:本文不仅提供了理论知识,还包含了大量实战案例,帮助读者更好地理解和应用所学到的知识。0 8浏览¥ 19.90
- datawhalechina的llm-universe教程0 12浏览免费
- —Semantic code search is about finding semantically relevant code snippets for a given natural language query. In the state-of-the-art approaches, the semantic similarity between code and query is quantified as the distance of their representation in the shared vector space. In this paper, to improve the vector space, we introduce tree-serialization methods on a simplified form of AST and build the multimodal representation for the code data. We conduct extensive experiments using a single corpu0 13浏览免费
- 2022BDCI-工业知识图谱关系抽取-高端装备制造知识图谱自动化构建top2方案0 16浏览免费
- [MDPI水刊-非SCI]Program Code Generation with Generative AIs0 15浏览免费
- Evolving code with a large language model0 16浏览免费
- 微软平台的openai接口使用指南0 12浏览免费
- 本教程主要基于扣子开发定制化的AIagent流程,里面描述了扣子功能的介绍、使用方法,对于基于扣子构建定制化知识库有较大的帮助0 15浏览会员免费
- 内容概要:本文档介绍了计算语言学课程中的一项作业,要求学生使用正则表达式和Unix命令对瑞士阿尔卑斯俱乐部(SAC)年鉴语料库以及Project Gutenberg提供的书籍进行一系列搜索和分析任务。具体任务包括词频统计、特定词性的识别、字母组合的统计等。 适合人群:具备基本编程基础的计算语言学专业学生或研究者。 使用场景及目标:适用于计算语言学课程中的编程练习,帮助学生掌握正则表达式的使用方法,加深对自然语言处理的理解。 其他说明:本作业旨在让学生通过实际操作加深对理论知识的理解,并培养解决复杂文本处理问题的能力。0 17浏览免费
- 详细讲解如何使用chatGPT,包括VPN,账号申请,使用技巧等0 31浏览免费
- 内容概要:本文详细介绍了ChatGPT的工作原理,重点讨论了其背后的技术细节。ChatGPT 是由 OpenAI 开发的大规模语言模型(LLM),利用了先进的 Transformer 架构和大量的训练数据。文中还对比了 GPT-2 和 GPT-3 的不同之处,并解释了模型参数、层数和注意力机制等关键概念。此外,文章探讨了 ChatGPT 在自然语言生成和对话系统中的实际应用场景。 适合人群:对自然语言处理、深度学习以及大规模语言模型感兴趣的开发者和研究人员。 使用场景及目标:①了解 ChatGPT 的内部架构和技术原理;②探索如何在自己的项目中使用 ChatGPT 进行文本生成和对话系统开发;③比较不同版本的 GPT 模型的性能特点。 其他说明:本文不仅涵盖了技术层面的内容,还提供了大量实用的例子和应用场景,帮助读者更好地理解和应用 ChatGPT 技术。0 11浏览免费
- 内容概要:本文介绍了如何使用自然语言处理(NLP)中的上下文无关文法(CFG)和成分句法分析来构建一个简单的语法检查器。任务分为三部分:构造一个玩具语法、利用图表解析器进行成分句法分析以及性能评估和错误分析。首先定义英语的CFG规则,并将其用于解析输入句子的词性标记序列。其次,通过比较预测结果和真实标签计算精度和召回率,并对误判原因进行分析。 适用人群:适用于初学者到中级水平的自然语言处理研究者和开发者。 使用场景及目标:适用于NLP课程作业、个人项目或学术研究中,主要目标是掌握CFG的基本原理及其应用,提升NLP模型的设计和评估能力。 其他说明:作业提供了一些资源链接和实用建议,鼓励学生多交流、查阅相关资料,并及时解决问题。最终需要提交报告、源代码及相关文档。0 14浏览免费
- AIGC:开启人工智能内容创作的新纪元0 23浏览会员免费
- 内容概要:本文探讨并实施了一种基于多神经网络的自动化简答题评分(ASAG)系统。该系统结合最新的深度学习技术解决了评分中的各种挑战,包括基于语义相似度的方法去除背景文本造成的噪音影响,以及运用图谱技术捕捉答题文本间复杂知识实体间的关系,并通过一系列优化措施提升了评分精准性,如基于注意力机制设计模型过滤无效文本信息、改进SimGNN网络用于图谱相似性分析以及引入融合评分网络整合不同类型评分策略。研究还设计了应用于校本智能化教学管理系统的评分工具软件,并在多个测评案例中证明该系统优于传统的自动评分系统。 适用人群:专注于智慧教育、自然语言处理或自动化评价技术研发的研究人员和工程师,以及教育信息化从业者和教学评估机构负责人。 使用场景及目标:适用于教学活动中的主观题考核场景下实现自动化评分的应用落地。该系统的目标是取代传统的人工批阅形式以降低成本和提高工作效率。 其他说明:这项工作填补了一些特定学科领域内的评分算法移植困难的空缺,也为未来的评分方法提供了理论支持和技术路径,有望引领新一轮AI辅助的教学评价系统创新和发展。0 13浏览会员免费
- 内容概要:提出了利用大型语言模型、注意力机制以及向量数据库检索等技术构成的认知、泛化和持续学习的决策模型,增强了自动驾驶决策的场景解读力及可解释性,在仿真环境下验证了其优越性和可靠性。 适用人群:适用于研究人员、自动驾驶开发者及相关专业人士。 使用场景及目标:针对高速公路等高速动态环境中无人驾驶汽车的任务决策需求设计解决方案,旨在改善驾驶行为合理性及安全性。 其他说明:知识驱动模型(KDM)相比现有的数据驱动和规则驱动决策方式,在仿真测试中实现了更高的安全性水平,并证明拥有较好的迁移学习能力。0 12浏览会员免费
- 人工智能前沿资料0 55浏览免费
- 为了让大语言模型的AI能力更贴近业务需求,本文详细介绍了在阿里云百炼创建自定义模型的最佳实践。即便不清楚大模型的技术细节,您也能按照本篇的操作指引创建一个有效的自定义模型,从而轻松地为业务场景添加大模型服务能力。 自定义模型概述 自定义大模型是指基于通用大语言模型,通过微调和训练,能更好地适应特定领域或任务的大语言模型。 为什么选择自定义模型? 提高特定领域的准确性:通用的大语言模型尽管强大,但在处理特定领域的任务时,可能会因为缺乏领域特定知识而表现不佳。自定义大语言模型通过领域特定的数据进行重新训练,可以显著提高在该领域的表现和准确性。 增强模型的适用性:自定义大语言模型可以根据特定应用场景的需求进行微调,使其更好地适应特定任务。例如,在客户服务中,自定义模型可以更好地理解和回应客户的特定问题,提高客户满意度。 节约开发时间和成本:利用现有的大语言模型进行定制化训练,比从头开发一个模型要节约大量时间和成本。您可以快速部署自定义模型,满足业务需求。 增强品牌和用户体验:自定义大语言模型可以根据企业的品牌语言风格进行调整,确保输出内容的一致性和品0 24浏览免费
- AScalable Front-End Architecture for Fast Instruction Delivery0 15浏览免费
- Knowledgeable Verbalizer论文阅读笔记0 18浏览会员免费
- Hands on Large Language Models 杰伊·阿拉姆玛 和马尔滕·格罗滕多斯特的书籍0 26浏览会员免费
- c语言666666660 7浏览免费
- 人民大学大语言模型391页pdf0 13浏览会员免费
- 腾讯云 ES 结合 AI 技术,推出向量检索能力,实现文本、图像的多模态智能搜索。通过内置模型和机器学习节点,提供从向量生成到检索的全流程服务。同时,结合 LLM 大模型、腾讯云内核优化特性,持续优化查询转换和数据向量化能力,为 打造高效、准确的 RAG 系统 提供一站式解决方案。0 53浏览免费
- 涵盖中国诸多行业应用场景,包涵实战案例等等0 41浏览会员免费
- 内容概要:本文介绍了MJ进阶操作方法及其关键词与参数设置。主要内容包括:不同风格模型的特点及应用,如Mid、niji、niji 3D、niji可爱和niji场景等五个模型的特色风格呈现,帮助创作者利用正确的描述方式和关键词提高作品的质量;以及介绍反推描述词、精简描述词和其他指令的应用技巧和注意事项。通过对各种描述词格式的学习掌握更多创作技法,从而使得最终画面具有更高的画质水平,更加丰富的视觉层次和风格特性。 适用人群:适用于熟悉基本创作流程并想深入了解不同绘图风格、优化创作效果的设计工作者。 使用场景及目标:针对不同类型的作品创作时选择合适的风格模型进行绘画练习或者商业设计,以达成符合个人或项目风格的目标要求。 阅读建议:由于本文涉及到多种模型和参数配置,建议仔细学习不同风格模型的特点并加以实际练习,对于不明确的术语可通过查找补充资料辅助理解,并不断实验尝试找出最适合表达自己创意的方式。0 30浏览免费
- 内容概要:本文介绍了Mindjourney(MJ)绘图平台的基本操作方法,主要内容包括使用官网与镜像站生成图像的基础步骤、详细技巧指令如文生图、放大修改细节、变换图像比例、更改配置设定等方面的操作流程与要点解析,旨在帮助用户更好地掌握和应用MJ的特色功能。 适合人群:对Mindjourney感兴趣并希望了解基础绘制技巧的初学者。 使用场景及目标:利用提供的命令指导实践,如创建新作品、编辑现有图形,以及通过调整不同模型配置选项实现个性化的艺术创作。 其他说明:文章还包含了如何切换不同的绘画风格和操作模式、指定作品宽高比等附加说明,便于创作者依据具体需要定制化自己的作品表现形式。0 27浏览免费
- 著名机器学习和AI研究员、畅销书《Python 机器学习》的作者Sebastian Raschka近日发布了新书《Build a Large Language Model (From Scratch)》。 书中的代码:https://github.com/rasbt/LLMs-from-scratch0 167浏览会员免费
- Llama 3.1,是Meta于2024年7月发布的产品。 2024年7月24日消息,NVIDIA宣布推出新的NVIDIA AI Foundry服务和NVIDIA NIM推理微服务,与Meta刚推出的Llama 3.1系列开源AI大模型配合一起部署使用。0 43浏览会员免费
- 本文提供了多个关于大模型的应用实例和实践经验,其中包括电商、制造、娱乐和医疗等多个领域的具体应用案列和技术解决方案,如金融领域内的信息提取及文本分类,游戏中的图像内容自动生成,制药业内的药物研发辅助技术等;展示了大模型在各领域的创新潜力和发展可能性。本文着重介绍了各项应用场景的技术路线选择,技术亮点,实现方式,实施效果及其对企业或社会的具体贡献。 适合人群:对于那些期望在各自行业内推动技术进步的企业领导与技术人员尤其适用,亦适合希望拓宽视野的研究学者和技术爱好者。 使用场景及目标:无论是寻求技术创新的企业、需要掌握最新技术趋势的研究者,还是对大模型应用感兴趣的各界人士,都能够从中获益,发现潜在的产业升级途径或是研究方向。 此外,本文档详尽阐述了一些具体模型的特点及它们如何满足各自的行业需求,对于有意借鉴这些解决方案的人,提出了针对性的建议与展望。 主要目的是互相学习分享下找到的目前大模型的一些应用实例0 61浏览免费
- 使用 ArcGIS 3D Analyst 扩展模块来分析对3D飞行路径和走廊的威胁0 40浏览会员免费
- Web Application Development with R Using Shiny,R,Shiny0 13浏览会员免费
- R Graphics,R绘图教程0 9浏览会员免费
- 2022 年底,ChatGPT 震撼上线,大语言模型技术迅速“席卷”了整个社会,人工智能技术因此迎来了一次重要进展。面对大语言模型的强大性能,我们不禁要问:支撑这些模型的背后技术究竟是什么?这一问题无疑成为了众多科研人员的思考焦点。 必须指出的是,大模型技术并不是一蹴而就,其发展历程中先后经历了统计语言模型、神经网络语言模型、预训练语言模型等多个发展阶段,每一步的发展都凝结了众多科研工作者的心血与成果。作为大语言模型技术的重要推动者,OpenAI公司引领了本次技术变革,让我们再次回顾其针对大模型技术的研发历程。2015年,OpenAI 公司正式创立,开始探索通用人工智能的技术路线。早期的OpenAI团队围绕强化学习、多模态、语言模型等几个重要方向进行了深入研究。其中,由Ilya Sutskever 领导的团队主要关注语言模型的研究。当谷歌2017 年推出基于注意力机制的Transformer 模型后,OpenAI 团队迅速洞察到了其潜在的优越性,认为这种模型可能是一种大规模可扩展训练的理想架构。基于此,OpenAI 团队开始构建GPT 系列模型,并于2018 年推出了第一代GPT 模型0 54浏览免费
- 内容概要:本文章详细介绍了 LLVM 核心库的功能及其编译安装流程,覆盖不同操作系统环境。文章深入探讨了工具库的具体实现细节,提供了多种实用工具的实际使用案例,包括如何使用 Clang 工具和库来提升开发效率。进一步解释了如何编写和集成 LLVM 工具,展示了从简单的编译任务到复杂工具集的应用实践。 适合人群:软件开发者和技术研究人员,尤其是对LLVM编译器生态有着浓厚兴趣的人群。具备一定技术水平,寻求使用LLVM工具改进现有开发流程的专业人士。 使用场景及目标:适用于希望理解和利用 LLVM 生态系统中的组件提高编译效率的研发人员。通过动手实践了解 LLVM 内部机制,进行跨平台编译任务,并能开发定制化分析和编译工具。 其他说明:此资料包含了 LLVM 版本选择与编译指导,为开发者使用 LLVM 核心理提供了丰富的实践经验和教程支持。0 31浏览免费
- Benchmarking Foundation Models with Language-Model-as-an-Examine0 30浏览会员免费
- CHATGPT176个对话prompt分享。所谓ChatGPT的基本功核心是学会设置 Prompt ,Prompt 你可以理解成「提示语」,他的目的是让ChatGPT进入某种对话模式。在ChatGPT中,prompt 通常指的是一个输入的文本段落或短语,作为生成模型输出的起点或引导。prompt 可以是一个问题、一段文字描述、一段对话或任何形式的文本输入,模型会基于 prompt 所提供的上下文和语义信息,生成相应的输出文本。0 26浏览免费
- NLP实战(基于云行工作室自然语言处理指导书)0 28浏览会员免费
- 探索AI时代的组织如何进化,以及传统组织如何加速向AI组织转 型0 19浏览会员免费
- 本文档运用比喻的手法把深奥的原理形象化,让你快速的理解和掌握激光雷达的原理和各种参数的意义,让你快速成为激光雷达的专家,本文档详细探讨了车载激光雷达的发展历程和关键技术。首先,回顾了激光雷达从早期的大型高成本设备到现代的小型化、低成本应用的演变。接着,比较了不同类型的激光雷达,包括时间飞行法(ToF)、调频连续波法(FMCW)、闪光式(Flash)等,各自的优缺点和应用场景。文章还介绍了激光雷达系统的基本架构,包括收发链路、光学组件和数据处理算法。最后,详细解析了激光雷达的性能指标,如点云密度、分辨率及其在车载场景中的功能需求,以及解决弱势场景的策略。0 63浏览¥ 19.90
- "Prompt"(提示)在人工智能和机器学习领域,尤其是在自然语言处理(NLP)中,是一个重要的概念。在与人工智能助手如我进行交互时,"prompt"通常指的是用户输入的文本,它用来引导或请求特定的信息、服务或行为。0 23浏览会员免费
- 内容概要: 本文档详尽地介绍了LLAMA3模型的全生命周期管理,包括从基础的模型下载与配置,到高级的微调、量化、部署以及实际应用。特别强调了RAG技术在知识库向量化中的应用,以及如何利用LLAMA3进行有效的自然语言处理任务。 适用人群: 本文档适合自然语言处理(NLP)领域的研究人员、开发者以及对AI模型部署感兴趣的技术人员。无论是希望提升模型性能的研究者,还是需要将模型集成到实际应用中的工程师,都能从本文档中获益。 使用场景及目标: 场景一:研究人员在进行NLP相关研究时,需要对LLAMA3模型进行微调以适应特定的任务需求。 场景二:开发者希望将LLlama3模型部署到生产环境中,需要了解如何进行模型量化和优化以减少资源消耗。 场景三:企业用户希望利用RAG技术构建知识库问答系统,需要指导如何整合LLAMA3模型与向量数据库。 其他说明: 本文档不仅提供了详细的步骤和代码示例,还包含了常见问题解答和最佳实践建议,旨在帮助用户更高效地使用LLAMA3模型。此外,文档还涉及了如何在Google Colab等云平台上进行操作,降低了入门门槛,使得更多人能够轻松上手。0 102浏览免费
- 《中国AI Agent应用研究报告 2024》中,我们总结了截至2024年第二季度的大模型最新进展,深入剖析了AI Agent的技术架构,并探讨了理想与现实中AI Agent的差距。本研究还将全面审视AI Agent产品在当前市场的多元化应用,重点聚焦教育、金融、文娱游戏、消费等关键行业。0 48浏览会员免费
- AI素养兴起的时代背景: AI技术已成为现代社会和经济发展的基石,影响日常生活与工作模式。 AI的应用领域广泛,从高科技行业到传统产业和文化创意产业。 联合国教科文组织强调所有公民都需要具备一定程度的AI素养。 素养的演变: 从最初的阅读与写作能力,发展到信息素养和数字素养,再到现在的AI素养。 AI素养要求人们具备基本的AI技术知识和应用技能,以及预见和评估AI技术对社会、经济和文化的影响。 AI素养的内涵: AI素养不仅包括技术层面的掌握,还涉及对未来的深度理解和准备。 包括理解AI概念、在不同场景下使用AI、评估和创造AI、伦理和社会问题的考量。 AI素养的框架: 基于KSAVE模型,包括知识、技能、态度、伦理、价值观五个关键领域。 与信息素养和数字素养的关系,强调跨学科性、多维性和发展性。 高校图书馆AI素养教育实施路径: 图书馆在AI素养教育中的作用,包括提供AI信息资源和专业指导。 构建跨学科知识体系,提供AI知识资源,鼓励学术创新实践。 提供AI应用培训课程,培养学生的AI评估能力,提供AI创新和开发支持。 道德觉醒与责任担当,包括提供AI伦理教育和整合AI伦理0 20浏览免费
- 书生训练营0 20浏览免费
- 书生训练营0 25浏览免费
- 书生训练营0 16浏览免费
- A New Semantic Similarity Scheme for more Accurate0 72浏览会员免费
- 数据结构是计算机科学中的重要组成部分。它们定义了数据的组织、管理和存储方式,使得数据能够高效地访问和修改。理解数据结构不仅对算法设计至关重要,还对编程效率有着直接影响。 在这篇教程中,我们将介绍几种常见的数据结构,包括数组、链表、栈、队列、树、图以及哈希表。每种数据结构的特点、实现方式及其应用场景都会进行详细探讨。0 50浏览会员免费
- google发表的Transformer论文,现代AI变革的理论基础。0 24浏览会员免费
- 在大模型的预训练中,数据准备与清洗是首要步骤,直接影响模型的性能和泛化能力。数据的收集应覆盖尽可能广泛的领域,确保多样性和代表性。清洗过程包括去重、去噪声、格式规范化和敏感信息过滤等,以保证数据质量。此外,还要进行数据标注,特别是当指令微调涉及到特定任务时,数据标签的准确性至关重要。 模型选择方面,不同的任务需要不同的模型架构。主流大模型架构有Encoder-Decoder、Causal Decoder和Prefix Decoder等。Encoder-Decoder适用于输入输出都需要理解的任务,如翻译;Causal Decoder主要用于文本生成;Prefix Decoder则在要求高效推理的场景中更具优势。每种架构的选择需要结合任务需求、资源情况及模型性能表现来综合考量。 在模型结构上,层数、隐藏单元、注意力头数等配置需谨慎调节。更深的层数和更多的隐藏单元可以提升模型能力,但也会增加训练时间和计算资源需求。针对大模型,诸如Flash Attention和Paged Attention等优化技术可以显著提升训练效率。 参数配置方面,包括学习率、批次大小、权重衰减等的设定,对训练0 81浏览免费