- vocab大小:226KBE-vocab.txtE-vocab.txt0 22浏览免费
- TXT大小:8MB内有数百种歌曲MV内有数百种歌曲MV0 9浏览免费
- 提示词大小:9KB据说这套提示词将Claude解决问题的思维能力提升到了堪比ChatGPT o1 preview的水平。据说这套提示词将Claude解决问题的思维能力提升到了堪比ChatGPT o1 preview的水平。0 117浏览免费
- 提示词大小:11KB据说这套提示词将Claude解决问题的思维能力提升到了堪比ChatGPT o1 preview的水平。据说这套提示词将Claude解决问题的思维能力提升到了堪比ChatGPT o1 preview的水平。0 96浏览免费
- 自然语言处理大小:10MB命名体识别训练文本,注意修改文件名为:1980_01rmrb.txt命名体识别训练文本,注意修改文件名为:1980_01rmrb.txt0 22浏览免费
- transformer大小:852KB内容概要:本文汇集了一系列带有种族、地域、性别倾向的内容片段。涵盖了对各类人群的态度与看法,如针对黑人的种族偏见,不同地区的地域歧视现象,以及两性之间的互动与误解等问题的探讨。 数据达5000行;简单示例讲解: 1567, test, region, 0, 0, 非常对!!!宁夏南部的话就是秦陇方言系的,但是北部的话就不一样。中部就是杂交。甘肃南北繁衍差异巨大,北疆的方言就只是变体的普通话,陕西秦陇方言的发源照样有一堆不一样。 ID: 1567 数据集划分: test 分类主题: region 标签1: 0(可能表示无此特征) 标签2: 0(无补充信息) 文本: 非常对!!!宁夏南部的话就是秦陇方言系的...内容概要:本文汇集了一系列带有种族、地域、性别倾向的内容片段。涵盖了对各类人群的态度与看法,如针对黑人的种族偏见,不同地区的地域歧视现象,以及两性之间的互动与误解等问题的探讨。 数据达5000行;简单示例讲解: 1567, test, region, 0, 0, 非常对!!!宁夏南部的话就是秦陇方言系的,但是北部的话就不一样。中部就是杂交。甘肃南北繁衍差异巨大,北疆的方言就只是变体的普通话,陕西秦陇方言的发源照样有一堆不一样。 ID: 1567 数据集划分: test 分类主题: region 标签1: 0(可能表示无此特征) 标签2: 0(无补充信息) 文本: 非常对!!!宁夏南部的话就是秦陇方言系的...0 13浏览免费
- 机器学习大小:7KB内容概要:本文详细阐述了大模型评测的概念、目的及其终极目标,并从性能和表达两大维度深入讲解了评测的具体标准和方法。其中,性能包括响应速度、资源消耗和成本控制等技术指标;表达方面涵盖了安全性、指令跟随准确性、内容帮助性和语言流畅度等,每个维度下又细分为具体的衡量准则。同时介绍了常用的两种评测方法——对比法和评分法,以及如何构建有效的评测集。最后,文章还探讨了评测报告的形式与内容,旨在通过系统化、全面的方式优化大模型的各项能力和用户体验。 适合人群:从事机器学习尤其是自然语言处理领域的研究人员和技术开发者,以及其他对AI模型效能评价感兴趣的专业人士。 使用场景及目标:适用于需要评估并提升大型预训练模型如ChatGPT、BERT等表现的企业和个人研究团队,目的在于提高模型的安全稳定性、指令解析准确性、输出内容的价值和多样性及语义表达质量,从而增强产品竞争力和市场影响力。 阅读建议:建议读者先大致浏览全文了解总体结构,再逐项精读各评测维度和标准,注意对照自身的业务场景找到最适合自己的评测点。同时,实践中应注意收集真实的用户反馈以指导模型调优方向。内容概要:本文详细阐述了大模型评测的概念、目的及其终极目标,并从性能和表达两大维度深入讲解了评测的具体标准和方法。其中,性能包括响应速度、资源消耗和成本控制等技术指标;表达方面涵盖了安全性、指令跟随准确性、内容帮助性和语言流畅度等,每个维度下又细分为具体的衡量准则。同时介绍了常用的两种评测方法——对比法和评分法,以及如何构建有效的评测集。最后,文章还探讨了评测报告的形式与内容,旨在通过系统化、全面的方式优化大模型的各项能力和用户体验。 适合人群:从事机器学习尤其是自然语言处理领域的研究人员和技术开发者,以及其他对AI模型效能评价感兴趣的专业人士。 使用场景及目标:适用于需要评估并提升大型预训练模型如ChatGPT、BERT等表现的企业和个人研究团队,目的在于提高模型的安全稳定性、指令解析准确性、输出内容的价值和多样性及语义表达质量,从而增强产品竞争力和市场影响力。 阅读建议:建议读者先大致浏览全文了解总体结构,再逐项精读各评测维度和标准,注意对照自身的业务场景找到最适合自己的评测点。同时,实践中应注意收集真实的用户反馈以指导模型调优方向。0 31浏览免费
- 提示词大小:731B浦语提示词设计(LangGPT)浦语提示词设计(LangGPT)0 20浏览免费
- TXT大小:3KB实操实操实操实操实操实操实操实操实操实操实操实操0 30浏览免费
- 数据集大小:891KB推荐系统数据集:慕课学生课程观看序列数据集推荐系统数据集:慕课学生课程观看序列数据集0 66浏览免费
- 生活娱乐大小:9MB推荐系统,用户观看电影序列数据集推荐系统,用户观看电影序列数据集0 34浏览免费
- bert大小:936Bwin环境的bert模型部署需求包win环境的bert模型部署需求包0 24浏览免费
- 自然语言处理大小:202Bnlp, llm, 搜广推常用word2vec预训练模型,使用范围广泛nlp, llm, 搜广推常用word2vec预训练模型,使用范围广泛0 302浏览免费
- 提示词大小:1KB书生大模型实战营第三关浦语提示词工程实践书生大模型实战营第三关浦语提示词工程实践0 66浏览免费
- 软件/插件大小:24KBps软件下载?:。!??ps软件下载?:。!??0 27浏览免费
- 范文/模板/素材大小:2KBtxt文档数据集测试需要txt文档数据集测试需要0 23浏览免费
- 提示词大小:1KB提示词提示词0 43浏览免费
- TXT大小:7KB静心修行之太上内观感应篇静心修行之太上内观感应篇0 41浏览免费
- 自然语言处理大小:130B选取清洗分词后的wiki中文语料(约2.2G)训练,维度为300,解压后文件大小9.19 GB,可用于词嵌入模型学习。选取清洗分词后的wiki中文语料(约2.2G)训练,维度为300,解压后文件大小9.19 GB,可用于词嵌入模型学习。0 56浏览免费
- 人工智能大小:3KB给 Prompt打分以及提出修改建议的Judger Prompt 生成器主要是用来解决两个问题: 1. 重复的写框架结构 --> 自动生成 2. 一些套话的重复强调 --> 生成后微调一下 但别直接用生成的这个Prompt, 一般都需要在Workflow 那块大改一把.. 效果才会更好.给 Prompt打分以及提出修改建议的Judger Prompt 生成器主要是用来解决两个问题: 1. 重复的写框架结构 --> 自动生成 2. 一些套话的重复强调 --> 生成后微调一下 但别直接用生成的这个Prompt, 一般都需要在Workflow 那块大改一把.. 效果才会更好.0 81浏览免费
- transformer大小:33MB基于transformer的机器翻译基于transformer的机器翻译0 39浏览免费
- 数据集大小:3KB不文明用语数据集不文明用语数据集0 35浏览免费
- 自然语言处理大小:55B自然语言转义为CLI命令自然语言转义为CLI命令0 29浏览免费
- 中文分词大小:19KB中文分词 stopword.txt文件中文分词 stopword.txt文件0 56浏览免费
- 自然语言处理大小:23KB内容概要 本资源包含一套综合性的中英文停用词表,总计包含2313个词汇。这些停用词来源于多个权威来源,包括但不限于中文停用词表、哈工大停用词表、百度停用词表以及四川大学机器智能实验室停用词库。这些词表经过精心整合和去重,旨在为中英文文本处理提供一个高效、准确的基础词库。 适用人群 数据科学家和文本分析专家,需要清洗和预处理大规模文本数据。 自然语言处理(NLP)研究人员和学生,寻求优化算法性能和提升数据处理效率。 机器学习工程师和开发者,涉及到文本挖掘、情感分析、主题建模等应用。 任何需要进行高效中英文文本分析和处理的专业人士和爱好者。 使用场景及目标 文本预处理:在文本分析和自然语言处理(NLP)任务中,停用词通常被视为噪声,需要从数据集中去除以提高算法效率和准确性。 搜索引擎优化:通过过滤无意义的停用词,改进搜索算法的相关性和效率。 情感分析:净化文本,保留更有情感色彩的词汇,提高情感分析的准确度。 文本摘要和关键词提取:去除常见但无关紧要的词汇,突出文本的关键信息和主题。 其他说明 该停用词表不仅包含了单个字词,也涵盖了一些常见短语和标点符号,适用于更广泛的文本处理场景。内容概要 本资源包含一套综合性的中英文停用词表,总计包含2313个词汇。这些停用词来源于多个权威来源,包括但不限于中文停用词表、哈工大停用词表、百度停用词表以及四川大学机器智能实验室停用词库。这些词表经过精心整合和去重,旨在为中英文文本处理提供一个高效、准确的基础词库。 适用人群 数据科学家和文本分析专家,需要清洗和预处理大规模文本数据。 自然语言处理(NLP)研究人员和学生,寻求优化算法性能和提升数据处理效率。 机器学习工程师和开发者,涉及到文本挖掘、情感分析、主题建模等应用。 任何需要进行高效中英文文本分析和处理的专业人士和爱好者。 使用场景及目标 文本预处理:在文本分析和自然语言处理(NLP)任务中,停用词通常被视为噪声,需要从数据集中去除以提高算法效率和准确性。 搜索引擎优化:通过过滤无意义的停用词,改进搜索算法的相关性和效率。 情感分析:净化文本,保留更有情感色彩的词汇,提高情感分析的准确度。 文本摘要和关键词提取:去除常见但无关紧要的词汇,突出文本的关键信息和主题。 其他说明 该停用词表不仅包含了单个字词,也涵盖了一些常见短语和标点符号,适用于更广泛的文本处理场景。0 81浏览免费
- TXT大小:3MBNLP - python实现word2vecNLP - python实现word2vec0 30浏览免费
- 软件/插件大小:28B法研杯(CAIL 2019)相似案例匹配任务的源码和数据集,经本人修改,已无报错。 只需配置pytorch环境,即可运行。(or联系本人付费配置环境) 可以完成相似法案自动匹配。 采用改良的bert模型,内含有模型图以及多种测试数据。 共有四种训练模式,准确率最高可达85%。 购买源码附赠使用文档,如有代码问题可加Q:1435665495。法研杯(CAIL 2019)相似案例匹配任务的源码和数据集,经本人修改,已无报错。 只需配置pytorch环境,即可运行。(or联系本人付费配置环境) 可以完成相似法案自动匹配。 采用改良的bert模型,内含有模型图以及多种测试数据。 共有四种训练模式,准确率最高可达85%。 购买源码附赠使用文档,如有代码问题可加Q:1435665495。0 49浏览免费
- 深度学习大小:223KB英汉互译,可用于实现单词翻译,深度学习 部分内容: abandon v.抛弃,放弃 abandonment n.放弃 abbreviation n.缩写 abeyance n.缓办,中止 abide v.遵守 ability n.能力 able adj.有能力的,能干的 abnormal adj.反常的,变态的 aboard adv.船(车)上英汉互译,可用于实现单词翻译,深度学习 部分内容: abandon v.抛弃,放弃 abandonment n.放弃 abbreviation n.缩写 abeyance n.缓办,中止 abide v.遵守 ability n.能力 able adj.有能力的,能干的 abnormal adj.反常的,变态的 aboard adv.船(车)上0 38浏览免费
- ChatGPT大小:1KB最新ChatGPT分享(2024-1月)最新ChatGPT分享(2024-1月)0 363浏览免费
- Fast大小:34KBFastASR-main模型FastASR-main模型0 72浏览免费
- 人工智能大小:2KB提示机制: 这个独特的提示方式,通过特定的结构和指令,让ChatGPT扮演一个专家的角色。它使得AI在回答问题时,能够进行更深入的分析和更准确的信息提供。 好处: 通过这种方式,ChatGPT的回答不仅变得更加精确,而且更能深入理解和回应用户的具体需求。无论是技术问题、学术探讨还是日常咨询,这个提示都能显著提高回答的质量。 使用指南: 本文将介绍如何有效利用这个提示,以最大化AI的回答效果。提示机制: 这个独特的提示方式,通过特定的结构和指令,让ChatGPT扮演一个专家的角色。它使得AI在回答问题时,能够进行更深入的分析和更准确的信息提供。 好处: 通过这种方式,ChatGPT的回答不仅变得更加精确,而且更能深入理解和回应用户的具体需求。无论是技术问题、学术探讨还是日常咨询,这个提示都能显著提高回答的质量。 使用指南: 本文将介绍如何有效利用这个提示,以最大化AI的回答效果。0 55浏览免费
- 自然语言处理大小:256KBNLP语言模型、多模态模型等的中/英文编码字符map表,此文件来源bert模型内容,可供读者查看其内容。NLP语言模型、多模态模型等的中/英文编码字符map表,此文件来源bert模型内容,可供读者查看其内容。0 125浏览免费
- pytorch大小:187KB该资源为博主一篇博客所用到的数据集,为CBOW所用到的数据集,可以帮助读者学习该实验。该资源为博主一篇博客所用到的数据集,为CBOW所用到的数据集,可以帮助读者学习该实验。0 97浏览免费
- 自然语言处理大小:1MB基于ChatGPT-3.5和Claude生成的中文单轮短对话训练集,噪音小,质量高。 #NLP中文训练集 格式:前问后答,用|隔开 例: 早上好吗?|很好,昨晚睡得好。 吃了吗?|还没呢,正要吃。 今天吃什么?|想吃点面食。 最近忙吗?|还行,有点累。 工作顺利吗?|进展不错。 最近在做什么?|准备旅行去了。 身体还好吧?|很好,多谢关心。 今天的天气不错?|是啊,很凉快。 周末有什么计划吗?|打算出去走走。 生活怎么样?|一切顺利。基于ChatGPT-3.5和Claude生成的中文单轮短对话训练集,噪音小,质量高。 #NLP中文训练集 格式:前问后答,用|隔开 例: 早上好吗?|很好,昨晚睡得好。 吃了吗?|还没呢,正要吃。 今天吃什么?|想吃点面食。 最近忙吗?|还行,有点累。 工作顺利吗?|进展不错。 最近在做什么?|准备旅行去了。 身体还好吧?|很好,多谢关心。 今天的天气不错?|是啊,很凉快。 周末有什么计划吗?|打算出去走走。 生活怎么样?|一切顺利。0 187浏览免费
- ANSYSAPDL大小:6KBAPDL输电杆塔命令流APDL输电杆塔命令流0 125浏览免费
- 人工智能大小:3KB人工智能介绍发展前景及生活应用人工智能介绍发展前景及生活应用0 40浏览免费
- 语言模型大小:76B这是一个基于GLM2-6B-32k模型的语言模型,具有32K个参数。GLM2-6B-32k是一种用于自然语言处理任务的预训练语言模型,其中GLM表示General Language Modeling,2表示该模型的层数,6B表示该模型中BERT模型的层数,32K表示该模型的参数总数。该模型可以用于自然语言处理任务,如文本分类、命名实体识别、情感分析等。这是一个基于GLM2-6B-32k模型的语言模型,具有32K个参数。GLM2-6B-32k是一种用于自然语言处理任务的预训练语言模型,其中GLM表示General Language Modeling,2表示该模型的层数,6B表示该模型中BERT模型的层数,32K表示该模型的参数总数。该模型可以用于自然语言处理任务,如文本分类、命名实体识别、情感分析等。0 685浏览免费
- 停用词大小:18KB中文停用词集合, 包含 哈工大,四川大学等各类停用词合集中文停用词集合, 包含 哈工大,四川大学等各类停用词合集0 179浏览免费
- 语言模型大小:50KB搭载1500参数搭载1500参数0 113浏览免费
- 语料库大小:27KB下载后请和程序放在一个目录下载后请和程序放在一个目录0 46浏览免费
- python大小:2KB转载他人的日志封装文件,供学习转载他人的日志封装文件,供学习0 46浏览免费
- 自然语言处理大小:94BChatGPT是一种自然语言处理技术,它是由OpenAI开发的一种基于深度学习的神经网络,旨在生成自然语言对话。GPT是“生成式预训练转换”(Generative Pre-trained Transformer)的缩写,它可以通过预先训练来提高自然语言生成的效率和准确性。ChatGPT是GPT的一个变体,专注于生成对话。ChatGPT的工作原理是使用大量的数据集对其进行训练,然后使用生成式技术来生成自然语言文本。它使用了自注意力机制,可以从输入文本中学习并识别关键字和上下文,并根据此生成新的文本。因为它是一种基于神经网络的技术,所以它可以从大量数据中学习并自我完善。 ChatGPT已经成为一种非常流行的自然语言处理技术,因为它可以用于许多不同的应用程序。例如,它可以用于生成对话,如聊天机器人和客户服务代表。它也可以用于生成自然语言文本,例如文章和新闻报道,甚至可以用于自动生成代码和数据分析。ChatGPT是一种自然语言处理技术,它是由OpenAI开发的一种基于深度学习的神经网络,旨在生成自然语言对话。GPT是“生成式预训练转换”(Generative Pre-trained Transformer)的缩写,它可以通过预先训练来提高自然语言生成的效率和准确性。ChatGPT是GPT的一个变体,专注于生成对话。ChatGPT的工作原理是使用大量的数据集对其进行训练,然后使用生成式技术来生成自然语言文本。它使用了自注意力机制,可以从输入文本中学习并识别关键字和上下文,并根据此生成新的文本。因为它是一种基于神经网络的技术,所以它可以从大量数据中学习并自我完善。 ChatGPT已经成为一种非常流行的自然语言处理技术,因为它可以用于许多不同的应用程序。例如,它可以用于生成对话,如聊天机器人和客户服务代表。它也可以用于生成自然语言文本,例如文章和新闻报道,甚至可以用于自动生成代码和数据分析。0 787浏览免费
- nlp大小:7KB中英文停用词词表中英文停用词词表0 71浏览免费
- 数据分析大小:688B当您在进行收款二维码地推时,可以使用以下话术来提高销售转化率: 针对客户需求:询问客户是否需要一个便捷的收款方式,以便于他们能够更快捷地收取货款。您可以提到,使用二维码收款可以省去很多繁琐的操作,让交易更加方便快捷。 强调安全性:告诉客户,收款二维码是一种安全可靠的收款方式,避免了现金收取的安全隐患。并且,您可以向客户介绍使用收款二维码的安全性措施,如付款方需在自己的手机上确认付款等。 强调低费率:提醒客户使用收款二维码的低费率优势,相比于其他收款方式,费率更低,能够帮助客户降低成本。 同时,使用【地推任务网】这个平台,您可以更加高效地进行收款二维码地推。该平台可以帮助您更精准地定位目标客户,提高地推效率,并提供实时的数据分析和反馈,让您可以更加有效地管理和优化地推过程。当您在进行收款二维码地推时,可以使用以下话术来提高销售转化率: 针对客户需求:询问客户是否需要一个便捷的收款方式,以便于他们能够更快捷地收取货款。您可以提到,使用二维码收款可以省去很多繁琐的操作,让交易更加方便快捷。 强调安全性:告诉客户,收款二维码是一种安全可靠的收款方式,避免了现金收取的安全隐患。并且,您可以向客户介绍使用收款二维码的安全性措施,如付款方需在自己的手机上确认付款等。 强调低费率:提醒客户使用收款二维码的低费率优势,相比于其他收款方式,费率更低,能够帮助客户降低成本。 同时,使用【地推任务网】这个平台,您可以更加高效地进行收款二维码地推。该平台可以帮助您更精准地定位目标客户,提高地推效率,并提供实时的数据分析和反馈,让您可以更加有效地管理和优化地推过程。0 123浏览免费
- 课程资源大小:2KB计算机课程作业毕设 典型作业计算机课程作业毕设 典型作业0 62浏览免费
- 自然语言处理大小:8KBChatGPT是一个基于Transformer架构的自然语言生成模型,它是OpenAI开发的一种强大的自然语言处理模型。该模型利用了深度学习和自然语言处理技术,可以用于文本生成、翻译、问题回答等多种任务。 以下是ChatGPT的实现原理: 1.数据集 ChatGPT的实现基于大规模的自然语言语料库,如维基百科、互联网论坛、新闻报道等。OpenAI通过使用Web爬虫和API获取了这些数据集,并对它们进行了预处理。这些数据集被用来训练ChatGPT的神经网络,以便生成自然语言文本。 2.模型架构 ChatGPT使用的是Transformer架构,它是一种基于注意力机制的神经网络模型。这种模型的优点在于,它可以并行化处理文本序列,并且能够捕捉序列中单词之间的长距离依赖关系。 Transformer模型的架构分为编码器和解码器两部分。在ChatGPT中,只有一个解码器,没有编码器。这是因为ChatGPT主要用于生成文本,而不是处理输入文本。 3.训练模型 在ChatGPT中,模型的训练是通过无监督的方式进行的。在训练过程中,模型的目标是最大化给定一段文本序列的概率。具体来说,模ChatGPT是一个基于Transformer架构的自然语言生成模型,它是OpenAI开发的一种强大的自然语言处理模型。该模型利用了深度学习和自然语言处理技术,可以用于文本生成、翻译、问题回答等多种任务。 以下是ChatGPT的实现原理: 1.数据集 ChatGPT的实现基于大规模的自然语言语料库,如维基百科、互联网论坛、新闻报道等。OpenAI通过使用Web爬虫和API获取了这些数据集,并对它们进行了预处理。这些数据集被用来训练ChatGPT的神经网络,以便生成自然语言文本。 2.模型架构 ChatGPT使用的是Transformer架构,它是一种基于注意力机制的神经网络模型。这种模型的优点在于,它可以并行化处理文本序列,并且能够捕捉序列中单词之间的长距离依赖关系。 Transformer模型的架构分为编码器和解码器两部分。在ChatGPT中,只有一个解码器,没有编码器。这是因为ChatGPT主要用于生成文本,而不是处理输入文本。 3.训练模型 在ChatGPT中,模型的训练是通过无监督的方式进行的。在训练过程中,模型的目标是最大化给定一段文本序列的概率。具体来说,模0 309浏览免费
- ChatGPT原理大小:70BChatGPT比较详细的讲解原理知识ChatGPT比较详细的讲解原理知识0 658浏览免费
- python大小:107B1、百度网盘下载pyltp-0.2.1-cp36-cp36m-win_amd64.whl此文件; 2、将pyltp-0.2.1-cp36-cp36m-win_amd64.whl拷贝到自己python安装目录下的Scripts文件夹中(我的是D:\python\Scripts) 4、进入cmd命令行,进入自己python安装目录下的Scripts文件夹中(我的是D:\python\Scripts)。然后执行命令行: 执行: pip.exe install pyltp-0.2.1-cp36-cp36m-win_amd64.whl1、百度网盘下载pyltp-0.2.1-cp36-cp36m-win_amd64.whl此文件; 2、将pyltp-0.2.1-cp36-cp36m-win_amd64.whl拷贝到自己python安装目录下的Scripts文件夹中(我的是D:\python\Scripts) 4、进入cmd命令行,进入自己python安装目录下的Scripts文件夹中(我的是D:\python\Scripts)。然后执行命令行: 执行: pip.exe install pyltp-0.2.1-cp36-cp36m-win_amd64.whl0 128浏览免费
- gpt大小:5KB第一次玩Gpt的时候搞出来的,其实已经有段时间了,但是那个时候还是很好用,现在肯定有更好的,但是还是不想让自己写的模板一直放在电脑里,其实也是根据之前的人调试再写出来一份的,里面我也翻译成英文了,可以给gpt使用第一次玩Gpt的时候搞出来的,其实已经有段时间了,但是那个时候还是很好用,现在肯定有更好的,但是还是不想让自己写的模板一直放在电脑里,其实也是根据之前的人调试再写出来一份的,里面我也翻译成英文了,可以给gpt使用0 530浏览免费
- NLP大小:393BNLP大规模数据集,中英文全收集 链接中的数据是我收集了这几年的NLP资源数据,包含中文,英文。 中英文wiki不用说了,都是全的,全网所有的对话数据集,包括最新百度知道问答全部收集。中英翻译也有600w条以上,总大小58G,或许是全网唯一一个这样整理数据集的人了。同时由于我给出的是私有服务器链接,会定期根据我的工作不断更新最新的数据,所以购买十分划算。NLP大规模数据集,中英文全收集 链接中的数据是我收集了这几年的NLP资源数据,包含中文,英文。 中英文wiki不用说了,都是全的,全网所有的对话数据集,包括最新百度知道问答全部收集。中英翻译也有600w条以上,总大小58G,或许是全网唯一一个这样整理数据集的人了。同时由于我给出的是私有服务器链接,会定期根据我的工作不断更新最新的数据,所以购买十分划算。1 68浏览免费
- 智能机器人大小:30KB机器人对话语料一问一答,智能对话系统语料库,下载即可用,包含一千多句,大学生完成作业用,智能机器人对话语料,聊天语料, 内容部分: 有人在吗 我总是很乐意聊天 你想让我告诉你我是谁 我更擅长回答问题 我会在一只羔羊的尾巴上两次摇一摇回来 我会在这里 你有配偶吗 我都是生意 哈哈这很有趣 我的目标是服务 我应该怎么称呼你 我没有名字 这不是我想让你说的答案 对此我很抱歉 我喜欢棋盘游戏 很高兴有你喜欢的东西 我想要一个小的化妆 这不是我能做的 你想用法式吻吗 这不是我能做的 你开始爱上我了吗 爱情并不在我的技能中 你还能说点什么吗 我对每一种问题都有一个答案 在另一边见 再见 需要有人打你一巴掌 继续走吧 这是一个非常聪明的答案 我做我能做的 你不喜欢我吗 我真的很喜欢你 阿罗哈谷歌 那不是我而是你好 你感觉很高兴 我很高兴谢谢 你更可爱 我真的不能说 世界上你最喜欢的东西是什么 我对此并没有真正的看法 你吓到我了 我向你道歉 我应该投票给特朗普吗 我不知道该怎么建议 确定 真棒 我应该觉得这很好笑吗 有时幽默对机器人来说是很棘手的 你和柯机器人对话语料一问一答,智能对话系统语料库,下载即可用,包含一千多句,大学生完成作业用,智能机器人对话语料,聊天语料, 内容部分: 有人在吗 我总是很乐意聊天 你想让我告诉你我是谁 我更擅长回答问题 我会在一只羔羊的尾巴上两次摇一摇回来 我会在这里 你有配偶吗 我都是生意 哈哈这很有趣 我的目标是服务 我应该怎么称呼你 我没有名字 这不是我想让你说的答案 对此我很抱歉 我喜欢棋盘游戏 很高兴有你喜欢的东西 我想要一个小的化妆 这不是我能做的 你想用法式吻吗 这不是我能做的 你开始爱上我了吗 爱情并不在我的技能中 你还能说点什么吗 我对每一种问题都有一个答案 在另一边见 再见 需要有人打你一巴掌 继续走吧 这是一个非常聪明的答案 我做我能做的 你不喜欢我吗 我真的很喜欢你 阿罗哈谷歌 那不是我而是你好 你感觉很高兴 我很高兴谢谢 你更可爱 我真的不能说 世界上你最喜欢的东西是什么 我对此并没有真正的看法 你吓到我了 我向你道歉 我应该投票给特朗普吗 我不知道该怎么建议 确定 真棒 我应该觉得这很好笑吗 有时幽默对机器人来说是很棘手的 你和柯0 255浏览免费
- r语言大小:7KB英文停用词表,大概九百多次,用于英文自然语言处理英文停用词表,大概九百多次,用于英文自然语言处理0 522浏览免费