【免费】罗瑶光_DNA元基催化与肽计算第五版_上册V100011资源-CSDN文库

需积分: 0 42 浏览量 2022-08-08 19:55:40 上传评论收藏 1.85MB DOCX 举报

资源推荐

资源详情

资源评论

第一章_德塔自然语言图灵系统

测试速度：单机联想 Y7000 笔记本 win10 实测峰值每秒中文分词 1630~1650 万+中文字，词库 65000+，函数准确

率 100%，缺失语法函数 0.3%-，算法准确率 99.7%+， 100%完整开放源码，在 api 与书籍中。

测试效果：输入：如果从容易开始于是从容不迫天下等于是非常识时务必为俊杰沿海南方向逃跑他说的确实在理结

婚的和尚未结婚的提高产品质量中外科学名著内科学是临床医学的基础内科学作为临床医学的基础学科重点论述

人体各个系统各种疾病的病因发病机制临床表现诊断治疗与预防

输出结果：如果+从+容易+开始+于是+从容不迫+天下+等于+是非+常识+时务+必+为+俊杰+沿海+南+方向+逃跑+他+

说+的+确实+在理+结婚+的+和+尚未+结婚+的+提高+产品质量+中外+科学+名著+内科学+是+临床+医学+的+基础+内

科学+作为+临床+医学+的+基础+学科+重点+论述+人体+各个+系+统+各种+疾病+的+病因+发病+机制+临床+表现+诊

断+治疗+与+预防+++++

定义：德塔分词是一种-- 基于神经网络索引字典切割-- 进行前序遍历词性组合匹配-- 按文学语法定义搭配的切

词引擎。

德塔分词的催化切词优化方式主要包含：

refer page 版权原因无源码收录已经

refer https://github.com/yaoguangluo/Data_Processor/blob/master/DP/sortProcessor/Quick_4D_Sort.jav

a

3 基于 1 和 2 原型，德塔分词排序采用 Theory on YAOGUANG's Array Split Peak Defect 的微分催化算子优化

思想 2013 年开始优化。refer page 247,248,250,529,620，

4 优化过程为小高峰左右比对法，波动算子过滤思想，离散条件归纳微分思想(如狄摩根计算，流水阀门计算等)，

目前为 TopSort5D。refer page 658，下册 134

5 德塔分词的函数优化方式和算法优化方式，包括分词引擎，读心术，NLP 分析等核心组件均采用微分催化系统。

refer page 661，

神经网络索引，

1 德塔分词的词汇字典用 map 进行索引，因为 jdk8+的 map 对象的 key 支持 2 分搜索，搜索速度到了峰值。refer

page,129,131

2 德塔分词的索引不断的将大 map 进行细化分类，如词长 map，词类 map，词性 map，让搜索再次加速。refer page

55，

3 德塔分词的索引 map 支持 2 次组合计算，支持分布式服务器进行索引 cache。关于 2 次组合计算作者不建议单机

使用。refer page 92，

4 德塔分词 map 的 key 用 string 的 char 对应 ASCII int 进行标识来执行 find key，方便二分搜索存储和

StringBuilder 高速计算，实现底层核统一。refer page 92

分词在线性文本搜索中应用，

1 德塔分词的搜索建立在 map 类的权重计算方法上，不同的权重叠加产生的打分进行排序输出。refer page 下册 64

2 权重的计算方法按词性的主谓宾如代名动形，和 POS 如动名形谓介分类。refer page 下册 66

3 权重与词长，词频进行耦合 bit 叠加计算(bit 位计算比乘法要快一个数量级)，生成最终输出结果。 refer page

下册 68

4 权重与词长的比值可以精度调节，确定搜索的精确性和记录个人搜索偏好。refer page 下册 68

动态 POS 函数流水阀门细化遍历内核匹配，

1 动态的核分为前序核和后序核两种。根据词汇分析的位置进行实时变动更新。refer page 97

2 前序核主要缓存存储词汇的位置和词性，用于 POS 词性搭配的 POS 函数流水阀门细化遍历计算。refer page 97

3 后序核主要缓存词汇的切词链后面准备跟进的词语。用于 POS 语法的修正计算，如连词匹配。refer page 97

4 内核采用 StringBuilder 做核载体进行计算加速。refer page 97

剩余42页未读，继续阅读

内容反馈

稚气筱筱

粉丝: 15
资源: 320

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip