• BeautifulSoup.zip

    近日实际学习和使用爬虫的python工具BeautifulSoup的精选资料包,全部是整理的.md笔记档,目录结构清晰,特分享以供爬虫学习、使用者速学速查之便,共有三份文档: Beautiful Soup 4.4.0 文档,最新的文档,作参考手册用,现查现用。 Python爬虫之Beautiful Soup用法-简书,总结得比较到位,适合概念迅速消化自学,推荐,另附有DOM的百度百科解释。本文做了重点摘清。 BeautifulSoup使用find,find_all 实际用的较多的函数,注意的常见问题。

    0
    159
    42KB
    2019-12-27
    9
  • REST API.md

    REST是设计分布式网络服务或API时遵循的架构原则以及设计风格, 前后端分离最佳实践的开发标准或规范。本文为资料收藏的.md笔记,选取比较重要的资料,收集了以下内容: 重要概念介绍,如前述的第2-第4个关键词。 REST API的优点:缓存Cache提高响应性能,本身的“无状态”和“扩展性”,不需要额外的资源发现机制 REST 、DO、RPC之间区别对比 REST与CORBA、SNMP、SOAP比较 腾讯开放平台REST API 示例 通过URL来设计系统结构,抽象的是资源,而不是对象、过程,完成的是用户接口 REST API的开发框架介绍:JSR-311,REST Web Services框架 JAX-RS,java接口;### REST Web Application多层框架 REST 应用场景,适合和不适合什么 基于HTTP的REST, 介绍资源uri,传输格式,对资源的操作(GET、POST、PUT,DELETE,Options,Head方法,如何对应CRUD动作)

    0
    128
    62KB
    2019-12-25
    11
  • 深度学习的实现与发展——从神经网络到机器学习.md

    **深度学习(Deep Learning)**是建立在**计算机神经网络理论和机器学习理论**上的**系统科学**,它使用建立在复杂的机器结构上的**多处理层**,结合**非线性转换**方法算法,对**高层复杂数据模型**进行抽象。 本文笔记收获以下重点: “深度学习是**<u>建立在深度结构神经网络上的复杂思维模式机器学习</u>**”的认识(**按:重点认知**)。 **RBM 的结构比BM 的网络拓扑结构更简单**,因为**<u>各层内部神经元之间没有连接</u>**,很大程度上**提高了网络训练与学习的效率**。构造**深度置信网络(DBN)**时都是**先构造出RBM,再将某些RBM <u>堆栈起来得到</u>DBN**。 目前(**按:重点**)**<u>关于数据表示,有局部表示、分布表示和稀疏分布表示</u>**。那么是否有**新的表示思路来更新数据模型**,如**<u>加入不同的稀疏惩罚对RBM 和EA 训练进行改进</u>**。 **特征提取**,范例有 高斯伯努利模型;算法研究关注自适应的特征提取和自动编码机制;泛化结构不仅包括树、图结构,还要更多;预训练和判别微调方法还有待进一步改进和提升 **学习可控性** 是机器学习需要关注的一个问题,即**<u>到底赋予机器多少权限和思维能力</u>**。**<u>机器学习的最大隐患</u>**—“**<u>学习失控</u>**”。

    0
    131
    11KB
    2019-12-24
    9
  • 《麻省理工科技评论》年度中国科技青年英雄榜发布!35位入选者涵盖全球最前沿科学与技术.md

    从 1999 年开始,每一年《**麻省理工科技评论**》都会选出一批 35 岁以下最具有创新性与影响力的科学家、科研工作者、科技创业者,他们是: **发明家(Inventors)** **创业家(Entrepreneurs)** **远见者(Visionaries)** **人文关怀者(Humanitarians)** **先锋者(Pioneers)** 2017 年**《麻省理工科技评论》协同中国地区独家合作伙伴 DeepTech 一道将榜单落地中国,正式推出《麻省理工科技评论》<u>中国区</u>“35 岁以下科技创新 35 人”**。 今年是《麻省理工科技评论》创刊 120 周年,第三届“35 岁以下科技创新 35 人”中国榜单在 2019 年 12 月 14 日的 EmTech China 全球新兴科技峰会揭晓**。 《麻省理工科技评论》2019 年中国“ 35 岁以下科技创新 35 人”获奖者名单(按姓名首字母排序) 本文.md档收录了媒体的介绍报道,重点是梳理入榜者的主要研究成果,加以归纳。

    0
    95
    72KB
    2019-12-16
    9
  • 关于公司——公司成长的三个阶段,子公司和分公司.md

    本文为转摘的普及商事知识的笔记.md档,可以得到一些常识性的认知。从商业角度看,公司的最终目标无非就是赚钱,持续的赚钱,持续的赚更多的钱。为此划分了公司成长的三个阶段:产品阶段,规模扩张阶段,持续经营阶段,提出了每个阶段的重点任务。持续赚钱,要有壁垒,能持久地掌握稀缺资源。重视科技的反稀缺性。公司的扩张涉及设立子公司和分公司的优点。以上内容本文做了简要归纳。

    0
    103
    10KB
    2019-12-16
    10
  • Vaex——一个开源的DataFrame库,它可以对表格数据集进行可视化、探索、分析,甚至机器学习

    **Vaex是一个开源的DataFrame库**,它可以对表格数据集进行**<u>可视化、探索、分析,甚至机器学习</u>**,这些数据集和你的硬盘驱动器一样大。**它可以在一个n维网格上每秒计算超过10亿(10^9)个对象的<u>平均值、和、计数、标准差</u>等<u>统计信息</u>**。可视化使用直方图、使用直方图、密度图和3D立体渲染进行可视化。为此,**Vaex采用了<u>内存映射、高效的外核算法和延迟计算</u>等概念来获得最佳性能(不浪费内存)**。 本文是上述介绍的.md笔记档,为一个刚好超出RAM范围(如50GB甚至500GB的数据集)的数据集做分析,又不能破费成本的设置一个集群, Vaex作为一个开源的DataFrame库,带来了解决方案!例子是使用纽约市出租车的数据集。

    0
    1792
    24KB
    2019-12-14
    50
  • 国产数据库年终大盘点!.md

    **去“IOE”**这个概念,最早由王坚院士在刚刚加入阿里时提出,其目标是**将IBM 的小型机、Oracle数据库、EMC存储设备从阿里的IT体系中去除,代之以自主研发的系统**。 随着**<u>国产云计算服务</u>水平**的不断发展,**国外厂商的小型机和存储,已经不多见**,**<u>不过IOE中的O也就是Oracle、DB2等国外厂商的数据库,还依旧在我国市场大行其道</u>**。 本文带大家一起来盘点一下**国产数据库的发展现状**。此文为.md笔记 金融级高可用 融合OLTP和OLAP 标准SQL、事务与NoSQL的分布式存储相结合的JSON标准存储格式 多产品线的数据库(对标Oracle) 海量数据的时序数据库 对标MySQL 涉及存储,查询,索引,高可用,事务,批处理,并发,访问冷热,时序

    0
    653
    16KB
    2019-12-14
    50
  • 数据分析体系是什么?该怎么搭建?.md

    到底数据分析体系是什么?似乎经常看到的,只有AARRR五个字母,又语焉不详。到底怎样才算是建了个体系?今天我们系统解答一下。 本文为细心整理的.md笔记,做了摘记概括。 **搭建数据分析体系常犯错误**是丢失重点、目标,陷入指标细节;贪大求全的使用同一套指标而不加以区分职责。 **数据分析要旨**在于解释数据背后的业务含义,找到**对业务有用的价值点**。 **数据分析体系**能**更有效率**的支持业务,把数据报表、专题报表串起来,有层次展现,应用到业务中。**有节奏、有主次、有顺序的展现**数据。 **搭建数据分析体系的基本思路**: 明确服务对象即针对的需求方负责人; 明确工作目标,量化目标,可以计算目标和现状的差距; 监督业务走势,发现问题苗头; 了解业务行动,分解业务细节,找到数据可以帮助的价值点; 行动之后,复盘行动结果,事后总结出普遍的经验。优秀的业务能力永远稀缺,不可复制。复盘的意义:把明显的作死行为总结出来,避免普通人犯错。 **数据分析体系不是一成不变,也需要迭代升级,提升专业水准的要求**:坚守目标,迭代方法,积累经验。固定通用产品、临时个体专题。 **回到出发点,重视业务需求**:从业务中来,到业务中去;用专业的方法服务个性化需求 ### 精彩段子: **数据的<u>优势</u>,不是直接生产出<u>超人的创意</u>,而是事后总结出<u>普遍的经验</u>**。**<u>优秀的业务能力永远是稀缺资源,是不可复制的</u>**。但通过数据分析复盘,可以**<u>把明显的作死行为总结出来,避免普通人犯错</u>**。 **数据的作用:长期积累的业务方经验,(基于普遍意义)为遇到的问题提供思路。** **做业务从来不怕失败,怕的是败的不明不白**。

    0
    330
    16KB
    2019-12-13
    50
  • 数据分析,怎么做才能有前瞻性.md

    有同学问:领导总让做“**有前瞻性**”的分析,不要说那些“**大家都知道**的事”。可到底什么是前瞻性?有时候明明写了预计未来情况,可还是被批判为:没啥前瞻性。真不知道咋办了。——今天系统解答一下。通过细致的分析,看到深层次问题,讲出来没人知道的惊天秘密,听起来多厉害。 本文经过细心整理为.md档,可以获知: 真正的前瞻性,是定性预测 而建数据模型详细计算,是定量预测; 本文重点如下: 影响因素的分类标准为:可辨识程度,注意影响方式和前瞻性高低

    0
    139
    12KB
    2019-12-13
    9
  • 区块链:一场信任革命——技术原理.md

    区块链:一场信任革命——技术原理.md,比较浅易介绍区块链概念和技术原理的科普短文。本文笔记做了详细的书签和粗体、下划线规整,以便对照纲目快速阅读。内容讲解很精当也很好懂。

    0
    135
    5KB
    2019-12-06
    9
  • 知无不言

    回答1个问题,每日最多计数5次
  • 分享王者

    成功上传51个资源即可获取
  • 创作能手

    授予每个自然周发布1篇到3篇原创IT博文的用户
关注 私信
上传资源赚积分or赚钱