DataSketches现在是Apache DataSketches。
DataSketches是一个随机数据流算法的开源高性能库,在数据科学中通常称为“ sketches”。 草图是有状态的小程序,它们以流的形式处理大量数据,并且可以提供数学上的近似答案(具有数学保证),从而比传统的精确方法更快地解决了计算难度大的查询。
在经历了8年的开发和5年的开源之后,我们于2019年开始了重要的迁移,从一个独立的GitHub网站迁移到成为Apache Software Foundation社区的成员。 截至2020年12月,我们已成为ASF中的官方顶级项目。
请访问我们的新。
对于问题或疑问,请参见我们的。
如果您正在寻找我们的旧存储库站点之一,请参考此。