没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
Lucidworks Spark / Solr集成 该项目包括用于从Solr作为Spark DataFrame / RDD读取数据以及使用SolrJ将对象从Spark索引到Solr的工具。 索引编制 例子 索引和查询Twitter数据 索引和查询纽约市黄色出租车CSV数据 配置和调优 查询参数 询问 领域 过滤器 行数 max_rows request_handler 使用分片内拆分提高读取并行度 分裂 split_field splits_per_shard flatten_multivalued dv skip_non_dv sample_seed sample_pct solr.params 指标参数 soft_commit_secs commit_within batch_size gen_uniq_key solr_field_types 查询时间
资源推荐
资源详情
资源评论
收起资源包目录
spark-solr:使用SolrJ从Solr作为Spark RDD读取数据并将对象从Spark索引到Solr的工具 (129个子文件)
README.adoc 20KB
twitter.adoc 10KB
csv.adoc 5KB
nyc_yellow_taxi_sample_1k.csv 152KB
simple.csv 72B
.gitignore 279B
FusionPipelineClient.java 35KB
SolrRelationTest.java 21KB
SparkApp.java 18KB
LuceneTextAnalyzerTest.java 16KB
LuceneTextAnalyzerTransformerTest.java 15KB
FusionPipelineClientTest.java 10KB
TestSolrCloudClusterSupport.java 10KB
ScalaUtil.java 10KB
MLPipeline.java 9KB
KMeansAnomaly.java 8KB
StreamingResultsIterator.java 7KB
DocumentFilteringStreamProcessor.java 6KB
EmbeddedSolrServerFactory.java 6KB
RDDProcessorTestBase.java 5KB
SolrRDDTest.java 5KB
StreamingExpressionResultIterator.java 4KB
Logs2SolrRDDProcessor.java 4KB
EventsimUtil.java 4KB
HdfsToSolrRDDProcessor.java 4KB
SolrSqlTest.java 4KB
TwitterToSolrStreamProcessor.java 4KB
ReadTermVectors.java 4KB
ShardIndexPartitioner.java 4KB
PagedResultsIterator.java 3KB
StreamingResultsIteratorTest.java 3KB
BasicIndexingTest.java 3KB
TupleStreamIterator.java 3KB
SolrStreamIterator.java 3KB
UseML.java 3KB
SolrSQLSupport.java 2KB
BuildQueryTest.java 2KB
TestEmbeddedSolrServer.java 2KB
SQLQuerySupport.java 2KB
Utils.java 2KB
SolrStreamJavaRDD.java 1KB
SolrJavaRDD.java 1KB
SolrSQLSupportTest.java 1KB
SparkSolrClientCache.java 1KB
StreamProcessorTestBase.java 848B
DocFilterContext.java 705B
HdfsToSolrRDDProcessorTest.java 669B
Logs2SolrRDDProcessorTest.java 668B
ReadTermVectorsTest.java 627B
WordCountTest.java 618B
DocumentFilteringStreamProcessorTest.java 616B
ResultsIterator.java 513B
FusionAuthHttpClient.java 388B
movielens_ratings.json 12.47MB
movielens_ratings_10k.json 1.25MB
movielens_movies.json 1.02MB
sample_eventsim_1000.json 426KB
movielens_users.json 117KB
em_sample.json 62KB
events.json 51KB
oneusagov_sample.json 7KB
fields_schema.json 2KB
child_documents.json 326B
LICENSE 11KB
managed-schema 7KB
log4j.properties 1KB
README 7KB
RelationTestSuite.scala 129KB
SolrRelation.scala 49KB
SolrQuerySupport.scala 31KB
SolrRelationUtil.scala 29KB
SolrSupport.scala 27KB
LuceneTextAnalyzer.scala 22KB
LuceneTextAnalyzerTransformerSuite.scala 17KB
LuceneTextAnalyzerSuite.scala 15KB
EventsimTestSuite.scala 15KB
TestPartitionByTimeQuerySupport.scala 15KB
MovieLensTestSuite.scala 12KB
NewsgroupsIndexer.scala 11KB
SolrConf.scala 11KB
SolrCloudUtil.scala 10KB
MLPipelineScala.scala 9KB
LuceneTextAnalyzerTransformer.scala 9KB
StreamingSolrRDD.scala 8KB
TimePartitioningQuery.scala 8KB
SelectSolrRDD.scala 8KB
JsonFacetUtil.scala 7KB
TestFramework.scala 6KB
SolrRDD.scala 5KB
TestQuerying.scala 5KB
SparkMLExamples.scala 5KB
TestShardSplits.scala 4KB
EventsimIndexer.scala 4KB
TwitterTestSuite.scala 4KB
TestIndexing.scala 4KB
TestFacetQuerying.scala 3KB
RDDTestSuite.scala 3KB
SolrStreamWriter.scala 3KB
Partitioner.scala 3KB
QueryBenchmark.scala 3KB
共 129 条
- 1
- 2
资源评论
- 本本纲目2023-07-27文中给出了一些实际案例,展示了如何使用这个工具来解决实际问题,对理解和应用有很大帮助。
- 嗨了伐得了2023-07-27关于文件的介绍写得很简洁明了,让人能够快速了解这个工具的功能和适用范围。
- 金山文档2023-07-27这篇文件很实用,详细介绍了如何使用SolrJ从Solr读取数据并将对象索引到Spark,让数据处理变得更加高效。
- 我就是月下2023-07-27这个文件对于想要在Spark和Solr之间进行数据交互的开发者来说非常有帮助,步骤清晰易懂。
- 陈莽昆2023-07-27这篇文件虽然没有过多渲染,但内容实用且重点突出,可以帮助开发者快速上手,是一个不错的参考资料。
FriedrichZHAO
- 粉丝: 27
- 资源: 4531
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功