如何存储 分布式存储
如何保证搜索性能 分布式搜索
如何保证高可靠/高可用 存储备份
如何应对高并发/实时响应需求 集群 (分布式集群)
索引将被如何存储
分割成多个分片存储到集群的不同节点上,每个分片有备份,
存储再集群的不同节点上。
独立服务器上索引加内核,那集群上索引叫什么?
solrCloud 中以 collection(集合)来称呼索引,内核存储
的是集合分片(shard)的本分(replication)
0301+0302 Solr 索引详解
Schema 介绍
在 lucene 中问们要对文档字段进行索引存储,需要如何做
创建字段 指定名称 值 字段类型 FieldIndexType
使用 solr 搜索服务平台,不需要编码了,还需要定义如何索引
存储字段吗
需要的。
需要一种机制来定义/存储这些字段的索引信息,让 solr 运行
时知道各个内核/集合的字段定义信息,这就是 schema。
Schema,模式,是集合/内核中字段的定义,让 solr 知道集合/
内核包含哪些字段/字段的数据类型/字段该索引存储。
Schema 的俩种定义方式
Schema 提供了俩种方式来配置 schema,俩者只能选其一
1 默认方式,通过 Schema API 来实时配置,模式信息存储在
内核目录的 conf/managed-schema 文件中
2 传统的手工编辑 conf/schema.xml 的方式,编辑完成后需
重载集合/内核才会生效。
Schema 俩种配置方式切换
schema.xml 到 managed.schema
只需要将 solrconfig.xml 中的<schemaFactory class =
“ClassicIndexSchemaFactory”/>去掉,或改为
ManagedIndexSchemaFactory
Solr 重启时,它发现存储 schema.xml 但不存储在 manage-
Schema,它会备份 schema.xml,然后改写 schema.xml 为
managed-schema。此后就可以通过 Schema API 管理 schema
了。
managed.schema 到 schema.xml
将 managed-schema 重命名为 schema.xml
将 solrconfig.xml 中 schemaFactory 的
ManagedIndexSchemaFactory 去掉(如果存在)
增加<schemaFactory class =
“ClassicIndexSchemaFactory”/>
Solr 还支持无模式方式,solr 会猜测该如何索引字段,不