Skip to content

Commit

Permalink
fix typo
Browse files Browse the repository at this point in the history
  • Loading branch information
isno committed Jan 26, 2025
1 parent ed84984 commit c055c8b
Showing 1 changed file with 2 additions and 2 deletions.
4 changes: 2 additions & 2 deletions Observability/logging.md
Original file line number Diff line number Diff line change
Expand Up @@ -45,10 +45,10 @@ Elasticsearch 能够在海量数据中迅速检索关键词,其关键技术之
```
在检索时,条件“what”、“is” 和 “it” 将对应集合:$\{0, 1\}\cap\{0,1,2\}\cap\{0,1,2\} = \{0,1\}$。可以看出,**反向索引能够快速定位包含特定关键词的文档,而无需逐个扫描所有文档**

Elasticsearch 的另一项关键技术是“分片”(sharding)。每个分片相当于一个独立的 Lucene 实例,类似于一个完整的数据库。在文档写入时,Elasticsearch 会根据哈希函数(通常基于文档 ID)计算出文档所属的分片,从而将文档均匀分配到不同的分片;查询时,Elasticsearch 会并行地在多个分片上执行计算,并将结果聚合后返回给客户端,从而提高查询吞吐量
Elasticsearch 的另一项关键技术是“分片”(sharding)。每个分片相当于一个独立的 Lucene 实例,类似于一个完整的数据库。在文档(Elasticsearch 数据的基本单位)写入时,Elasticsearch 会根据哈希函数(通常基于文档 ID)计算出文档所属的分片,从而将文档均匀分配到不同的分片;查询时,多个分片并行计算,Elasticsearch 将结果聚合后再返回给客户端

为了追求极致的查询性能,Elasticsearch 也付出了以下代价:
- **写入吞吐量下降**文档写入需要进行分词和构建排序表等操作,这些都是 CPU 和内存密集型的,会导致写入性能下降。
- **写入吞吐量下降**文档写入需要进行分词、构建排序表等操作,这些都是 CPU 和内存密集型的,会导致写入性能下降。
- **存储空间占用高**:Elasticsearch 不仅存储原始数据和反向索引,为了加速分析能力,可能还额外存储一份列式数据(Column-oriented Data);其次,为了避免单点故障,Elasticsearch 会为每个分片创建一个或多个副本副本(Replica),这导致 Elasticsearch 会占用极大的存储空间。


Expand Down

0 comments on commit c055c8b

Please sign in to comment.