数据结构与算法

如何解决Elasticsearch的深度翻页问题

使用ES做搜索引擎拉取数据的时候,如果数据量太大,通过传统的from + size的方式并不能获取所有的数据(默认最大记录数10000),因为随着页数的增加,会消耗大量的内存,导致ES集群不稳定。 ES提供了3中解决深度翻页的操作,分别是scroll、sliced scroll 和 search after: scroll scroll api提供了一个全局深度翻页的操作, 首次请求会返回一个