Neo4j-05.查询进阶与性能调优

当数据量上来、查询变复杂，「能跑」不够，还要「跑得快」。本文覆盖 Cypher 进阶语法与 Neo4j 查询规划（query planning）、索引策略、常见慢查询治理——面向已有 CRUD 基础的读者。

段末注释：OLTP（online transaction processing，在线事务处理）指以短查询、高并发读写为主的工作负载；图遍历型 OLTP 是 Neo4j 的主场。

一、路径查询进阶

1.1 变长路径语法

// * 固定跳数；*min..max 范围
MATCH (a:Person {name: 'Alice'})-[:KNOWS*1..3]->(d)
RETURN DISTINCT d.name;

// 最短路径（无权）
MATCH (a:Person {name: 'Alice'}), (b:Person {name: 'Dave'})
MATCH p = shortestPath((a)-[:KNOWS*]-(b))
RETURN p, length(p) AS hops;

// 所有最短路径
MATCH (a:Person {name: 'Alice'}), (b:Person {name: 'Dave'})
MATCH p = allShortestPaths((a)-[:KNOWS*]-(b))
RETURN p;

1.2 路径过滤与展开

1
2
3

MATCH p = (a:Person)-[:KNOWS*2..4]->(b)
WHERE all(r IN relationships(p) WHERE r.since >= 2018)
RETURN p LIMIT 50;

1.3 避免「爆炸式」遍历

风险	缓解
`*..` 无上界	始终设 `*1..N`，N 按业务定
超级节点	建模拆分、中间节点（见 Neo4j-08）
双向全图	指定关系类型与方向

二、列表、Map 与高级 RETURN

// 收集邻居列表
MATCH (p:Person {name: 'Alice'})-[:KNOWS]->(f)
RETURN p.name, collect(f.name) AS friends;

// 条件聚合
MATCH (p:Person)-[:KNOWS]->(f)
RETURN p.name, count(f) AS cnt
ORDER BY cnt DESC LIMIT 10;

// Map 投影（Neo4j 5）
MATCH (p:Person)
RETURN p { .name, .age, label: labels(p)[0] } AS person_view;

2.1 UNWIND 展开

1
2
3

WITH ['Alice', 'Bob', 'Carol'] AS names
UNWIND names AS name
MERGE (p:Person {name: name});

2.2 子查询 CALL {}

MATCH (p:Person)
CALL {
  WITH p
  MATCH (p)-[:KNOWS]->(f)
  RETURN count(f) AS friend_count
}
RETURN p.name, friend_count;

Neo4j 5 支持 ** correlated subquery**，便于分步聚合而不写复杂 WITH。

三、索引体系（Neo4j 5）

索引类型	用途	示例
RANGE（B-tree）	等值、范围	`WHERE p.age > 30`
TEXT	字符串 contains / ends with	`WHERE p.name CONTAINS 'Li'`
POINT	地理空间	距离查询
VECTOR（5.11+）	embedding 相似度	RAG、语义检索

// 全文索引（Lucene）
CREATE FULLTEXT INDEX paper_fulltext IF NOT EXISTS
FOR (p:Paper) ON EACH [p.title, p.abstract];

CALL db.index.fulltext.queryNodes('paper_fulltext', 'CRISPR AND enzyme')
YIELD node, score
RETURN node.title, score LIMIT 20;

// 向量索引（需 Neo4j 5.11+ 与 GDS/向量插件）
CREATE VECTOR INDEX paper_embedding IF NOT EXISTS
FOR (p:Paper) ON (p.embedding)
OPTIONS { indexConfig: { `vector.dimensions`: 1536, `vector.similarity_function`: 'cosine' }};

原则：MATCH / WHERE 中高频过滤的属性应建索引；MERGE 的锚点属性应 UNIQUE 约束。

四、执行计划：EXPLAIN 与 PROFILE

4.1 用法

EXPLAIN
MATCH (p:Person {email: 'a@b.com'})-[:KNOWS*1..3]->(d)
RETURN d;

PROFILE
MATCH (p:Person {email: 'a@b.com'})-[:KNOWS*1..3]->(d)
RETURN d;

命令	作用
EXPLAIN	只看计划，不执行
PROFILE	执行并统计 db hits、行数、耗时

4.2 常见算子

算子	含义	期望
NodeIndexSeek	索引找起点	好
Expand(All)	扩展所有关系	数据量大时警惕
VarLengthExpand	变长扩展	注意上界
Eager	缓冲全部结果	大结果集时内存压力
CartesianProduct	笛卡尔积	通常需优化

4.3 优化示例

慢：无索引全扫描

1
2
3

MATCH (p:Person)
WHERE p.email = 'alice@example.com'   // 无索引 → AllNodesScan
RETURN p;

快：加唯一约束后

1
2
3

CREATE CONSTRAINT person_email IF NOT EXISTS
FOR (p:Person) REQUIRE p.email IS UNIQUE;
// 计划变为 NodeUniqueIndexSeek

五、Cypher 性能习惯

5.1 先过滤，再扩展

// 好：先定位小集合
MATCH (p:Person {email: $email})
MATCH (p)-[:KNOWS*1..2]->(f)
RETURN f;

// 差：先扩展再过滤
MATCH (p)-[:KNOWS*1..2]->(f)
WHERE p.email = $email
RETURN f;

5.2 关系类型与方向写死

// 好
(a)-[:KNOWS]->(b)

// 差（除非必要）
(a)-[]->(b)

5.3 LIMIT 早用

探索性查询始终加 LIMIT；聚合前用 WITH 缩小中间结果。

5.4 避免重复 MATCH 大子图

用 WITH 传递已匹配变量，而非再次 MATCH 全图。

六、内存与配置调优

参数	建议
`server.memory.pagecache.size`	≈ 图数据热集大小（留足 OS 内存）
`server.memory.heap.max_size`	大查询、APOC 多时适当增大
`db.transaction.timeout`	防止长事务占资源
`db.lock.acquisition.timeout`	写冲突超时

查看运行时信息：

1	CALL dbms.queryJmx('org.neo4j:instance=kernel#0,name=Page cache') YIELD attributes;

七、查询反模式与修复

反模式	现象	修复
无界 `-[*]-`	超时 / OOM	设 `*1..N`
超级节点 Expand	db hits 爆炸	重构边、分页、预聚合
大结果集 RETURN 全图	Browser 卡死	只 RETURN 必要属性
字符串拼接 Cypher	慢 + 注入	参数化
频繁 small MERGE	写放大	UNWIND 批写

八、与 Graph Data Science 的边界

Cypher：在线点查、模式匹配、短路径
GDS：离线/近线全图算法（PageRank、Louvain、Node Similarity）

大图算法不要硬写 Cypher 递归；应 project 子图 → 跑 GDS → 写回属性（见 Neo4j-07）。

九、调试工具箱

工具	用途
`PROFILE`	单查询性能
Neo4j Browser 图视图	小结果可视化
Query Log	慢查询审计
Prometheus metrics	集群监控（企业版/Aura）
`db.stats.retrieve('QUERIES')`	查询统计

十、小结

变长路径必须有上界；最短路径用 shortestPath / allShortestPaths。
索引 + 唯一约束是 OLTP 查询性能基础；全文/向量索引支撑检索类场景。
用 PROFILE 看 db hits，优先消除全图扫描与笛卡尔积。
超大图算法交给 GDS，不要强行 Cypher 遍历全图。

下一篇	内容
Neo4j-06.运维迁移与备份	dump、restore、升级
Neo4j-07.进阶能力与Graph-Data-Science	APOC、GDS