-
Notifications
You must be signed in to change notification settings - Fork 0
path_constraints
Version: 1.0 Draft
Datum: 28. Oktober 2025
Status: Konzept – Noch nicht implementiert
Aktuell werden FILTER-Ausdrücke in Traversals nur am letzten Level vor dem Enqueue angewendet (konservatives Pruning). Dies ist sicher, aber lässt Optimierungspotenzial auf Zwischenebenen ungenutzt.
Pfad-Constraints ermöglichen aggressiveres Pruning auf allen Tiefen, indem Prädikate entlang des gesamten Pfads gelten.
Query:
FOR v IN 1..3 OUTBOUND 'user1' GRAPH 'social'
FILTER e.type == 'follows'
RETURN v
Naive (falsche) Interpretation:
- "Schneide alle Kanten ab, bei denen
e.type != 'follows'" -
Problem: Bei depth=1 ist
edie Kante von user1 → v1, aber bei depth=2 istedie Kante zum aktuellen Knoten (v2), nicht die gesamte Pfadhistorie.
Ergebnis: Zu viele Pfade abgeschnitten, die über alternative Routen erreichbar wären.
Semantik: FILTER gilt nur für die eingehende Kante zur aktuellen Zeile (depth).
Syntax:
FILTER e.type == 'follows' -- nur am letzten Level sicher
Anwendung:
- Am letzten Level vor Enqueue prüfen (✅ implementiert)
- Auf Zwischenebenen: nicht prunen (würde Pfade abschneiden)
Semantik: FILTER gilt für alle Kanten entlang des Pfads von Start bis aktueller Zeile.
Syntax (zukünftig):
FILTER PATH.ALL(e, e.type == 'follows')
Bedeutung:
- Prüfe bei jedem Expand: Ist die neue Kante ein
follows? - Wenn nein: Pfad ist ungültig → nicht enqueuen
- Sicher auf allen Tiefen!
Implementierung:
- Beim Enqueue: Prüfe
a.edgeIdgegen Constraint - Tracking: Optional Pfad-Historie (Liste der edgeIds) mitführen, falls Constraints auf "vorherige Kante" prüfen
Semantik: Mindestens eine Kante entlang des Pfads erfüllt Prädikat.
Syntax (zukünftig):
FILTER PATH.ANY(e, e.weight > 10)
Implementierung:
- Pfad-State: Boolean Flag
hasSeenHeavyEdge - Beim Enqueue: Update Flag
- Bei Result-Zeile: Prüfe Flag
Semantik: Kein Vertex entlang des Pfads darf Prädikat verletzen.
Syntax (zukünftig):
FILTER PATH.NONE(v, v.blocked == true)
Implementierung:
- Beim Enqueue: Prüfe neuen Vertex
nbgegen Constraint - Wenn
nb.blocked == true: Nicht enqueuen - Sicher auf allen Tiefen!
| Constraint-Typ | Anwendungstiefe | Implementierung |
|---|---|---|
| Last-Edge (e.field OP value) | Nur letztes Level | ✅ Implementiert (evalSingleE) |
| Last-Vertex (v.field OP value) | Nur letztes Level | ✅ Implementiert (evalSingleV) |
| PATH.ALL(e, ...) | Alle Tiefen | 🔜 Geplant (Expand-Zeit-Check) |
| PATH.NONE(v, ...) | Alle Tiefen | 🔜 Geplant (Expand-Zeit-Check) |
| PATH.ANY(e, ...) | Alle Tiefen (State) | 🔜 Geplant (Flag-basiert) |
struct PathConstraintExpr : Expression {
enum class Type { All, Any, None };
Type type;
char varName; // 'e' oder 'v'
std::unique_ptr<Expression> predicate;
};Parser-Syntax:
PATH.ALL(e, e.type == 'follows')
PATH.NONE(v, v.blocked == true)
PATH.ANY(e, e.weight > 10)
struct FilterClassification {
std::vector<Expression*> lastEdgeOnly;
std::vector<Expression*> lastVertexOnly;
std::vector<Expression*> pathAllEdge;
std::vector<Expression*> pathNoneVertex;
std::vector<Expression*> pathAnyEdge;
std::vector<Expression*> mixed; // AND/OR kombiniert, keine einfache Klassifikation
};
FilterClassification classifyFilters(const std::vector<std::unique_ptr<FilterClause>>& filters);auto enqueueOut = [&](const std::vector<AdjacencyInfo>& adj) {
for (const auto& a : adj) {
// PATH.ALL(e, e.type == 'follows')
for (const auto& pathAllE : pathAllEdgeConstraints) {
if (!evalEdgeConstraint(a.edgeId, pathAllE)) {
prunedAllDepths++;
continue; // sicher auf allen Tiefen!
}
}
// PATH.NONE(v, v.blocked == true)
for (const auto& pathNoneV : pathNoneVertexConstraints) {
if (evalVertexConstraint(a.targetPk, pathNoneV)) {
prunedAllDepths++;
continue; // blockierter Vertex → skip
}
}
// Konservative Prüfungen (nur letztes Level)
if (depth + 1 == t.maxDepth) {
// ... (wie bisher)
}
if (visited.insert(a.targetPk).second) {
parent[a.targetPk] = {node, a.edgeId};
qnodes.push({a.targetPk, depth + 1});
enqueuedPerDepth[depth + 1]++;
}
}
};struct PathState {
bool hasSeenHeavyEdge = false;
// weitere Flags je Constraint
};
std::unordered_map<std::string, PathState> pathStates;
// Beim Enqueue:
PathState newState = pathStates[node];
if (checkEdgeWeight(a.edgeId) > 10) newState.hasSeenHeavyEdge = true;
pathStates[a.targetPk] = newState;
// Bei Result-Zeile:
if (pathAnyEdgeConstraints.hasHeavyEdge && !pathStates[node].hasSeenHeavyEdge) {
pass = false; // PATH.ANY nicht erfüllt
}- Frontier-Reduktion: Aggressives Pruning auf allen Tiefen
- Frühzeitiger Abbruch: Ungültige Pfade werden sofort verworfen
- Weniger Entity-Loads: Nur validierte Pfade landen in Result-Set
- Expand-Zeit-Overhead: Jede Kante wird gegen PATH.ALL/NONE geprüft
- Memory: PathState für PATH.ANY (HashMap, kleine Keys)
Faustregel:
- Nutzen > Kosten, wenn Constraints selektiv sind (z. B. nur 10% der Kanten sind
follows)
- Phase 1: Parser-Erweiterung (PATH.ALL/NONE/ANY Syntax)
- Phase 2: AST-Classifier (Filter-Typen erkennen)
- Phase 3: BFS Expand-Zeit-Checks (PATH.ALL/NONE)
- Phase 4: State-Tracking (PATH.ANY)
-
Phase 5: Metriken (
pruned_all_depths,path_state_size) - Phase 6: Tests & Benchmarks (Vergleich mit/ohne Constraints)
FOR v IN 1..3 OUTBOUND 'user1' GRAPH 'social'
FILTER PATH.ALL(e, e.type == 'follows')
RETURN v
Effekt: BFS expandiert nur über follows-Kanten, alle anderen werden auf allen Tiefen gedroppt.
FOR v IN 1..5 OUTBOUND 'user1' GRAPH 'social'
FILTER PATH.NONE(v, v.blocked == true)
RETURN v
Effekt: Pfade, die einen blockierten Vertex passieren, werden sofort verworfen.
FOR v IN 1..4 OUTBOUND 'user1' GRAPH 'social'
FILTER PATH.ANY(e, e.weight > 10)
RETURN v
Effekt: Nur Pfade mit mindestens einer starken Kante (weight > 10) landen im Result.
| Aktuelle Implementierung | Pfad-Constraints (geplant) |
|---|---|
| Pruning nur am letzten Level | Pruning auf allen Tiefen |
| Unsicher für Zwischenebenen | Sichere Semantik durch PATH.ALL/NONE |
| Einfach (kein State) | State-Tracking für PATH.ANY |
| Konservativ (viele False Positives) | Aggressiv (nur valide Pfade expandiert) |
Empfehlung:
- Phase 1-3 implementieren (PATH.ALL/NONE) für sofortigen Nutzen
- Phase 4 (PATH.ANY) optional, falls Use-Cases existieren
- Metriken sammeln:
pruned_all_depthsvs.pruned_last_levelVergleich
Siehe auch:
- AQL Overview
- AQL Syntax Reference
- EXPLAIN and PROFILE
- Hybrid Queries
- Pattern Matching
- Subquery Implementation
- Subquery Quick Reference
- Fulltext Release Notes
- Hybrid Search Design
- Fulltext Search API
- Content Search
- Pagination Benchmarks
- Stemming
- Hybrid Fusion API
- Performance Tuning
- Migration Guide
- Storage Overview
- RocksDB Layout
- Geo Schema
- Index Types
- Index Statistics
- Index Backup
- HNSW Persistence
- Vector Index
- Graph Index
- Secondary Index
- Security Overview
- RBAC and Authorization
- TLS Setup
- Certificate Pinning
- Encryption Strategy
- Column Encryption
- Key Management
- Key Rotation
- HSM Integration
- PKI Integration
- eIDAS Signatures
- PII Detection
- PII API
- Threat Model
- Hardening Guide
- Incident Response
- SBOM
- Enterprise Overview
- Scalability Features
- Scalability Strategy
- HTTP Client Pool
- Enterprise Build Guide
- Enterprise Ingestion
- Benchmarks Overview
- Compression Benchmarks
- Compression Strategy
- Memory Tuning
- Hardware Acceleration
- GPU Acceleration Plan
- CUDA Backend
- Vulkan Backend
- Multi-CPU Support
- TBB Integration
- Time Series
- Vector Operations
- Graph Features
- Temporal Graphs
- Path Constraints
- Recursive Queries
- Audit Logging
- Change Data Capture
- Transactions
- Semantic Cache
- Cursor Pagination
- Compliance Features
- GNN Embeddings
- Geo Overview
- Geo Architecture
- 3D Game Acceleration
- Geo Feature Tiering
- G3 Phase 2 Status
- G5 Implementation
- Integration Guide
- Content Architecture
- Content Pipeline
- Content Manager
- JSON Ingestion
- Content Ingestion
- Filesystem API
- Image Processor
- Geo Processor
- Policy Implementation
- Developer Guide
- Implementation Status
- Development Roadmap
- Build Strategy
- Build Acceleration
- Code Quality Guide
- AQL LET Implementation
- Audit API Implementation
- SAGA API Implementation
- PKI eIDAS
- WAL Archiving
- Architecture Overview
- Strategic Overview
- Ecosystem
- MVCC Design
- Base Entity
- Caching Strategy
- Caching Data Structures
- Docker Build
- Docker Status
- Multi-Arch CI/CD
- ARM Build Guide
- ARM Packages
- Raspberry Pi Tuning
- Packaging Guide
- Package Maintainers
- Roadmap
- Changelog
- Database Capabilities
- Implementation Summary
- Sachstandsbericht 2025
- Enterprise Final Report
- Test Report
- Build Success Report
- Integration Analysis
- Source Overview
- API Implementation
- Query Engine
- Storage Layer
- Security Implementation
- CDC Implementation
- Time Series
- Utils and Helpers
Updated: 2025-11-30