Un procesamiento de extremo a extremo, sin compromisos.
Desde la ingesta de documentos hasta las respuestas generadas por IA, cada paso está diseñado para seguridad, cumplimiento y transparencia.
1.254 tests automatizados. 27 módulos independientes. 25 interfaces de abstracción. 0 dependencias propietarias en el núcleo certificado.
- 1
Ingesta de documentos
Procesamiento por lotes o archivo único. PDF, Excel, PPTX, HTML, Markdown con extracción automática de metadatos.
- 2
Protección de datos personales
Detección y enmascaramiento automáticos de datos confidenciales — nombres, teléfonos, cuentas bancarias, emails — antes de cualquier procesamiento IA.
- 3
Fragmentación de datos
Fragmentación recursiva y jerárquica con relaciones padre-hijo para una recuperación precisa y consciente del contexto.
- 4
Enriquecimiento semántico
Indexación vectorial y contextualización de datos para una búsqueda que entiende el significado, no solo las palabras clave.
- 5
Extracción de grafo de conocimiento
Extracción automática de entidades y relaciones para consultas complejas en todo su corpus documental.
- 6
Trazabilidad criptográfica SHA-256
Cada operación del pipeline está firmada criptográficamente. Completamente exportable para revisiones de cumplimiento.
- 7
Auditabilidad completa
Cada ingesta, consulta y respuesta IA se registra y es rastreable. Listo para auditorías internas y regulatorias.
- 8
Certificación del compilador Ferrocene
Núcleo compatible con el compilador Rust certificado Ferrocene, calificado para entornos críticos bajo las normas IEC 62304 e ISO 26262.
- 9
Arquitectura Hexagonal
25 traits de puertos abstractos desacoplan el dominio de negocio de todas las dependencias externas. Los adaptadores apuntan hacia el núcleo — nunca al revés.
- 10
Rust Nativo, Cero Runtime de Terceros
Pipeline compilada en un único binario, sin Python, sin JVM. MSRV 1.75, toolchain estable.
- 11
Pipeline Tipificada con Blackboard
PipelineContext fuertemente tipado — sin HashMap. Las dependencias entre etapas se validan en el ensamblado, no en tiempo de ejecución.
- 12
Modo Híbrido: Lineal / Grafo / Multi-Query
Tres modos de recuperación en el mismo motor: RAG lineal, GraphRAG (triplestore RDF Oxigraph) y fusión multi-query mediante Reciprocal Rank Fusion.
- 13
GraphRAG Integrado
Extracción de entidades, almacenamiento RDF persistente y traversal multi-salto directamente en la pipeline de ingesta.
- 14
Cadena de Auditoría SHA-256
Cada etapa emite eventos StageStarted / StageCompleted / StageFailed formando una cadena criptográficamente verificable.
- 15
Filtro PII
PiiStage insertable en cualquier pipeline. Detección y enmascaramiento basados en regex antes de la indexación o generación.
- 16
Parser Nativo — Sin Python
HTML, Markdown, Excel, PPTX y PDF analizados en Rust puro mediante vectrant-adapter-parser-native. Sin servicio externo de análisis.
- 17
Caché LRU Decorativa
CachedEmbeddingModel y CachedLLMEngine envuelven cualquier adaptador de forma transparente sin modificar el núcleo.
- 18
Adaptadores Cloud Agnósticos
OpenAI, Anthropic, Ollama, Cohere y pgvector registrados mediante feature flags. Las claves API nunca se almacenan — solo el nombre de la variable de entorno.
- 19
Guardrails de Entrada / Salida
Puertos InputGuardrail y OutputGuardrail para detectar inyección de prompt, filtrar toxicidad y aplicar políticas.
- 20
Control de Acceso Documental
Puerto AccessControl con RBAC/ABAC para filtrar resultados de recuperación por usuario o rol sin exponer contenido restringido.
- 21
Evaluación de Calidad RAGAS-like
Puerto QualityEvaluator que mide faithfulness, answer relevance, context precision y context recall en la fase post-pipeline.
- 22
Métricas y Hooks de Ciclo de Vida
PipelineHooks (callbacks por etapa) y PipelineMetrics (tiempo agregado) sin intrusión en la lógica de negocio.
- 23
27 Crates Workspace, 1.147+ Tests
Cobertura unitaria, de integración y end-to-end. Cero unwrap() / panic!() / unsafe en código de producción, garantizado por tests automatizados.