🚀 Sistema RAG Avanzato

Un sistema di Retrieval-Augmented Generation (RAG) modulare che integra tecniche avanzate per il processing, chunking, retrieval e generazione di risposte da documenti tecnici.

🎯 Caratteristiche Principali

🏗️ Architettura Modulare

src/
├── document_processing/    # PDF processor (Docling)
├── chunking/              # Semantic chunking
├── query_handling/        # HyPE processor
├── retrieval/             # Fusion retrieval
├── generation/            # Gemini generator
├── pipeline/              # Pipeline principale
├── telemetry/             #Telemetria con Langfuse
└── utils/                 # Utilità e helpers

🛠️ Installazione

1. Clona il repository

git clone <repository-url>
cd RAG-evaluator

1.1 Crea e attiva un ambiente virtuale (Consigliato)

python -m venv venv

# macOS/Linux
source venv/bin/activate

# Windows
venv\Scripts\activate

2. Installa le dipendenze

pip install -r requirements.txt

Note per macOS ARM64 (Apple Silicon):

Docling ha problemi di compatibilità con Python 3.14 su macOS ARM64

Il sistema usa automaticamente pypdf come fallback per il processing dei PDF

pypdf estrae il testo ma ha supporto limitato per tabelle e immagini complesse

Per funzionalità complete, testare su Linux/Windows o attendere aggiornamenti di Docling

3. Configura le API Keys

Crea un file .env nella root del progetto:

GOOGLE_API_KEY=your_google_gemini_api_key_here

LANGFUSE_PUBLIC_KEY="pk-lf-..."
LANGFUSE_SECRET_KEY="sk-lf-..."

# Opzionale (per modelli privati Hugging Face o limiti più alti):
HF_API_TOKEN=your_hf_token_here

4. Quick test dei componenti

python quick_test.py

6. Esecuzione dell'applicativo

python main.py --docs data/ --interactive

📋 Flusso di Esecuzione

0. Document Processing

Input: PDF, TXT, MD
Processo: Estrazione testo con Docling e conversione in Markdown semplice
Output: Documenti processati con metadati

Nota: Processing del documento eseguibile in back office

1. Semantic Chunking

Input: Testo processato
Processo: LangChain SemanticChunker divide il testo in chunks semanticamente coerenti
Parametri: percentile, standard_deviation, interquartile
Output: Chunks con boundaries semantiche naturali con limitazioni sui chunk size

Nota: Chunking eseguibile in back office

2. Query Handling (Query transformation)

Input: Query utente
Processo: Trasforma la query in altre queries con metodo di decomposizione in sub-queries (di numero {max_transformations}), riformulazione o step-back
Benefici: Migliora la qualità e la precisione della ricerca
Output: {max_transformations} queries

3. Fusion Retrieval

Input: Query utente + indici costruiti
Processo: Combina ricerca vettoriale (FAISS) e keyword (BM25)
Formula: score = α × vector_score + β × bm25_score
Output: Risultati ranked con score fusion

Nota: Indicizzazioni eseguibili in back office

4. Generation

Input: Query + chunks recuperati
Processo: Google Gemini genera risposta basata sul contesto
Output: Risposta strutturata con fonti e confidence

5. Summary

Input: Query + Risposta LLM
Processo: Google Gemini genera riassunto basato sul contesto
Output: Riassunto generato anche salvato in un file json (sovrascrivibile)

graph TD
    A["**User input**"] --> B["**Query transformation**<br/>- rewrite<br/>- decomposition<br/>- expansion"]
    B --> C["**Fusion retrieval**<br/>Usa le query trasformate per cercare i chunk rilevanti"]
    C --> D["**Answer generation**<br/>Prende il prompt con query + contesto<br/>Genera la risposta"]
    D --> E["**Summary generation**<br/>Prende la risposta e ne fa un riassunto"]

Telemetry (Langfuse)

Info: Segue il workflow dell'applicativo tramite context management
Benefici: Aggiunge il tracciamento del workflow dell'applicativo e delle chiamate al LLM

Nota: per utilizzare Langfuse, è necessario avere un account su Langfuse e configurare le API keys in .env

📚 Documentazione per Agenti AI

La cartella .claude/ contiene documentazione strutturata per agenti AI (Claude Sonnet/Opus):

File	Contenuto
`CLAUDE.md`	Overview del progetto e istruzioni principali
`ARCHITECTURE.md`	Architettura del sistema e flusso dati
`API_REFERENCE.md`	Riferimento API per tutti i componenti
`CODEBASE_MAP.md`	Mappa dei file e delle classi
`CONVENTIONS.md`	Convenzioni di codice e stile
`TROUBLESHOOTING.md`	Guida alla risoluzione problemi

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
.claude		.claude
config		config
src		src
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
main.py		main.py
quick_test.py		quick_test.py
quick_test_langfuse.py		quick_test_langfuse.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🚀 Sistema RAG Avanzato

🎯 Caratteristiche Principali

🏗️ Architettura Modulare

🛠️ Installazione

1. Clona il repository

1.1 Crea e attiva un ambiente virtuale (Consigliato)

2. Installa le dipendenze

3. Configura le API Keys

4. Quick test dei componenti

6. Esecuzione dell'applicativo

📋 Flusso di Esecuzione

0. Document Processing

1. Semantic Chunking

2. Query Handling (Query transformation)

3. Fusion Retrieval

4. Generation

5. Summary

Telemetry (Langfuse)

📚 Documentazione per Agenti AI

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🚀 Sistema RAG Avanzato

🎯 Caratteristiche Principali

🏗️ Architettura Modulare

🛠️ Installazione

1. Clona il repository

1.1 Crea e attiva un ambiente virtuale (Consigliato)

2. Installa le dipendenze

3. Configura le API Keys

4. Quick test dei componenti

6. Esecuzione dell'applicativo

📋 Flusso di Esecuzione

0. Document Processing

1. Semantic Chunking

2. Query Handling (Query transformation)

3. Fusion Retrieval

4. Generation

5. Summary

Telemetry (Langfuse)

📚 Documentazione per Agenti AI

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages