feat: introduce layered MPHF indexing and partition metadata

Refactors obikindex and obikpartitionner to delegate index construction to a new layered MPHF implementation. Adds resume-safe building with abundance filtering and count persistence, while introducing a PartitionMeta struct for JSON configuration persistence. Updates OKIError to wrap layer-specific errors, replaces single-path extraction with full path collection and logging, and registers new internal dependencies across the workspace.
This commit is contained in:
Eric Coissac
2026-05-20 21:01:16 +02:00
parent 17c9e076bd
commit c5bcb7b8fa
10 changed files with 193 additions and 229 deletions
+3
View File
@@ -1,5 +1,6 @@
## Chose à vérifier suite à la commande index
- il faudrait lister les fichier qui vont être indexés
- partition.meta ne devrait plus exister
- les spectrums globaux devrait etre identifier par génome
- regrouper dans un sous-dossier spectrums à la racine de l'index avec un nom basé sur le génome
@@ -26,3 +27,5 @@
- les arbres NJ sont sauvegardés en Newick avec les longeurs de branche
- dump : une table csv de l'index avec les kmer et les genomes associés en mode count ou presence/absence avec une option pour forcer le mode presence/absence meme si l'index est en mode count. Par defaut, le mode count est utilisé pour les index en mode count et le mode presence/absence pour les index en mode presence/absence.
- status : affiche le statut de l'index