diff --git a/doc/404.html b/doc/404.html
index 9091b5c..0b196ed 100644
--- a/doc/404.html
+++ b/doc/404.html
@@ -632,6 +632,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="/implementation/obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="/implementation/persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="/implementation/persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -714,6 +798,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="/architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/architecture/index_architecture/index.html b/doc/architecture/index_architecture/index.html
new file mode 100644
index 0000000..43ccb55
--- /dev/null
+++ b/doc/architecture/index_architecture/index.html
@@ -0,0 +1,1816 @@
+
+<!doctype html>
+<html lang="en" class="no-js">
+  <head>
+    
+      <meta charset="utf-8">
+      <meta name="viewport" content="width=device-width,initial-scale=1">
+      
+      
+      
+      
+        <link rel="prev" href="../sequences/invariant/">
+      
+      
+      
+        
+      
+      
+      <link rel="icon" href="../../assets/images/favicon.png">
+      <meta name="generator" content="mkdocs-1.6.1, mkdocs-material-9.7.6">
+    
+    
+      
+        <title>Kmer index - obikmer</title>
+      
+    
+    
+      <link rel="stylesheet" href="../../assets/stylesheets/main.484c7ddc.min.css">
+      
+      
+
+
+    
+    
+      
+    
+    
+      
+        
+        
+        <link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
+        <link rel="stylesheet" href="https://fonts.googleapis.com/css?family=Roboto:300,300i,400,400i,700,700i%7CRoboto+Mono:400,400i,700,700i&display=fallback">
+        <style>:root{--md-text-font:"Roboto";--md-code-font:"Roboto Mono"}</style>
+      
+    
+    
+    <script>__md_scope=new URL("../..",location),__md_hash=e=>[...e].reduce(((e,_)=>(e<<5)-e+_.charCodeAt(0)),0),__md_get=(e,_=localStorage,t=__md_scope)=>JSON.parse(_.getItem(t.pathname+"."+e)),__md_set=(e,_,t=localStorage,a=__md_scope)=>{try{t.setItem(a.pathname+"."+e,JSON.stringify(_))}catch(e){}}</script>
+    
+      
+
+    
+    
+  </head>
+  
+  
+    <body dir="ltr">
+  
+    
+    <input class="md-toggle" data-md-toggle="drawer" type="checkbox" id="__drawer" autocomplete="off">
+    <input class="md-toggle" data-md-toggle="search" type="checkbox" id="__search" autocomplete="off">
+    <label class="md-overlay" for="__drawer"></label>
+    <div data-md-component="skip">
+      
+        
+        <a href="#kmer-index-architecture" class="md-skip">
+          Skip to content
+        </a>
+      
+    </div>
+    <div data-md-component="announce">
+      
+    </div>
+    
+    
+      
+
+  
+
+<header class="md-header md-header--shadow" data-md-component="header">
+  <nav class="md-header__inner md-grid" aria-label="Header">
+    <a href="../.." title="obikmer" class="md-header__button md-logo" aria-label="obikmer" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    <label class="md-header__button md-icon" for="__drawer">
+      
+      <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M3 6h18v2H3zm0 5h18v2H3zm0 5h18v2H3z"/></svg>
+    </label>
+    <div class="md-header__title" data-md-component="header-title">
+      <div class="md-header__ellipsis">
+        <div class="md-header__topic">
+          <span class="md-ellipsis">
+            obikmer
+          </span>
+        </div>
+        <div class="md-header__topic" data-md-component="header-topic">
+          <span class="md-ellipsis">
+            
+              Kmer index
+            
+          </span>
+        </div>
+      </div>
+    </div>
+    
+    
+      <script>var palette=__md_get("__palette");if(palette&&palette.color){if("(prefers-color-scheme)"===palette.color.media){var media=matchMedia("(prefers-color-scheme: light)"),input=document.querySelector(media.matches?"[data-md-color-media='(prefers-color-scheme: light)']":"[data-md-color-media='(prefers-color-scheme: dark)']");palette.color.media=input.getAttribute("data-md-color-media"),palette.color.scheme=input.getAttribute("data-md-color-scheme"),palette.color.primary=input.getAttribute("data-md-color-primary"),palette.color.accent=input.getAttribute("data-md-color-accent")}for(var[key,value]of Object.entries(palette.color))document.body.setAttribute("data-md-color-"+key,value)}</script>
+    
+    
+    
+    
+  </nav>
+  
+</header>
+    
+    <div class="md-container" data-md-component="container">
+      
+      
+        
+          
+        
+      
+      <main class="md-main" data-md-component="main">
+        <div class="md-main__inner md-grid">
+          
+            
+              
+              <div class="md-sidebar md-sidebar--primary" data-md-component="sidebar" data-md-type="navigation" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+
+
+<nav class="md-nav md-nav--primary" aria-label="Navigation" data-md-level="0">
+  <label class="md-nav__title" for="__drawer">
+    <a href="../.." title="obikmer" class="md-nav__button md-logo" aria-label="obikmer" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    obikmer
+  </label>
+  
+  <ul class="md-nav__list" data-md-scrollfix>
+    
+      
+      
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../.." class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Home
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+    
+      
+      
+  
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_2" >
+        
+          
+          <label class="md-nav__link" for="__nav_2" id="__nav_2_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Theory
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_2_label" aria-expanded="false">
+          <label class="md-nav__title" for="__nav_2">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Theory
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../kmers/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmers and super-kmers
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/encoding/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    DNA encoding
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/entropy/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Entropy filter
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/minimizer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Minimizer selection
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/indexing/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Partitioning architecture
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+      
+      
+  
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_3" >
+        
+          
+          <label class="md-nav__link" for="__nav_3" id="__nav_3_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Implementation
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_3_label" aria-expanded="false">
+          <label class="md-nav__title" for="__nav_3">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Implementation
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/superkmer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    SuperKmer
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/kmer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/chunkreader/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Chunk reader
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/pipeline/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Construction pipeline
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/obipipeline/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obipipeline library
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/storage/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    On-disk storage
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/mphf/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    MPHF selection
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/unitig_evidence/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Unitig evidence encoding
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+      
+      
+  
+  
+    
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--active md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_4" checked>
+        
+          
+          <label class="md-nav__link" for="__nav_4" id="__nav_4_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Architecture
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_4_label" aria-expanded="true">
+          <label class="md-nav__title" for="__nav_4">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Architecture
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../sequences/invariant/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Sequences
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+    
+  
+  
+  
+    <li class="md-nav__item md-nav__item--active">
+      
+      <input class="md-nav__toggle md-toggle" type="checkbox" id="__toc">
+      
+      
+        
+      
+      
+        <label class="md-nav__link md-nav__link--active" for="__toc">
+          
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+          <span class="md-nav__icon md-icon"></span>
+        </label>
+      
+      <a href="./" class="md-nav__link md-nav__link--active">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+      
+        
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#fundamental-invariant" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Fundamental invariant
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#three-level-hierarchy" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Three-level hierarchy
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#mphflayer-autonomous-mapping-layer" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        MphfLayer — autonomous mapping layer
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#datastore-slot-indexed-data" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        DataStore — slot-indexed data
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#distance-matrix-api-on-datastore-types" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Distance matrix API on DataStore types
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Distance matrix API on DataStore types">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#full-distance-matrices" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Full distance matrices
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#partial-distance-matrices" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Partial distance matrices
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#progressive-aggregation-principle" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Progressive aggregation principle
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#layereddatastore-aggregation-within-one-partition" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        LayeredDataStore — aggregation within one partition
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="LayeredDataStore — aggregation within one partition">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#column-statistics" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Column statistics
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#self-contained-partials" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Self-contained partials
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#normalised-partials-require-global-sums-from-above" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Normalised partials (require global sums from above)
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#partitioneddatastore-aggregation-across-all-partitions" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PartitionedDataStore — aggregation across all partitions
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PartitionedDataStore — aggregation across all partitions">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#column-statistics_1" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Column statistics
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#self-contained-metrics-single-pass" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Self-contained metrics — single pass
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#normalised-metrics-two-passes" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Normalised metrics — two passes
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#parallelism-model" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Parallelism model
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#query-model" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Query model
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Query model">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#point-query-kmer-optionitem" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Point query — kmer → Option&lt;Item&gt;
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#aggregation-result" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Aggregation — → Result
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#datastore-derivation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        DataStore derivation
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#relationship-to-current-implementation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Relationship to current implementation
+      
+    </span>
+  </a>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+      
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+  </ul>
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+            
+              
+              <div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#fundamental-invariant" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Fundamental invariant
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#three-level-hierarchy" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Three-level hierarchy
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#mphflayer-autonomous-mapping-layer" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        MphfLayer — autonomous mapping layer
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#datastore-slot-indexed-data" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        DataStore — slot-indexed data
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#distance-matrix-api-on-datastore-types" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Distance matrix API on DataStore types
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Distance matrix API on DataStore types">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#full-distance-matrices" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Full distance matrices
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#partial-distance-matrices" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Partial distance matrices
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#progressive-aggregation-principle" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Progressive aggregation principle
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#layereddatastore-aggregation-within-one-partition" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        LayeredDataStore — aggregation within one partition
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="LayeredDataStore — aggregation within one partition">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#column-statistics" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Column statistics
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#self-contained-partials" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Self-contained partials
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#normalised-partials-require-global-sums-from-above" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Normalised partials (require global sums from above)
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#partitioneddatastore-aggregation-across-all-partitions" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PartitionedDataStore — aggregation across all partitions
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PartitionedDataStore — aggregation across all partitions">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#column-statistics_1" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Column statistics
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#self-contained-metrics-single-pass" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Self-contained metrics — single pass
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#normalised-metrics-two-passes" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Normalised metrics — two passes
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#parallelism-model" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Parallelism model
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#query-model" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Query model
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Query model">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#point-query-kmer-optionitem" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Point query — kmer → Option&lt;Item&gt;
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#aggregation-result" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Aggregation — → Result
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#datastore-derivation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        DataStore derivation
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#relationship-to-current-implementation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Relationship to current implementation
+      
+    </span>
+  </a>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+          
+          
+            <div class="md-content" data-md-component="content">
+              
+              <article class="md-content__inner md-typeset">
+                
+                  
+
+
+
+<h1 id="kmer-index-architecture">Kmer index architecture</h1>
+<h2 id="fundamental-invariant">Fundamental invariant</h2>
+<p>A given canonical kmer belongs to <strong>exactly one partition</strong> and <strong>exactly one layer</strong> within that partition. This is the property that makes all aggregation operations decomposable and parallelisable without coordination.</p>
+<hr />
+<h2 id="three-level-hierarchy">Three-level hierarchy</h2>
+<div class="highlight"><pre><span></span><code>PartitionedIndex
+├── LayeredPartition  (one per minimiser bucket)
+│   ├── MphfLayer 0         kmer → slot  (immutable bijection)
+│   │   ├── DataStore A     slot → T     (e.g. counts)
+│   │   └── DataStore B     slot → T     (e.g. presence/absence, derived)
+│   ├── MphfLayer 1
+│   │   └── DataStore A
+│   └── ...
+├── LayeredPartition
+│   └── ...
+</code></pre></div>
+<p><strong>PartitionedIndex</strong>: routes queries to partitions via canonical minimiser hash. Owns the partition count and routing scheme (fixed at creation). Dispatches aggregations across partitions in parallel.</p>
+<p><strong>LayeredPartition</strong>: one directory per minimiser bucket. Holds a <code>Vec&lt;MphfLayer&gt;</code>. Each layer covers a disjoint kmer set — layer 0 is built from dataset A; layer 1 covers kmers in B absent from layer 0; and so on. Layers within a partition are always disjoint.</p>
+<p><strong>MphfLayer</strong>: the MPHF + evidence + unitig spine. Maps <code>kmer → slot</code> for its disjoint kmer set. Immutable once built. Independent of any data attached to it.</p>
+<p><strong>DataStore</strong>: a slot-indexed data array (e.g. <code>PersistentCompactIntMatrix</code>, <code>PersistentBitMatrix</code>). Attached to a <code>MphfLayer</code> externally. Multiple stores of different types can coexist on the same <code>MphfLayer</code>.</p>
+<hr />
+<h2 id="mphflayer-autonomous-mapping-layer">MphfLayer — autonomous mapping layer</h2>
+<div class="highlight"><pre><span></span><code><span class="n">MphfLayer</span><span class="p">::</span><span class="n">find</span><span class="p">(</span><span class="n">kmer</span><span class="p">:</span><span class="w"> </span><span class="nc">CanonicalKmer</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nb">Option</span><span class="o">&lt;</span><span class="kt">usize</span><span class="o">&gt;</span><span class="w">   </span><span class="c1">// slot, or None if absent</span>
+<span class="n">MphfLayer</span><span class="p">::</span><span class="n">n</span><span class="p">()</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="kt">usize</span><span class="w">                                  </span><span class="c1">// number of slots</span>
+<span class="n">MphfLayer</span><span class="p">::</span><span class="n">build</span><span class="p">(</span><span class="n">dir</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Path</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">OLMResult</span><span class="o">&lt;</span><span class="p">(</span><span class="bp">Self</span><span class="p">,</span><span class="w"> </span><span class="kt">usize</span><span class="p">)</span><span class="o">&gt;</span><span class="w"> </span><span class="c1">// from unitigs.bin</span>
+<span class="n">MphfLayer</span><span class="p">::</span><span class="n">open</span><span class="p">(</span><span class="n">dir</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Path</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">OLMResult</span><span class="o">&lt;</span><span class="bp">Self</span><span class="o">&gt;</span>
+</code></pre></div>
+<p><code>find</code> returns <code>Some(slot)</code> only if the kmer is actually in this layer (evidence check included). Returns <code>None</code> for kmers present in other layers or absent from the index.</p>
+<p>The MPHF (<code>mphf.bin</code>, <code>evidence.bin</code>, <code>unitigs.bin</code>) is built once and never rebuilt. All data derivation operations (count → presence, thresholding, merging) reuse the same <code>MphfLayer</code>.</p>
+<hr />
+<h2 id="datastore-slot-indexed-data">DataStore — slot-indexed data</h2>
+<div class="highlight"><pre><span></span><code><span class="k">trait</span><span class="w"> </span><span class="n">DataStore</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">type</span><span class="w"> </span><span class="nc">Item</span><span class="p">;</span>
+<span class="w">    </span><span class="k">fn</span><span class="w"> </span><span class="nf">get</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">slot</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Self</span><span class="p">::</span><span class="n">Item</span><span class="p">;</span>
+<span class="w">    </span><span class="k">fn</span><span class="w"> </span><span class="nf">n</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="kt">usize</span><span class="p">;</span>
+<span class="p">}</span>
+</code></pre></div>
+<p>Concrete types from <code>obicompactvec</code>:</p>
+<table>
+<thead>
+<tr>
+<th>Type</th>
+<th><code>Item</code></th>
+<th>Column stats</th>
+<th>Use</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td><code>PersistentCompactIntMatrix</code></td>
+<td><code>Box&lt;[u32]&gt;</code></td>
+<td><code>sum() -&gt; Array1&lt;u64&gt;</code></td>
+<td>count per sample per slot</td>
+</tr>
+<tr>
+<td><code>PersistentBitMatrix</code></td>
+<td><code>Box&lt;[bool]&gt;</code></td>
+<td><code>count_ones() -&gt; Array1&lt;u64&gt;</code></td>
+<td>presence per sample per slot</td>
+</tr>
+</tbody>
+</table>
+<p><code>sum()</code> and <code>count_ones()</code> are the bridge between the per-matrix level and cross-layer aggregation: they give the total weight of each column within one (partition, layer) pair, which can be summed to get global column weights.</p>
+<p>A <code>DataStore</code> knows nothing about kmers or MPHFs. It is indexed by <code>usize</code> slot only.</p>
+<hr />
+<h2 id="distance-matrix-api-on-datastore-types">Distance matrix API on DataStore types</h2>
+<p>Both <code>PersistentCompactIntMatrix</code> and <code>PersistentBitMatrix</code> expose two families of distance matrix methods.</p>
+<h3 id="full-distance-matrices">Full distance matrices</h3>
+<p>Compute the final <code>n_cols × n_cols</code> distance matrix from data within a single matrix. Internally parallelised over the upper triangle via rayon.</p>
+<div class="highlight"><pre><span></span><code><span class="c1">// PersistentCompactIntMatrix</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">bray_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">              </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">relfreq_bray_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">      </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">euclidean_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">         </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">relfreq_euclidean_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">hellinger_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">         </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">jaccard_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">           </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">threshold_jaccard_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">threshold</span><span class="p">:</span><span class="w"> </span><span class="kt">u32</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+
+<span class="c1">// PersistentBitMatrix</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">jaccard_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">           </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">hamming_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">           </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span>
+</code></pre></div>
+<p>These are convenience methods. For a <code>LayeredDataStore</code> or <code>PartitionedDataStore</code> they cannot be used directly — the partial API is required.</p>
+<h3 id="partial-distance-matrices">Partial distance matrices</h3>
+<p>Return additive components that can be summed element-wise across (partition, layer) pairs before computing the final distance. This is what makes cross-layer and cross-partition aggregation possible.</p>
+<p><strong>Category 1 — self-contained partials</strong>: additive without any external parameter.</p>
+<div class="highlight"><pre><span></span><code><span class="c1">// PersistentCompactIntMatrix</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_bray_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span>
+<span class="w">    </span><span class="p">-&gt;</span><span class="w"> </span><span class="p">(</span><span class="n">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">,</span><span class="w">  </span><span class="c1">// sum_min[i,j]</span>
+<span class="w">        </span><span class="n">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span><span class="w">  </span><span class="c1">// col_sums[k]</span>
+
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_euclidean_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">       </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span><span class="w">   </span><span class="c1">// sum of squared diffs</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_threshold_jaccard_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">threshold</span><span class="p">:</span><span class="w"> </span><span class="kt">u32</span><span class="p">)</span>
+<span class="w">    </span><span class="p">-&gt;</span><span class="w"> </span><span class="p">(</span><span class="n">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">,</span><span class="w">  </span><span class="c1">// inter[i,j]</span>
+<span class="w">        </span><span class="n">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span><span class="w">  </span><span class="c1">// union[i,j]</span>
+
+<span class="c1">// PersistentBitMatrix</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_jaccard_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span>
+<span class="w">    </span><span class="p">-&gt;</span><span class="w"> </span><span class="p">(</span><span class="n">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">,</span><span class="w">  </span><span class="c1">// inter[i,j]</span>
+<span class="w">        </span><span class="n">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span><span class="w">  </span><span class="c1">// union[i,j]</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_hamming_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">         </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="w">   </span><span class="c1">// differing bits</span>
+</code></pre></div>
+<p><strong>Category 2 — normalised partials</strong>: require global column sums as input, computed beforehand across all (partition, layer) pairs.</p>
+<div class="highlight"><pre><span></span><code><span class="c1">// PersistentCompactIntMatrix only</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_relfreq_bray_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">col_sums</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span>
+<span class="w">    </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span><span class="w">   </span><span class="c1">// Σ_slot min(a_slot/sum_i, b_slot/sum_j)</span>
+
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_relfreq_euclidean_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">col_sums</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span>
+<span class="w">    </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span><span class="w">   </span><span class="c1">// Σ_slot (a_slot/sum_i - b_slot/sum_j)²</span>
+
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_hellinger_euclidean_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">col_sums</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span>
+<span class="w">    </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span><span class="w">   </span><span class="c1">// Σ_slot (√(a/sum_i) - √(b/sum_j))²</span>
+</code></pre></div>
+<p>The <code>col_sums</code> parameter must reflect the GLOBAL count across all layers and all partitions — passing a per-layer sum would give a wrong result. This constraint drives the two-pass algorithm described below.</p>
+<hr />
+<h2 id="progressive-aggregation-principle">Progressive aggregation principle</h2>
+<p>Aggregation is <strong>hierarchical</strong>: each level computes its contribution by aggregating from the level immediately below it. No level skips a level or collects raw data from two levels down.</p>
+<div class="highlight"><pre><span></span><code>PersistentCompactIntMatrix::sum()       — column sums for one (partition, layer) matrix
+        ↓ Σ across layers
+LayeredCompactIntMatrix::sum()          — column sums for one partition
+        ↓ Σ across partitions
+PartitionedCompactIntMatrix::sum()      — global column sums
+</code></pre></div>
+<p>The same cascade applies to every partial computation:</p>
+<div class="highlight"><pre><span></span><code>PersistentCompactIntMatrix::partial_bray_dist_matrix()   — one (partition, layer)
+        ↓ element-wise Σ across layers
+LayeredCompactIntMatrix::partial_bray()                   — one partition
+        ↓ element-wise Σ across partitions
+PartitionedCompactIntMatrix::partial_bray()               — global partial → final dist
+</code></pre></div>
+<p>This means <code>LayeredCompactIntMatrix</code> never inspects individual <code>PersistentCompactIntVec</code> columns directly, and <code>PartitionedCompactIntMatrix</code> never inspects individual layers. Each level presents a stable API surface to the level above.</p>
+<hr />
+<h2 id="layereddatastore-aggregation-within-one-partition">LayeredDataStore — aggregation within one partition</h2>
+<p>A <code>LayeredDataStore</code> holds one <code>DataStore</code> per layer within a single partition:</p>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">LayeredCompactIntMatrix</span><span class="w"> </span><span class="p">{</span><span class="w"> </span><span class="n">layers</span><span class="p">:</span><span class="w"> </span><span class="nb">Vec</span><span class="o">&lt;</span><span class="n">PersistentCompactIntMatrix</span><span class="o">&gt;</span><span class="w"> </span><span class="p">}</span>
+<span class="k">struct</span><span class="w"> </span><span class="nc">LayeredBitMatrix</span><span class="w">         </span><span class="p">{</span><span class="w"> </span><span class="n">layers</span><span class="p">:</span><span class="w"> </span><span class="nb">Vec</span><span class="o">&lt;</span><span class="n">PersistentBitMatrix</span><span class="o">&gt;</span><span class="w"> </span><span class="p">}</span>
+</code></pre></div>
+<h3 id="column-statistics">Column statistics</h3>
+<div class="highlight"><pre><span></span><code><span class="c1">// LayeredCompactIntMatrix</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">sum</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span>
+<span class="w">    </span><span class="c1">// = layers.par_iter().map(|m| m.sum()).reduce(element-wise +)</span>
+
+<span class="c1">// LayeredBitMatrix</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">count_ones</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span>
+<span class="w">    </span><span class="c1">// = layers.par_iter().map(|m| m.count_ones()).reduce(element-wise +)</span>
+</code></pre></div>
+<h3 id="self-contained-partials">Self-contained partials</h3>
+<p>Each method reduces across layers by element-wise addition of per-layer matrices:</p>
+<div class="highlight"><pre><span></span><code><span class="k">fn</span><span class="w"> </span><span class="nf">partial_bray</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">          </span><span class="p">-&gt;</span><span class="w"> </span><span class="p">(</span><span class="n">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">,</span><span class="w"> </span><span class="n">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span>
+<span class="w">    </span><span class="c1">// Σ_l layer_l.partial_bray_dist_matrix()</span>
+
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_euclidean</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">      </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="w">    </span><span class="c1">// Σ_l layer_l.partial_euclidean_dist_matrix()</span>
+
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_jaccard</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">        </span><span class="p">-&gt;</span><span class="w"> </span><span class="p">(</span><span class="n">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">,</span><span class="w"> </span><span class="n">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span>
+<span class="w">    </span><span class="c1">// Σ_l layer_l.partial_jaccard_dist_matrix()  [bit matrix]</span>
+<span class="w">    </span><span class="c1">// Σ_l layer_l.partial_threshold_jaccard_dist_matrix()  [int matrix]</span>
+
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_hamming</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">        </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span>
+<span class="w">    </span><span class="c1">// Σ_l layer_l.partial_hamming_dist_matrix()  [bit matrix]</span>
+</code></pre></div>
+<h3 id="normalised-partials-require-global-sums-from-above">Normalised partials (require global sums from above)</h3>
+<div class="highlight"><pre><span></span><code><span class="k">fn</span><span class="w"> </span><span class="nf">partial_relfreq_bray</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">global_sums</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="w">    </span><span class="c1">// Σ_l layer_l.partial_relfreq_bray_dist_matrix(global_sums)</span>
+
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_relfreq_euclidean</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">global_sums</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="w">    </span><span class="c1">// Σ_l layer_l.partial_relfreq_euclidean_dist_matrix(global_sums)</span>
+
+<span class="k">fn</span><span class="w"> </span><span class="nf">partial_hellinger</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">global_sums</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span>
+<span class="w">    </span><span class="c1">// Σ_l layer_l.partial_hellinger_euclidean_dist_matrix(global_sums)</span>
+</code></pre></div>
+<p><code>global_sums</code> is provided by the <code>PartitionedDataStore</code>; this level does not compute it.</p>
+<hr />
+<h2 id="partitioneddatastore-aggregation-across-all-partitions">PartitionedDataStore — aggregation across all partitions</h2>
+<p>A <code>PartitionedDataStore</code> holds one <code>LayeredDataStore</code> per partition:</p>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">PartitionedCompactIntMatrix</span><span class="w"> </span><span class="p">{</span><span class="w"> </span><span class="n">partitions</span><span class="p">:</span><span class="w"> </span><span class="nb">Vec</span><span class="o">&lt;</span><span class="n">LayeredCompactIntMatrix</span><span class="o">&gt;</span><span class="w"> </span><span class="p">}</span>
+<span class="k">struct</span><span class="w"> </span><span class="nc">PartitionedBitMatrix</span><span class="w">         </span><span class="p">{</span><span class="w"> </span><span class="n">partitions</span><span class="p">:</span><span class="w"> </span><span class="nb">Vec</span><span class="o">&lt;</span><span class="n">LayeredBitMatrix</span><span class="o">&gt;</span><span class="w"> </span><span class="p">}</span>
+</code></pre></div>
+<h3 id="column-statistics_1">Column statistics</h3>
+<div class="highlight"><pre><span></span><code><span class="k">fn</span><span class="w"> </span><span class="nf">sum</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array1</span><span class="o">&lt;</span><span class="kt">u64</span><span class="o">&gt;</span>
+<span class="w">    </span><span class="c1">// = partitions.par_iter().map(|p| p.sum()).reduce(element-wise +)</span>
+</code></pre></div>
+<p><code>p.sum()</code> is itself a reduction across layers (see above) — the cascade is preserved.</p>
+<h3 id="self-contained-metrics-single-pass">Self-contained metrics — single pass</h3>
+<div class="highlight"><pre><span></span><code><span class="k">fn</span><span class="w"> </span><span class="nf">bray_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="kd">let</span><span class="w"> </span><span class="p">(</span><span class="n">sum_min</span><span class="p">,</span><span class="w"> </span><span class="n">col_sums</span><span class="p">)</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="n">partitions</span>
+<span class="w">        </span><span class="p">.</span><span class="n">par_iter</span><span class="p">()</span>
+<span class="w">        </span><span class="p">.</span><span class="n">map</span><span class="p">(</span><span class="o">|</span><span class="n">p</span><span class="o">|</span><span class="w"> </span><span class="n">p</span><span class="p">.</span><span class="n">partial_bray</span><span class="p">())</span>
+<span class="w">        </span><span class="p">.</span><span class="n">reduce</span><span class="p">(</span><span class="n">element</span><span class="o">-</span><span class="n">wise</span><span class="w"> </span><span class="o">+</span><span class="p">);</span>
+<span class="w">    </span><span class="c1">// finalise</span>
+<span class="w">    </span><span class="k">for</span><span class="w"> </span><span class="p">(</span><span class="n">i</span><span class="p">,</span><span class="n">j</span><span class="p">):</span><span class="w"> </span><span class="nc">dist</span><span class="p">[</span><span class="n">i</span><span class="p">,</span><span class="n">j</span><span class="p">]</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="mi">1</span><span class="w"> </span><span class="o">-</span><span class="w"> </span><span class="mi">2</span><span class="err">·</span><span class="n">sum_min</span><span class="p">[</span><span class="n">i</span><span class="p">,</span><span class="n">j</span><span class="p">]</span><span class="w"> </span><span class="o">/</span><span class="w"> </span><span class="p">(</span><span class="n">col_sums</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="w"> </span><span class="o">+</span><span class="w"> </span><span class="n">col_sums</span><span class="p">[</span><span class="n">j</span><span class="p">])</span>
+<span class="p">}</span>
+</code></pre></div>
+<h3 id="normalised-metrics-two-passes">Normalised metrics — two passes</h3>
+<div class="highlight"><pre><span></span><code><span class="k">fn</span><span class="w"> </span><span class="nf">relfreq_bray_dist_matrix</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Array2</span><span class="o">&lt;</span><span class="kt">f64</span><span class="o">&gt;</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="c1">// pass 1 — progressive: PartitionedDataStore::sum()</span>
+<span class="w">    </span><span class="c1">//   calls LayeredDataStore::sum() per partition (parallel)</span>
+<span class="w">    </span><span class="c1">//     calls PersistentCompactIntMatrix::sum() per layer (parallel)</span>
+<span class="w">    </span><span class="kd">let</span><span class="w"> </span><span class="n">global_sums</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="bp">self</span><span class="p">.</span><span class="n">sum</span><span class="p">();</span>
+
+<span class="w">    </span><span class="c1">// pass 2 — per-partition partial using global_sums (parallel)</span>
+<span class="w">    </span><span class="kd">let</span><span class="w"> </span><span class="n">matrix</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="n">partitions</span>
+<span class="w">        </span><span class="p">.</span><span class="n">par_iter</span><span class="p">()</span>
+<span class="w">        </span><span class="p">.</span><span class="n">map</span><span class="p">(</span><span class="o">|</span><span class="n">p</span><span class="o">|</span><span class="w"> </span><span class="n">p</span><span class="p">.</span><span class="n">partial_relfreq_bray</span><span class="p">(</span><span class="o">&amp;</span><span class="n">global_sums</span><span class="p">))</span>
+<span class="w">        </span><span class="p">.</span><span class="n">reduce</span><span class="p">(</span><span class="n">element</span><span class="o">-</span><span class="n">wise</span><span class="w"> </span><span class="o">+</span><span class="p">);</span>
+<span class="w">    </span><span class="c1">// finalise</span>
+<span class="w">    </span><span class="k">for</span><span class="w"> </span><span class="p">(</span><span class="n">i</span><span class="p">,</span><span class="n">j</span><span class="p">):</span><span class="w"> </span><span class="nc">dist</span><span class="p">[</span><span class="n">i</span><span class="p">,</span><span class="n">j</span><span class="p">]</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="mi">1</span><span class="w"> </span><span class="o">-</span><span class="w"> </span><span class="n">matrix</span><span class="p">[</span><span class="n">i</span><span class="p">,</span><span class="n">j</span><span class="p">]</span>
+<span class="p">}</span>
+</code></pre></div>
+<p><code>global_sums</code> is exact because each kmer belongs to exactly one (partition, layer) pair — no double-counting. Pass 1 is itself fully parallel at every level of the hierarchy.</p>
+<hr />
+<h2 id="parallelism-model">Parallelism model</h2>
+<table>
+<thead>
+<tr>
+<th>Level</th>
+<th>Unit</th>
+<th>Coordination</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td>Across partitions</td>
+<td><code>LayeredDataStore</code></td>
+<td>none — fully independent</td>
+</tr>
+<tr>
+<td>Across layers (self-contained)</td>
+<td><code>(partition, layer)</code> pair</td>
+<td>none — disjoint kmer sets</td>
+</tr>
+<tr>
+<td>Across layers (normalised, pass 1)</td>
+<td><code>(partition, layer)</code> pair</td>
+<td>none — sums are additive</td>
+</tr>
+<tr>
+<td>Across layers (normalised, pass 2)</td>
+<td><code>(partition, layer)</code> pair</td>
+<td>global_sums broadcast read-only</td>
+</tr>
+<tr>
+<td>Within a DataStore (distance matrix)</td>
+<td>upper-triangle pair <code>(i,j)</code></td>
+<td>none — rayon par_iter</td>
+</tr>
+</tbody>
+</table>
+<hr />
+<h2 id="query-model">Query model</h2>
+<h3 id="point-query-kmer-optionitem">Point query — <code>kmer → Option&lt;Item&gt;</code></h3>
+<div class="highlight"><pre><span></span><code>minimiser(kmer) → partition p
+for each layer l in p:
+    slot = MphfLayer_l.find(kmer)
+    if slot is Some:
+        return DataStore_l.get(slot)
+return None
+</code></pre></div>
+<p>O(n_layers) MPHF probes worst case; O(1) expected. No cross-layer fusion — the result comes from exactly one (partition, layer).</p>
+<h3 id="aggregation-result">Aggregation — <code>→ Result</code></h3>
+<div class="highlight"><pre><span></span><code>result = reduce(
+    for p in partitions:            // parallel
+        for l in layers(p):         // parallel
+            partial(DataStore_p_l)
+)
+</code></pre></div>
+<p>For normalised metrics replace with the two-pass scheme above.</p>
+<hr />
+<h2 id="datastore-derivation">DataStore derivation</h2>
+<p>Because the <code>MphfLayer</code> is independent of its data stores, new stores can be derived from existing ones without rebuilding the MPHF:</p>
+<div class="highlight"><pre><span></span><code>// count → presence/absence, parallel across (partition, layer)
+for (p, l) in all_partition_layer_pairs().par_iter():
+    count_store   = open PersistentCompactIntMatrix at (p, l)
+    presence_store = PersistentBitMatrix::from_count_matrix(count_store, threshold, dir)
+</code></pre></div>
+<p>Other derivations: threshold a count matrix → binary presence matrix; union two presence matrices; merge two count matrices (saturating add, column-wise). All are local to one <code>(partition, layer)</code> pair.</p>
+<hr />
+<h2 id="relationship-to-current-implementation">Relationship to current implementation</h2>
+<p>The current <code>obilayeredmap</code> crate implements a subset of this architecture. Key divergences:</p>
+<ul>
+<li><code>Layer&lt;D: LayerData&gt;</code> fuses <code>MphfLayer</code> and one <code>DataStore</code> into a single generic type. Multiple data stores on the same MPHF are not supported.</li>
+<li><code>LayerData::open(dir)</code> embeds the path convention (<code>counts/</code>, <code>presence/</code>) inside the store type, preventing the <code>PartitionedIndex</code> from managing paths externally.</li>
+<li><code>LayeredDataStore</code> and <code>PartitionedDataStore</code> do not yet exist; <code>LayeredMap</code> is a single-partition structure without a distance matrix API.</li>
+<li>The partial distance methods exist on <code>PersistentCompactIntMatrix</code> and <code>PersistentBitMatrix</code> and are tested; they are not yet composed across layers and partitions.</li>
+</ul>
+<p>Planned refactoring:
+1. Extract <code>MphfLayer</code> from <code>Layer&lt;D&gt;</code> as an autonomous type.
+2. Replace <code>LayerData</code> trait with <code>DataStore</code> trait (no path knowledge).
+3. Implement <code>LayeredCompactIntMatrix</code> / <code>LayeredBitMatrix</code> with the partial + full distance APIs described above.
+4. Implement <code>PartitionedCompactIntMatrix</code> / <code>PartitionedBitMatrix</code> with two-pass support for normalised metrics.
+5. Implement <code>PartitionedIndex</code> for point queries with parallel dispatch.</p>
+
+
+
+
+
+
+
+
+
+
+
+
+                
+              </article>
+            </div>
+          
+          
+<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>
+        </div>
+        
+      </main>
+      
+        <footer class="md-footer">
+  
+  <div class="md-footer-meta md-typeset">
+    <div class="md-footer-meta__inner md-grid">
+      <div class="md-copyright">
+  
+  
+    Made with
+    <a href="https://squidfunk.github.io/mkdocs-material/" target="_blank" rel="noopener">
+      Material for MkDocs
+    </a>
+  
+</div>
+      
+    </div>
+  </div>
+</footer>
+      
+    </div>
+    <div class="md-dialog" data-md-component="dialog">
+      <div class="md-dialog__inner md-typeset"></div>
+    </div>
+    
+    
+    
+      
+      
+      <script id="__config" type="application/json">{"annotate": null, "base": "../..", "features": [], "search": "../../assets/javascripts/workers/search.2c215733.min.js", "tags": null, "translations": {"clipboard.copied": "Copied to clipboard", "clipboard.copy": "Copy to clipboard", "search.result.more.one": "1 more on this page", "search.result.more.other": "# more on this page", "search.result.none": "No matching documents", "search.result.one": "1 matching document", "search.result.other": "# matching documents", "search.result.placeholder": "Type to start searching", "search.result.term.missing": "Missing", "select.version": "Select version"}, "version": null}</script>
+    
+    
+      <script src="../../assets/javascripts/bundle.79ae519e.min.js"></script>
+      
+        <script src="https://unpkg.com/mathjax@3/es5/tex-mml-chtml.js"></script>
+      
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/doc/architecture/sequences/invariant/index.html b/doc/architecture/sequences/invariant/index.html
index 21b5634..c754d77 100644
--- a/doc/architecture/sequences/invariant/index.html
+++ b/doc/architecture/sequences/invariant/index.html
@@ -9,9 +9,11 @@
       
       
       
-        <link rel="prev" href="../../../implementation/unitig_evidence/">
+        <link rel="prev" href="../../../implementation/persistent_bit_vec/">
       
       
+        <link rel="next" href="../../index_architecture/">
+      
       
         
       
@@ -639,6 +641,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../../implementation/obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../../implementation/persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../../implementation/persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -733,6 +819,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/implementation/chunkreader/index.html b/doc/implementation/chunkreader/index.html
index e48d405..b638090 100644
--- a/doc/implementation/chunkreader/index.html
+++ b/doc/implementation/chunkreader/index.html
@@ -347,6 +347,42 @@
   
 
     
+  </span>
+</a>
+</li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="../obilayeredmap/">
+<span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+</a>
+</li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="../persistent_compact_int_vec/">
+<span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+</a>
+</li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="../persistent_bit_vec/">
+<span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
   </span>
 </a>
 </li>
@@ -385,6 +421,18 @@
   
 
     
+  </span>
+</a>
+</li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="../../architecture/index_architecture/">
+<span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
   </span>
 </a>
 </li>
diff --git a/doc/implementation/kmer/index.html b/doc/implementation/kmer/index.html
index 30326c5..91f0ea8 100644
--- a/doc/implementation/kmer/index.html
+++ b/doc/implementation/kmer/index.html
@@ -745,6 +745,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -827,6 +911,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/implementation/mphf/index.html b/doc/implementation/mphf/index.html
index d3e525c..a20e083 100644
--- a/doc/implementation/mphf/index.html
+++ b/doc/implementation/mphf/index.html
@@ -745,6 +745,89 @@
     </span>
   </a>
   
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#multilayer-index-architecture" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Multilayer index architecture
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Multilayer index architecture">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#motivation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Motivation
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#layer-structure" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Layer structure
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#membership-verification" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Membership verification
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#query-algorithm" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Query algorithm
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#layer-count-and-probe-cost" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Layer count and probe cost
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#merging-layers" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Merging layers
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
 </li>
       
         <li class="md-nav__item">
@@ -795,6 +878,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -877,6 +1044,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -1002,6 +1197,89 @@
     </span>
   </a>
   
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#multilayer-index-architecture" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Multilayer index architecture
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Multilayer index architecture">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#motivation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Motivation
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#layer-structure" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Layer structure
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#membership-verification" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Membership verification
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#query-algorithm" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Query algorithm
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#layer-count-and-probe-cost" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Layer count and probe cost
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#merging-layers" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Merging layers
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
 </li>
       
         <li class="md-nav__item">
@@ -1071,7 +1349,7 @@
 </ul>
 <h2 id="mphf-choice-per-phase">MPHF choice per phase</h2>
 <p><strong>Phase 1</strong> (provisional, discarded after spectrum computation): FMPHGO. Tolerates overestimated capacity, compact, no need to optimise for query speed on a temporary structure.</p>
-<p><strong>Phase 2</strong> (persistent, queried repeatedly): open between FMPHGO and ptr_hash. Exact key count is available, so both operate optimally. ptr_hash's query speed advantage (2.1–3.3×) is meaningful for the persistent index but carries the risk of a very young crate. FMPHGO is the conservative default; ptr_hash is worth revisiting once it has broader production use.</p>
+<p><strong>Phase 2</strong> (persistent, queried repeatedly): <strong>ptr_hash</strong>. Exact key count is available at phase 2, so ptr_hash operates optimally. Its query speed (≥2.1× over FMPHGO) and construction speed (≥3.1×) are meaningful for the persistent index; the space overhead at 2.4 bits/key is acceptable. The crate's youth (Feb 2025) was previously a concern; it is now accepted given the performance profile and the fact that each layer MPHF is independently rebuildable from its unitig file if needed.</p>
 <p>boomphf is effectively eliminated: its space overhead is the largest and its streaming-construction advantage does not apply here.</p>
 <hr />
 <h2 id="space-at-scale">Space at scale</h2>
@@ -1106,12 +1384,47 @@
 <h2 id="on-disk-and-mmap-considerations">On-disk and mmap considerations</h2>
 <p>All three are in-memory structures. Their internal representation is flat bit arrays (no heap pointers), making them serialisable as contiguous byte blobs and mmappable per partition. True zero-copy access would require rkyv integration; the <code>ph</code> crate currently uses serde, so loading involves a copy. Given per-partition MPHF sizes of 1–8 MB, the OS page cache handles this transparently — strict zero-copy is a refinement, not a blocker.</p>
 <p>No established Rust crate provides a natively on-disk MPHF. <strong>SSHash</strong> (Sparse and Skew Hash) is a complete kmer dictionary designed for disk access and is order-preserving (overlapping kmers receive consecutive indices → cache-friendly count access), but it is C++-only and covers more than just the MPHF layer.</p>
+<hr />
+<h2 id="multilayer-index-architecture">Multilayer index architecture</h2>
+<h3 id="motivation">Motivation</h3>
+<p>An index built from a single dataset A can be extended with a new dataset B without rebuilding. This supports incremental construction (adding species, samples, or sequencing runs) and enables set operations across heterogeneous sources.</p>
+<h3 id="layer-structure">Layer structure</h3>
+<p>Each layer is a self-contained unit:</p>
+<div class="highlight"><pre><span></span><code>layer_i/
+  unitigs.bin     — packed 2-bit nucleotide sequences
+  mphf.bin        — ptr_hash index (phase-2, exact key count)
+  evidence.bin    — [(unitig_id, rank)] per MPHF slot  (see unitig_evidence.md)
+  counts.bin      — [u32] per MPHF slot
+</code></pre></div>
+<p>Layers are <strong>disjoint</strong>: a canonical kmer belongs to exactly one layer. Layer 0 is built from dataset A. Adding dataset B proceeds as follows:</p>
+<ol>
+<li>For each kmer in B: query layer 0 — if found, accumulate count into <code>counts_0[MPHF_0(kmer)]</code>.</li>
+<li>Collect all kmers of B not present in any existing layer → set <code>B \ A</code>.</li>
+<li>Build layer 1 from <code>B \ A</code> using the standard two-phase pipeline (spectrum, filter, ptr_hash).</li>
+</ol>
+<p>Adding a third dataset C repeats the process: probe layer 0, then layer 1, then build layer 2 from <code>C \ A \ B</code>.</p>
+<h3 id="membership-verification">Membership verification</h3>
+<p>ptr_hash maps any input to a valid slot — it does not natively detect absent keys. Membership is verified using the evidence entry: decode the kmer from <code>(unitig_id, rank)</code> and compare to the query. A mismatch means the kmer is absent from this layer; probe the next layer.</p>
+<p>This makes the evidence layer load-bearing for correctness, not only for locality.</p>
+<h3 id="query-algorithm">Query algorithm</h3>
+<div class="highlight"><pre><span></span><code>fn query(kmer) → Option&lt;count&gt;:
+    for layer in layers:
+        slot = layer.mphf.query(kmer)
+        if layer.evidence.decode(slot) == kmer:
+            return Some(layer.counts[slot])
+    return None
+</code></pre></div>
+<p>Expected probe depth: 1 for kmers present in layer 0, increasing for rare kmers added in later layers. In practice, the dominant dataset (largest A) should be layer 0 to minimise average probe depth.</p>
+<h3 id="layer-count-and-probe-cost">Layer count and probe cost</h3>
+<p>Each probe is a ptr_hash lookup (~10 ns) plus one evidence decode (two array accesses). For L layers the worst case is L probes + 1 None. In practice L is small (2–5 for typical multi-species databases). No global data structure is needed to route queries; the layer chain is traversed in order.</p>
+<h3 id="merging-layers">Merging layers</h3>
+<p>Two layer chains can be merged by re-indexing their union through the standard pipeline. This is expensive (full rebuild) but produces an optimal single-layer index. Merge is a maintenance operation, not a query-path requirement.</p>
 <h2 id="open-questions">Open questions</h2>
 <ul>
 <li>Confirm actual partition sizes and overestimation factor on representative metagenomic datasets.</li>
-<li>Revisit ptr_hash for phase 2 once the crate has broader production track record.</li>
-<li>Assess rkyv integration cost for FMPHGO if true zero-copy mmap becomes necessary for the persistent index.</li>
+<li><strong>rkyv integration</strong>: all flat arrays in a layer (evidence, counts, presence/absence matrix) map trivially to <code>rkyv::Archive</code> — fixed-size element types, no heap indirection. The presence/absence matrix is the strongest case: at 10 M kmers × 1 000 samples ≈ 1.25 GB per partition, zero-copy mmap via rkyv avoids loading the entire matrix at open time, letting the OS page cache serve only accessed pages. ptr_hash itself is internally a flat bit array and is structurally compatible with rkyv, but requires either native crate support or a wrapper. Assess the wrapper cost and whether ptr_hash is willing to adopt rkyv upstream.</li>
 <li>Keep SSHash in mind if the indexing architecture is reconsidered at a higher level.</li>
+<li>Determine optimal layer ordering heuristic (by kmer count? by query frequency?) for multi-species databases.</li>
 </ul>
 
 
diff --git a/doc/implementation/obilayeredmap/index.html b/doc/implementation/obilayeredmap/index.html
new file mode 100644
index 0000000..f203e82
--- /dev/null
+++ b/doc/implementation/obilayeredmap/index.html
@@ -0,0 +1,1611 @@
+
+<!doctype html>
+<html lang="en" class="no-js">
+  <head>
+    
+      <meta charset="utf-8">
+      <meta name="viewport" content="width=device-width,initial-scale=1">
+      
+      
+      
+      
+        <link rel="prev" href="../unitig_evidence/">
+      
+      
+        <link rel="next" href="../persistent_compact_int_vec/">
+      
+      
+        
+      
+      
+      <link rel="icon" href="../../assets/images/favicon.png">
+      <meta name="generator" content="mkdocs-1.6.1, mkdocs-material-9.7.6">
+    
+    
+      
+        <title>obilayeredmap crate - obikmer</title>
+      
+    
+    
+      <link rel="stylesheet" href="../../assets/stylesheets/main.484c7ddc.min.css">
+      
+      
+
+
+    
+    
+      
+    
+    
+      
+        
+        
+        <link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
+        <link rel="stylesheet" href="https://fonts.googleapis.com/css?family=Roboto:300,300i,400,400i,700,700i%7CRoboto+Mono:400,400i,700,700i&display=fallback">
+        <style>:root{--md-text-font:"Roboto";--md-code-font:"Roboto Mono"}</style>
+      
+    
+    
+    <script>__md_scope=new URL("../..",location),__md_hash=e=>[...e].reduce(((e,_)=>(e<<5)-e+_.charCodeAt(0)),0),__md_get=(e,_=localStorage,t=__md_scope)=>JSON.parse(_.getItem(t.pathname+"."+e)),__md_set=(e,_,t=localStorage,a=__md_scope)=>{try{t.setItem(a.pathname+"."+e,JSON.stringify(_))}catch(e){}}</script>
+    
+      
+
+    
+    
+  </head>
+  
+  
+    <body dir="ltr">
+  
+    
+    <input class="md-toggle" data-md-toggle="drawer" type="checkbox" id="__drawer" autocomplete="off">
+    <input class="md-toggle" data-md-toggle="search" type="checkbox" id="__search" autocomplete="off">
+    <label class="md-overlay" for="__drawer"></label>
+    <div data-md-component="skip">
+      
+        
+        <a href="#obilayeredmap-layered-kmer-index-crate" class="md-skip">
+          Skip to content
+        </a>
+      
+    </div>
+    <div data-md-component="announce">
+      
+    </div>
+    
+    
+      
+
+  
+
+<header class="md-header md-header--shadow" data-md-component="header">
+  <nav class="md-header__inner md-grid" aria-label="Header">
+    <a href="../.." title="obikmer" class="md-header__button md-logo" aria-label="obikmer" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    <label class="md-header__button md-icon" for="__drawer">
+      
+      <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M3 6h18v2H3zm0 5h18v2H3zm0 5h18v2H3z"/></svg>
+    </label>
+    <div class="md-header__title" data-md-component="header-title">
+      <div class="md-header__ellipsis">
+        <div class="md-header__topic">
+          <span class="md-ellipsis">
+            obikmer
+          </span>
+        </div>
+        <div class="md-header__topic" data-md-component="header-topic">
+          <span class="md-ellipsis">
+            
+              obilayeredmap crate
+            
+          </span>
+        </div>
+      </div>
+    </div>
+    
+    
+      <script>var palette=__md_get("__palette");if(palette&&palette.color){if("(prefers-color-scheme)"===palette.color.media){var media=matchMedia("(prefers-color-scheme: light)"),input=document.querySelector(media.matches?"[data-md-color-media='(prefers-color-scheme: light)']":"[data-md-color-media='(prefers-color-scheme: dark)']");palette.color.media=input.getAttribute("data-md-color-media"),palette.color.scheme=input.getAttribute("data-md-color-scheme"),palette.color.primary=input.getAttribute("data-md-color-primary"),palette.color.accent=input.getAttribute("data-md-color-accent")}for(var[key,value]of Object.entries(palette.color))document.body.setAttribute("data-md-color-"+key,value)}</script>
+    
+    
+    
+    
+  </nav>
+  
+</header>
+    
+    <div class="md-container" data-md-component="container">
+      
+      
+        
+          
+        
+      
+      <main class="md-main" data-md-component="main">
+        <div class="md-main__inner md-grid">
+          
+            
+              
+              <div class="md-sidebar md-sidebar--primary" data-md-component="sidebar" data-md-type="navigation" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+
+
+<nav class="md-nav md-nav--primary" aria-label="Navigation" data-md-level="0">
+  <label class="md-nav__title" for="__drawer">
+    <a href="../.." title="obikmer" class="md-nav__button md-logo" aria-label="obikmer" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    obikmer
+  </label>
+  
+  <ul class="md-nav__list" data-md-scrollfix>
+    
+      
+      
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../.." class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Home
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+    
+      
+      
+  
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_2" >
+        
+          
+          <label class="md-nav__link" for="__nav_2" id="__nav_2_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Theory
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_2_label" aria-expanded="false">
+          <label class="md-nav__title" for="__nav_2">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Theory
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../kmers/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmers and super-kmers
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/encoding/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    DNA encoding
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/entropy/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Entropy filter
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/minimizer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Minimizer selection
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/indexing/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Partitioning architecture
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+      
+      
+  
+  
+    
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--active md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_3" checked>
+        
+          
+          <label class="md-nav__link" for="__nav_3" id="__nav_3_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Implementation
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_3_label" aria-expanded="true">
+          <label class="md-nav__title" for="__nav_3">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Implementation
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../superkmer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    SuperKmer
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../kmer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../chunkreader/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Chunk reader
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../pipeline/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Construction pipeline
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obipipeline/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obipipeline library
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../storage/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    On-disk storage
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../mphf/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    MPHF selection
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../unitig_evidence/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Unitig evidence encoding
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+    
+  
+  
+  
+    <li class="md-nav__item md-nav__item--active">
+      
+      <input class="md-nav__toggle md-toggle" type="checkbox" id="__toc">
+      
+      
+        
+      
+      
+        <label class="md-nav__link md-nav__link--active" for="__toc">
+          
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+          <span class="md-nav__icon md-icon"></span>
+        </label>
+      
+      <a href="./" class="md-nav__link md-nav__link--active">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+      
+        
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#purpose" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Purpose
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#four-usage-modes" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Four usage modes
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Four usage modes">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#payload-for-modes-24-persistentcompactintmatrix" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Payload for modes 2/4: PersistentCompactIntMatrix
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#payload-for-mode-3-persistentbitmatrix" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Payload for mode 3: PersistentBitMatrix
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#payload-architecture" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Payload architecture
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#three-level-hierarchy" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Three-level hierarchy
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#layer-file-layout" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Layer file layout
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Layer file layout">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#evidence-encoding" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Evidence encoding
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#ptr_hash-configuration" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        ptr_hash configuration
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#build-path" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Build path
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#query-path" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Query path
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#add-layer-algorithm" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Add-layer algorithm
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#dependencies" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Dependencies
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#relationship-to-target-architecture" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Relationship to target architecture
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#open-questions" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Open questions
+      
+    </span>
+  </a>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+      
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+      
+      
+  
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_4" >
+        
+          
+          <label class="md-nav__link" for="__nav_4" id="__nav_4_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Architecture
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_4_label" aria-expanded="false">
+          <label class="md-nav__title" for="__nav_4">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Architecture
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/sequences/invariant/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Sequences
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+  </ul>
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+            
+              
+              <div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#purpose" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Purpose
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#four-usage-modes" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Four usage modes
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Four usage modes">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#payload-for-modes-24-persistentcompactintmatrix" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Payload for modes 2/4: PersistentCompactIntMatrix
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#payload-for-mode-3-persistentbitmatrix" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Payload for mode 3: PersistentBitMatrix
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#payload-architecture" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Payload architecture
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#three-level-hierarchy" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Three-level hierarchy
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#layer-file-layout" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Layer file layout
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Layer file layout">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#evidence-encoding" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Evidence encoding
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#ptr_hash-configuration" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        ptr_hash configuration
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#build-path" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Build path
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#query-path" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Query path
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#add-layer-algorithm" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Add-layer algorithm
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#dependencies" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Dependencies
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#relationship-to-target-architecture" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Relationship to target architecture
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#open-questions" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Open questions
+      
+    </span>
+  </a>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+          
+          
+            <div class="md-content" data-md-component="content">
+              
+              <article class="md-content__inner md-typeset">
+                
+                  
+
+
+
+<h1 id="obilayeredmap-layered-kmer-index-crate">obilayeredmap — layered kmer index crate</h1>
+<h2 id="purpose">Purpose</h2>
+<p><code>obilayeredmap</code> implements a persistent, incrementally extensible kmer index. The index is organised in three levels: <strong>collection → partition → layer</strong>. Each layer covers a disjoint kmer set (kmers absent from all earlier layers), wrapping a <code>ptr_hash</code> MPHF with associated per-slot data. Adding a new dataset never rebuilds existing layers.</p>
+<hr />
+<h2 id="four-usage-modes">Four usage modes</h2>
+<p>The MPHF + evidence infrastructure is fixed for all modes. The <strong>payload</strong> — data associated with each slot — is orthogonal and varies by mode.</p>
+<table>
+<thead>
+<tr>
+<th>Mode</th>
+<th>Description</th>
+<th>Payload type</th>
+<th>Storage</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td>1. Set</td>
+<td>membership test only</td>
+<td><code>()</code></td>
+<td>—</td>
+</tr>
+<tr>
+<td>2. Count</td>
+<td>occurrences per kmer per sample</td>
+<td><code>PersistentCompactIntMatrix</code></td>
+<td><code>counts/</code> directory</td>
+</tr>
+<tr>
+<td>3. Presence/absence matrix</td>
+<td>which genomes contain each kmer</td>
+<td><code>PersistentBitMatrix</code></td>
+<td><code>presence/</code> directory</td>
+</tr>
+<tr>
+<td>4. Count matrix</td>
+<td>occurrences per kmer per genome</td>
+<td><code>PersistentCompactIntMatrix</code></td>
+<td><code>counts/</code> directory</td>
+</tr>
+</tbody>
+</table>
+<p>Both <code>PersistentCompactIntMatrix</code> and <code>PersistentBitMatrix</code> come from the <code>obicompactvec</code> crate. Mode 3 has a build path (<code>Layer::&lt;PersistentBitMatrix&gt;::build_presence</code>); mode 4 is not yet implemented.</p>
+<h3 id="payload-for-modes-24-persistentcompactintmatrix">Payload for modes 2/4: PersistentCompactIntMatrix</h3>
+<p><code>PersistentCompactIntMatrix</code> is a column-major matrix stored in a directory: one <code>col_NNNNNN.pciv</code> file per column, plus a <code>meta.json</code>. Each column is a <code>PersistentCompactIntVec</code> — a mmap'd PCIV file with a <code>u8</code> primary array (255 = overflow sentinel), a sorted overflow section of <code>(slot: u64, value: u32)</code> entries, and a sparse L1-fitting index.</p>
+<p>Mode 2 writes 1 column per layer (one sample). Mode 4 writes G columns (one per genome). <code>read(slot)</code> returns <code>Box&lt;[u32]&gt;</code> — the full row across all columns.</p>
+<h3 id="payload-for-mode-3-persistentbitmatrix">Payload for mode 3: PersistentBitMatrix</h3>
+<p><code>PersistentBitMatrix</code> is a column-major bit matrix stored in a directory: one <code>col_NNNNNN.pbiv</code> per genome, plus <code>meta.json</code>. Each column is a <code>PersistentBitVec</code> — a mmap'd PBIV file with u64 word-level bulk operations (AND, OR, XOR, NOT, POPCNT, Jaccard, Hamming). <code>read(slot)</code> returns <code>Box&lt;[bool]&gt;</code> — the presence vector across all genomes.</p>
+<p>Column-major layout makes per-genome set operations cache-friendly; the full row is assembled on demand at query time.</p>
+<hr />
+<h2 id="payload-architecture">Payload architecture</h2>
+<p>The payload is orthogonal to the MPHF + evidence layer. <code>Layer</code> is parameterised by <code>D: LayerData</code>:</p>
+<div class="highlight"><pre><span></span><code><span class="k">pub</span><span class="w"> </span><span class="k">trait</span><span class="w"> </span><span class="n">LayerData</span><span class="p">:</span><span class="w"> </span><span class="nb">Sized</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">type</span><span class="w"> </span><span class="nc">Item</span><span class="p">;</span>
+<span class="w">    </span><span class="k">fn</span><span class="w"> </span><span class="nf">open</span><span class="p">(</span><span class="n">layer_dir</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Path</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">OLMResult</span><span class="o">&lt;</span><span class="bp">Self</span><span class="o">&gt;</span><span class="p">;</span>
+<span class="w">    </span><span class="k">fn</span><span class="w"> </span><span class="nf">read</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">slot</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">Self</span><span class="p">::</span><span class="n">Item</span><span class="p">;</span>
+<span class="p">}</span>
+
+<span class="k">pub</span><span class="w"> </span><span class="k">struct</span><span class="w"> </span><span class="nc">Layer</span><span class="o">&lt;</span><span class="n">D</span><span class="p">:</span><span class="w"> </span><span class="nc">LayerData</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="p">()</span><span class="o">&gt;</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="n">mphf</span><span class="p">:</span><span class="w">     </span><span class="nc">Mphf</span><span class="p">,</span>
+<span class="w">    </span><span class="n">evidence</span><span class="p">:</span><span class="w"> </span><span class="nc">Evidence</span><span class="p">,</span>
+<span class="w">    </span><span class="n">unitigs</span><span class="p">:</span><span class="w">  </span><span class="nc">UnitigFileReader</span><span class="p">,</span>
+<span class="w">    </span><span class="n">data</span><span class="p">:</span><span class="w">     </span><span class="nc">D</span><span class="p">,</span>
+<span class="p">}</span>
+
+<span class="k">pub</span><span class="w"> </span><span class="k">struct</span><span class="w"> </span><span class="nc">Hit</span><span class="o">&lt;</span><span class="n">T</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="p">()</span><span class="o">&gt;</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">pub</span><span class="w"> </span><span class="n">slot</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">,</span>
+<span class="w">    </span><span class="k">pub</span><span class="w"> </span><span class="n">data</span><span class="p">:</span><span class="w"> </span><span class="nc">T</span><span class="p">,</span>
+<span class="p">}</span>
+</code></pre></div>
+<p><code>LayerData</code> covers the <strong>read path only</strong> (<code>open</code> + <code>read</code>). The write path (build) is intentionally not in the trait — build signatures differ between modes and forcing this into a trait would require an associated <code>Context</code> type with no benefit over specialized <code>impl</code> blocks.</p>
+<p>Implemented concrete types:</p>
+<table>
+<thead>
+<tr>
+<th>Type</th>
+<th><code>Item</code></th>
+<th>Description</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td><code>()</code></td>
+<td><code>()</code></td>
+<td>mode 1 — membership only</td>
+</tr>
+<tr>
+<td><code>PersistentCompactIntMatrix</code></td>
+<td><code>Box&lt;[u32]&gt;</code></td>
+<td>modes 2/4 — one count per column</td>
+</tr>
+<tr>
+<td><code>PersistentBitMatrix</code></td>
+<td><code>Box&lt;[bool]&gt;</code></td>
+<td>mode 3 — one presence bit per column</td>
+</tr>
+</tbody>
+</table>
+<p><code>LayeredMap</code> mirrors the same parameterisation: <code>LayeredMap&lt;D: LayerData = ()&gt;</code>.</p>
+<hr />
+<h2 id="three-level-hierarchy">Three-level hierarchy</h2>
+<div class="highlight"><pre><span></span><code>index_root/                        ← LayeredMap (collection)
+  meta.json
+  part_00000/                      ← Partition
+    layer_0/                       ← Layer
+      mphf.bin
+      unitigs.bin
+      unitigs.bin.idx
+      evidence.bin
+      counts/              [modes 2/4]
+        meta.json          {&quot;n&quot;: N, &quot;n_cols&quot;: 1}
+        col_000000.pciv
+      presence/            [mode 3]
+        meta.json          {&quot;n&quot;: N, &quot;n_cols&quot;: G}
+        col_000000.pbiv
+        col_000001.pbiv
+        ...
+    layer_1/
+      ...
+  part_00001/
+    layer_0/
+    ...
+</code></pre></div>
+<p><strong>Collection</strong> (<code>index_root/</code>): global metadata — kmer size k, number of partitions, layer count, sample registry.</p>
+<p><strong>Partition</strong> (<code>part_XXXXX/</code>): one directory per hash bucket. All kmers whose canonical minimiser hashes to bucket X land in <code>part_XXXXX</code>. Partitions are independent and can be processed in parallel. The partition count and routing scheme (minimiser → bucket) are fixed at collection creation and recorded in <code>meta.json</code>.</p>
+<p><strong>Layer</strong> (<code>layer_N/</code>): within a partition, a layer is the MPHF and its associated data for one dataset addition. Layer 0 is built from the first dataset A; layer 1 covers kmers in B not present in layer 0; and so on. Layers within a partition are disjoint: each kmer belongs to exactly one layer.</p>
+<hr />
+<h2 id="layer-file-layout">Layer file layout</h2>
+<div class="highlight"><pre><span></span><code>layer_N/
+  mphf.bin            — ptr_hash MPHF (epserde, ptr_hash native format)
+  unitigs.bin         — packed 2-bit nucleotide sequences (obiskio binary format)
+  unitigs.bin.idx     — UIDX index: n_unitigs, n_kmers, seqls[], packed_offsets[]
+  evidence.bin        — u32 per MPHF slot: (unitig_id: 25 | rank: 7)
+  counts/             — [modes 2/4] PersistentCompactIntMatrix
+  presence/           — [mode 3] PersistentBitMatrix
+</code></pre></div>
+<p><code>unitigs.bin</code> is the packed-2-bit sequence file produced by <code>obiskio::UnitigFileWriter</code>. The companion <code>.idx</code> file stores: magic <code>UIDX</code>, <code>n_unitigs: u32</code>, <code>n_kmers: u64</code>, <code>seqls: [u8; n_unitigs]</code> (kmer count − 1 per chunk), and <code>packed_offsets: [u32; n_unitigs + 1]</code> (byte offsets into <code>unitigs.bin</code>, sentinel-terminated). This gives O(1) random access to any unitig and the total kmer count without scanning the sequence file.</p>
+<h3 id="evidence-encoding">Evidence encoding</h3>
+<p>Evidence maps each MPHF slot to its kmer's location in the unitig file. It serves two roles: membership verification (ptr_hash maps any input to a valid slot; decoding evidence and comparing to the query detects absent keys) and kmer reconstruction.</p>
+<div class="highlight"><pre><span></span><code>slot s  →  unitig_id: u25  |  rank: u7
+</code></pre></div>
+<p>Packed into a <code>u32</code> (29 bits used, 3 spare). Decoding:</p>
+<div class="highlight"><pre><span></span><code>kmer = unitigs[unitig_id][rank .. rank + k]   // 2-bit packed slice
+</code></pre></div>
+<p><code>rank</code> is the kmer's 0-based index within the unitig (kmer units, not nucleotides). For k=31, m=11, the structural maximum is k − m + 1 = 21 kmers per unitig; the empirical maximum observed is ~46 kmers. A <code>u7</code> (0–127) is sufficient.</p>
+<hr />
+<h2 id="ptr_hash-configuration">ptr_hash configuration</h2>
+<p>The MPHF per layer is configured as:</p>
+<div class="highlight"><pre><span></span><code><span class="k">type</span><span class="w"> </span><span class="nc">Mphf</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="n">PtrHash</span><span class="o">&lt;</span>
+<span class="w">    </span><span class="kt">u64</span><span class="p">,</span><span class="w">                              </span><span class="c1">// key type: canonical kmer raw encoding</span>
+<span class="w">    </span><span class="n">CubicEps</span><span class="p">,</span><span class="w">                         </span><span class="c1">// bucket fn: balanced (2.4 bits/key, λ=3.5)</span>
+<span class="w">    </span><span class="n">CachelineEfVec</span><span class="o">&lt;</span><span class="nb">Vec</span><span class="o">&lt;</span><span class="n">CachelineEf</span><span class="o">&gt;&gt;</span><span class="p">,</span><span class="w"> </span><span class="c1">// remap: 11.6 bits/entry vs 32 for Vec&lt;u32&gt;</span>
+<span class="w">    </span><span class="n">Xx64</span><span class="p">,</span><span class="w">                             </span><span class="c1">// hasher: XXH3-64 with seed, handles structured keys</span>
+<span class="w">    </span><span class="nb">Vec</span><span class="o">&lt;</span><span class="kt">u8</span><span class="o">&gt;</span><span class="p">,</span><span class="w">                          </span><span class="c1">// pilots</span>
+<span class="o">&gt;</span><span class="p">;</span>
+</code></pre></div>
+<p><strong>Hasher choice — <code>Xx64</code>:</strong> k-mer raw values are left-aligned u64 with structural zeros in low bits (42 zeros for k=11, 2 zeros for k=31). <code>FxHash</code> (single multiply) distributes these poorly. <code>Xx64</code> (XXH3 64-bit, seeded) handles structured input correctly.</p>
+<p><strong>Bucket function — <code>CubicEps</code> with <code>PtrHashParams::&lt;CubicEps&gt;::default()</code>:</strong> λ=3.5, α=0.99. Balanced tradeoff: 2× slower construction than <code>Linear/λ=3.0</code> (the <code>default_fast</code> preset), 20% less space. <code>default_compact</code> (λ=4.0) saves a further 12.5% at 2× more construction time and reduced reliability — not chosen.</p>
+<p><strong>Remap — <code>CachelineEfVec</code>:</strong> Elias-Fano variant packing 44 sorted 40-bit values per 64-byte cacheline (11.6 bits/value vs 32 for <code>Vec&lt;u32&gt;</code>). Already a transitive dependency of <code>ptr_hash</code>. One cacheline per query vs one u32 read; space win dominates for billion-scale key sets.</p>
+<hr />
+<h2 id="build-path">Build path</h2>
+<p>The build path is not part of <code>LayerData</code>. Each mode exposes its own <code>impl Layer&lt;D&gt;::build</code> with the exact signature it needs. Two private module-level helpers avoid code duplication:</p>
+<p><strong><code>build_mphf(out_dir, n) -&gt; OLMResult&lt;Mphf&gt;</code></strong>: first pass — opens <code>unitigs.bin</code>, iterates all canonical kmers in parallel via <code>new_from_par_iter</code>, stores <code>mphf.bin</code>. O(n).</p>
+<p><strong><code>build_second_pass(out_dir, n, mphf, fill_slot) -&gt; OLMResult&lt;()&gt;</code></strong>: second pass — opens <code>unitigs.bin</code> again, fills <code>evidence.bin</code> and a compact n/8-byte seen-bitset (MPHF correctness check inline), calls <code>fill_slot(slot, kmer)</code> once per kmer for the mode-specific payload. O(n).</p>
+<div class="highlight"><pre><span></span><code><span class="c1">// mode 1</span>
+<span class="k">impl</span><span class="w"> </span><span class="n">Layer</span><span class="o">&lt;</span><span class="p">()</span><span class="o">&gt;</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">pub</span><span class="w"> </span><span class="k">fn</span><span class="w"> </span><span class="nf">build</span><span class="p">(</span><span class="n">out_dir</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Path</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">OLMResult</span><span class="o">&lt;</span><span class="kt">usize</span><span class="o">&gt;</span>
+<span class="p">}</span>
+
+<span class="c1">// modes 2/4</span>
+<span class="k">impl</span><span class="w"> </span><span class="n">Layer</span><span class="o">&lt;</span><span class="n">PersistentCompactIntMatrix</span><span class="o">&gt;</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">pub</span><span class="w"> </span><span class="k">fn</span><span class="w"> </span><span class="nf">build</span><span class="p">(</span><span class="n">out_dir</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Path</span><span class="p">,</span><span class="w"> </span><span class="n">count_of</span><span class="p">:</span><span class="w"> </span><span class="nc">impl</span><span class="w"> </span><span class="nb">Fn</span><span class="p">(</span><span class="n">CanonicalKmer</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="kt">u32</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">OLMResult</span><span class="o">&lt;</span><span class="kt">usize</span><span class="o">&gt;</span>
+<span class="w">    </span><span class="k">pub</span><span class="w"> </span><span class="k">fn</span><span class="w"> </span><span class="nf">build_from_map</span><span class="p">(</span><span class="n">out_dir</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Path</span><span class="p">,</span><span class="w"> </span><span class="n">counts</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">HashMap</span><span class="o">&lt;</span><span class="n">CanonicalKmer</span><span class="p">,</span><span class="w"> </span><span class="kt">u32</span><span class="o">&gt;</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">OLMResult</span><span class="o">&lt;</span><span class="kt">usize</span><span class="o">&gt;</span>
+<span class="p">}</span>
+
+<span class="c1">// mode 3</span>
+<span class="k">impl</span><span class="w"> </span><span class="n">Layer</span><span class="o">&lt;</span><span class="n">PersistentBitMatrix</span><span class="o">&gt;</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">pub</span><span class="w"> </span><span class="k">fn</span><span class="w"> </span><span class="nf">build_presence</span><span class="p">(</span>
+<span class="w">        </span><span class="n">out_dir</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Path</span><span class="p">,</span>
+<span class="w">        </span><span class="n">n_genomes</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">,</span>
+<span class="w">        </span><span class="n">present_in</span><span class="p">:</span><span class="w"> </span><span class="nc">impl</span><span class="w"> </span><span class="nb">Fn</span><span class="p">(</span><span class="n">CanonicalKmer</span><span class="p">,</span><span class="w"> </span><span class="kt">usize</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="kt">bool</span><span class="p">,</span>
+<span class="w">    </span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">OLMResult</span><span class="o">&lt;</span><span class="kt">usize</span><span class="o">&gt;</span>
+<span class="p">}</span>
+</code></pre></div>
+<p>Mode 2 creates a <code>PersistentCompactIntMatrixBuilder</code> with 1 column and fills it via <code>build_second_pass</code>. Mode 3 creates a <code>PersistentBitMatrixBuilder</code> with <code>n_genomes</code> columns and fills all columns in a single pass.</p>
+<p>Any duplicate slot or out-of-bounds index detected during <code>build_second_pass</code> returns <code>OLMError::Mphf</code>. <code>new_from_par_iter</code> avoids materialising all keys as <code>Vec&lt;u64&gt;</code>.</p>
+<hr />
+<h2 id="query-path">Query path</h2>
+<p>A kmer query routes through all three levels:</p>
+<ol>
+<li><strong>Partition routing</strong>: hash canonical minimiser of the query kmer → partition index → open <code>part_XXXXX/</code>.</li>
+<li><strong>Layer probing</strong>: iterate layers in order; for each layer compute <code>slot = mphf.index(kmer)</code>, decode evidence, compare to query. First match wins.</li>
+<li><strong>Data access</strong>: <code>layer.data.read(slot)</code> returns <code>D::Item</code>.</li>
+</ol>
+<div class="highlight"><pre><span></span><code><span class="c1">// pseudo-code</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">query</span><span class="p">(</span><span class="n">kmer</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nb">Option</span><span class="o">&lt;</span><span class="p">(</span><span class="kt">usize</span><span class="p">,</span><span class="w"> </span><span class="n">Hit</span><span class="o">&lt;</span><span class="n">D</span><span class="p">::</span><span class="n">Item</span><span class="o">&gt;</span><span class="p">)</span><span class="o">&gt;</span><span class="p">:</span>
+<span class="w">    </span><span class="nc">for</span><span class="w"> </span><span class="p">(</span><span class="n">i</span><span class="p">,</span><span class="w"> </span><span class="n">layer</span><span class="p">)</span><span class="w"> </span><span class="k">in</span><span class="w"> </span><span class="bp">self</span><span class="p">.</span><span class="n">layers</span><span class="p">.</span><span class="n">iter</span><span class="p">().</span><span class="n">enumerate</span><span class="p">():</span>
+<span class="w">        </span><span class="nc">slot</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="n">layer</span><span class="p">.</span><span class="n">mphf</span><span class="p">.</span><span class="n">index</span><span class="p">(</span><span class="o">&amp;</span><span class="n">kmer</span><span class="p">.</span><span class="n">raw</span><span class="p">())</span>
+<span class="w">        </span><span class="k">if</span><span class="w"> </span><span class="n">layer</span><span class="p">.</span><span class="n">evidence</span><span class="p">.</span><span class="n">decode</span><span class="p">(</span><span class="n">slot</span><span class="p">)</span><span class="w"> </span><span class="o">==</span><span class="w"> </span><span class="n">kmer</span><span class="p">:</span>
+<span class="w">            </span><span class="nc">return</span><span class="w"> </span><span class="nb">Some</span><span class="p">((</span><span class="n">i</span><span class="p">,</span><span class="w"> </span><span class="n">Hit</span><span class="w"> </span><span class="p">{</span><span class="w"> </span><span class="n">slot</span><span class="p">,</span><span class="w"> </span><span class="n">data</span><span class="p">:</span><span class="w"> </span><span class="nc">layer</span><span class="p">.</span><span class="n">data</span><span class="p">.</span><span class="n">read</span><span class="p">(</span><span class="n">slot</span><span class="p">)</span><span class="w"> </span><span class="p">}))</span>
+<span class="w">    </span><span class="k">return</span><span class="w"> </span><span class="nb">None</span>
+</code></pre></div>
+<p>Expected probe depth: 1 for kmers in layer 0, increasing for later layers.</p>
+<p>For mode 2, <code>hit.data</code> is <code>Box&lt;[u32]&gt;</code> with 1 element; <code>hit.data[0]</code> is the count. For mode 3, <code>hit.data</code> is <code>Box&lt;[bool]&gt;</code> with G elements, one per genome.</p>
+<hr />
+<h2 id="add-layer-algorithm">Add-layer algorithm</h2>
+<p>When adding dataset B to an existing index:</p>
+<ol>
+<li>For each partition, iterate kmers of B routed to that partition.</li>
+<li>Probe existing layers; collect kmers absent from all layers → <code>B \ index</code>.</li>
+<li>Build a new layer from <code>B \ index</code>.</li>
+<li>Append the new layer directory under each <code>part_XXXXX/</code>.</li>
+<li>Update <code>meta.json</code> (layer count, sample registry).</li>
+</ol>
+<p>Each partition's new layer is built independently; the operation is fully parallel across partitions.</p>
+<hr />
+<h2 id="dependencies">Dependencies</h2>
+<table>
+<thead>
+<tr>
+<th>crate</th>
+<th>role</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td><code>ptr_hash 1.1</code></td>
+<td>MPHF per layer (epserde serialisation)</td>
+</tr>
+<tr>
+<td><code>cacheline-ef 1.1</code></td>
+<td>compact remap storage inside ptr_hash</td>
+</tr>
+<tr>
+<td><code>epserde 0.8</code></td>
+<td>zero-copy serialisation of MPHF</td>
+</tr>
+<tr>
+<td><code>memmap2</code></td>
+<td>mmap of layer files</td>
+</tr>
+<tr>
+<td><code>obiskio</code></td>
+<td>unitig file writer/reader</td>
+</tr>
+<tr>
+<td><code>obicompactvec</code></td>
+<td>payload types: <code>PersistentCompactIntMatrix</code>, <code>PersistentBitMatrix</code></td>
+</tr>
+</tbody>
+</table>
+<hr />
+<h2 id="relationship-to-target-architecture">Relationship to target architecture</h2>
+<p>The target architecture (see <a href="../../architecture/index_architecture/">Kmer index architecture</a>) separates <code>MphfLayer</code> from data stores entirely and introduces a <code>PartitionedIndex</code> with parallel dispatch and an <code>Aggregator</code> pattern. The current implementation is a stepping stone: <code>obicompactvec</code> types are already fully decoupled from the MPHF; the remaining refactoring is within <code>obilayeredmap</code> itself.</p>
+<hr />
+<h2 id="open-questions">Open questions</h2>
+<ul>
+<li><strong>Mode 4</strong>: count matrix (n_kmers × n_genomes × bytes_per_count) is structurally identical to mode 3 but uses <code>PersistentCompactIntMatrix</code> with G columns. Build API not yet implemented. Scale concern: hundreds of GB for large collections — a sparse representation may be required at high genome counts.</li>
+<li><strong>Layer merge</strong>: merging two <code>LayeredMap</code> instances into a single-layer index requires full rebuild. Define API and cost model.</li>
+<li><strong>Canonical kmer orientation</strong>: evidence stores canonical kmer; strand recovery requires one 64-bit revcomp comparison at query time.</li>
+<li><strong><code>try_new_from_par_iter</code></strong>: <code>ptr_hash::new_from_par_iter</code> silently discards construction failure. Post-construction verification (current workaround) is correct but does not allow retry. A <code>try_new_from_par_iter</code> PR upstream would close this gap.</li>
+</ul>
+
+
+
+
+
+
+
+
+
+
+
+
+                
+              </article>
+            </div>
+          
+          
+<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>
+        </div>
+        
+      </main>
+      
+        <footer class="md-footer">
+  
+  <div class="md-footer-meta md-typeset">
+    <div class="md-footer-meta__inner md-grid">
+      <div class="md-copyright">
+  
+  
+    Made with
+    <a href="https://squidfunk.github.io/mkdocs-material/" target="_blank" rel="noopener">
+      Material for MkDocs
+    </a>
+  
+</div>
+      
+    </div>
+  </div>
+</footer>
+      
+    </div>
+    <div class="md-dialog" data-md-component="dialog">
+      <div class="md-dialog__inner md-typeset"></div>
+    </div>
+    
+    
+    
+      
+      
+      <script id="__config" type="application/json">{"annotate": null, "base": "../..", "features": [], "search": "../../assets/javascripts/workers/search.2c215733.min.js", "tags": null, "translations": {"clipboard.copied": "Copied to clipboard", "clipboard.copy": "Copy to clipboard", "search.result.more.one": "1 more on this page", "search.result.more.other": "# more on this page", "search.result.none": "No matching documents", "search.result.one": "1 matching document", "search.result.other": "# matching documents", "search.result.placeholder": "Type to start searching", "search.result.term.missing": "Missing", "select.version": "Select version"}, "version": null}</script>
+    
+    
+      <script src="../../assets/javascripts/bundle.79ae519e.min.js"></script>
+      
+        <script src="https://unpkg.com/mathjax@3/es5/tex-mml-chtml.js"></script>
+      
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/doc/implementation/obipipeline/index.html b/doc/implementation/obipipeline/index.html
index ef5b23b..5018f41 100644
--- a/doc/implementation/obipipeline/index.html
+++ b/doc/implementation/obipipeline/index.html
@@ -795,6 +795,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -877,6 +961,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/implementation/persistent_bit_vec/index.html b/doc/implementation/persistent_bit_vec/index.html
new file mode 100644
index 0000000..21e6248
--- /dev/null
+++ b/doc/implementation/persistent_bit_vec/index.html
@@ -0,0 +1,1581 @@
+
+<!doctype html>
+<html lang="en" class="no-js">
+  <head>
+    
+      <meta charset="utf-8">
+      <meta name="viewport" content="width=device-width,initial-scale=1">
+      
+      
+      
+      
+        <link rel="prev" href="../persistent_compact_int_vec/">
+      
+      
+        <link rel="next" href="../../architecture/sequences/invariant/">
+      
+      
+        
+      
+      
+      <link rel="icon" href="../../assets/images/favicon.png">
+      <meta name="generator" content="mkdocs-1.6.1, mkdocs-material-9.7.6">
+    
+    
+      
+        <title>PersistentBitVec - obikmer</title>
+      
+    
+    
+      <link rel="stylesheet" href="../../assets/stylesheets/main.484c7ddc.min.css">
+      
+      
+
+
+    
+    
+      
+    
+    
+      
+        
+        
+        <link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
+        <link rel="stylesheet" href="https://fonts.googleapis.com/css?family=Roboto:300,300i,400,400i,700,700i%7CRoboto+Mono:400,400i,700,700i&display=fallback">
+        <style>:root{--md-text-font:"Roboto";--md-code-font:"Roboto Mono"}</style>
+      
+    
+    
+    <script>__md_scope=new URL("../..",location),__md_hash=e=>[...e].reduce(((e,_)=>(e<<5)-e+_.charCodeAt(0)),0),__md_get=(e,_=localStorage,t=__md_scope)=>JSON.parse(_.getItem(t.pathname+"."+e)),__md_set=(e,_,t=localStorage,a=__md_scope)=>{try{t.setItem(a.pathname+"."+e,JSON.stringify(_))}catch(e){}}</script>
+    
+      
+
+    
+    
+  </head>
+  
+  
+    <body dir="ltr">
+  
+    
+    <input class="md-toggle" data-md-toggle="drawer" type="checkbox" id="__drawer" autocomplete="off">
+    <input class="md-toggle" data-md-toggle="search" type="checkbox" id="__search" autocomplete="off">
+    <label class="md-overlay" for="__drawer"></label>
+    <div data-md-component="skip">
+      
+        
+        <a href="#persistentbitvec-and-persistentbitmatrix" class="md-skip">
+          Skip to content
+        </a>
+      
+    </div>
+    <div data-md-component="announce">
+      
+    </div>
+    
+    
+      
+
+  
+
+<header class="md-header md-header--shadow" data-md-component="header">
+  <nav class="md-header__inner md-grid" aria-label="Header">
+    <a href="../.." title="obikmer" class="md-header__button md-logo" aria-label="obikmer" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    <label class="md-header__button md-icon" for="__drawer">
+      
+      <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M3 6h18v2H3zm0 5h18v2H3zm0 5h18v2H3z"/></svg>
+    </label>
+    <div class="md-header__title" data-md-component="header-title">
+      <div class="md-header__ellipsis">
+        <div class="md-header__topic">
+          <span class="md-ellipsis">
+            obikmer
+          </span>
+        </div>
+        <div class="md-header__topic" data-md-component="header-topic">
+          <span class="md-ellipsis">
+            
+              PersistentBitVec
+            
+          </span>
+        </div>
+      </div>
+    </div>
+    
+    
+      <script>var palette=__md_get("__palette");if(palette&&palette.color){if("(prefers-color-scheme)"===palette.color.media){var media=matchMedia("(prefers-color-scheme: light)"),input=document.querySelector(media.matches?"[data-md-color-media='(prefers-color-scheme: light)']":"[data-md-color-media='(prefers-color-scheme: dark)']");palette.color.media=input.getAttribute("data-md-color-media"),palette.color.scheme=input.getAttribute("data-md-color-scheme"),palette.color.primary=input.getAttribute("data-md-color-primary"),palette.color.accent=input.getAttribute("data-md-color-accent")}for(var[key,value]of Object.entries(palette.color))document.body.setAttribute("data-md-color-"+key,value)}</script>
+    
+    
+    
+    
+  </nav>
+  
+</header>
+    
+    <div class="md-container" data-md-component="container">
+      
+      
+        
+          
+        
+      
+      <main class="md-main" data-md-component="main">
+        <div class="md-main__inner md-grid">
+          
+            
+              
+              <div class="md-sidebar md-sidebar--primary" data-md-component="sidebar" data-md-type="navigation" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+
+
+<nav class="md-nav md-nav--primary" aria-label="Navigation" data-md-level="0">
+  <label class="md-nav__title" for="__drawer">
+    <a href="../.." title="obikmer" class="md-nav__button md-logo" aria-label="obikmer" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    obikmer
+  </label>
+  
+  <ul class="md-nav__list" data-md-scrollfix>
+    
+      
+      
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../.." class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Home
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+    
+      
+      
+  
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_2" >
+        
+          
+          <label class="md-nav__link" for="__nav_2" id="__nav_2_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Theory
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_2_label" aria-expanded="false">
+          <label class="md-nav__title" for="__nav_2">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Theory
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../kmers/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmers and super-kmers
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/encoding/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    DNA encoding
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/entropy/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Entropy filter
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/minimizer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Minimizer selection
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/indexing/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Partitioning architecture
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+      
+      
+  
+  
+    
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--active md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_3" checked>
+        
+          
+          <label class="md-nav__link" for="__nav_3" id="__nav_3_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Implementation
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_3_label" aria-expanded="true">
+          <label class="md-nav__title" for="__nav_3">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Implementation
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../superkmer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    SuperKmer
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../kmer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../chunkreader/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Chunk reader
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../pipeline/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Construction pipeline
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obipipeline/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obipipeline library
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../storage/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    On-disk storage
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../mphf/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    MPHF selection
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../unitig_evidence/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Unitig evidence encoding
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+    
+  
+  
+  
+    <li class="md-nav__item md-nav__item--active">
+      
+      <input class="md-nav__toggle md-toggle" type="checkbox" id="__toc">
+      
+      
+        
+      
+      
+        <label class="md-nav__link md-nav__link--active" for="__toc">
+          
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+          <span class="md-nav__icon md-icon"></span>
+        </label>
+      
+      <a href="./" class="md-nav__link md-nav__link--active">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+      
+        
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#purpose" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Purpose
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#persistentbitvec-single-column-file" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PersistentBitVec — single-column file
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PersistentBitVec — single-column file">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#file-format" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        File format
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#lifecycle" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Lifecycle
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Lifecycle">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#builder-persistentbitvecbuilder" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Builder (PersistentBitVecBuilder)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#reader-persistentbitvec" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Reader (PersistentBitVec)
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#implementation-notes" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Implementation notes
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Implementation notes">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#u64-word-view" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        u64 word view
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#padding-invariant" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Padding invariant
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#complexity" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Complexity
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#persistentbitmatrix-column-major-directory" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PersistentBitMatrix — column-major directory
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PersistentBitMatrix — column-major directory">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#design" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Design
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#builder-persistentbitmatrixbuilder" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Builder (PersistentBitMatrixBuilder)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#reader-persistentbitmatrix" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Reader (PersistentBitMatrix)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#layerdata-implementation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        LayerData implementation
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+      
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+      
+      
+  
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_4" >
+        
+          
+          <label class="md-nav__link" for="__nav_4" id="__nav_4_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Architecture
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_4_label" aria-expanded="false">
+          <label class="md-nav__title" for="__nav_4">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Architecture
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/sequences/invariant/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Sequences
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+  </ul>
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+            
+              
+              <div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#purpose" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Purpose
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#persistentbitvec-single-column-file" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PersistentBitVec — single-column file
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PersistentBitVec — single-column file">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#file-format" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        File format
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#lifecycle" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Lifecycle
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Lifecycle">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#builder-persistentbitvecbuilder" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Builder (PersistentBitVecBuilder)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#reader-persistentbitvec" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Reader (PersistentBitVec)
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#implementation-notes" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Implementation notes
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Implementation notes">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#u64-word-view" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        u64 word view
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#padding-invariant" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Padding invariant
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#complexity" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Complexity
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#persistentbitmatrix-column-major-directory" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PersistentBitMatrix — column-major directory
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PersistentBitMatrix — column-major directory">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#design" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Design
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#builder-persistentbitmatrixbuilder" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Builder (PersistentBitMatrixBuilder)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#reader-persistentbitmatrix" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Reader (PersistentBitMatrix)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#layerdata-implementation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        LayerData implementation
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+          
+          
+            <div class="md-content" data-md-component="content">
+              
+              <article class="md-content__inner md-typeset">
+                
+                  
+
+
+
+<h1 id="persistentbitvec-and-persistentbitmatrix">PersistentBitVec and PersistentBitMatrix</h1>
+<h2 id="purpose">Purpose</h2>
+<p><code>PersistentBitVec</code> stores a dense bit vector (presence/absence per slot) backed by a single mmap'd file. It is the binary counterpart of <code>PersistentCompactIntVec</code> and shares the same lifecycle pattern (builder → close → reader). All bulk operations work on u64 words rather than bytes, giving 8× fewer iterations and enabling the compiler to emit POPCNT and SIMD instructions.</p>
+<p>Typical use: converting k-mer count vectors to presence/absence vectors (with optional threshold), then computing set-theoretic distances (Jaccard) or edit distances (Hamming) between samples.</p>
+<p><code>PersistentBitMatrix</code> wraps multiple <code>PersistentBitVec</code> columns in a directory, exposing a column-major binary matrix with row-access API. A single-column bit matrix is a vector at the API level.</p>
+<hr />
+<h2 id="persistentbitvec-single-column-file">PersistentBitVec — single-column file</h2>
+<h3 id="file-format">File format</h3>
+<p>Single <code>.pbiv</code> file.</p>
+<div class="highlight"><pre><span></span><code>offset 0:
+  magic:     [u8; 4]  = b&quot;PBIV&quot;
+  _pad:      [u8; 4]  = 0           alignment padding
+  n:         u64       number of bits
+
+offset 16:
+  data:      [u64; ⌈n/64⌉]          bit words, LSB-first, zero-padded
+</code></pre></div>
+<p><strong>Header is 16 bytes</strong>, so data starts at an offset divisible by 8. Since <code>mmap</code> returns page-aligned memory (≥ 4096-byte aligned), the data slice is u64-aligned, enabling a zero-copy <code>&amp;[u8] → &amp;[u64]</code> reinterpretation.</p>
+<p><strong>Bit layout</strong>: bit <code>i</code> is in <code>data[i &gt;&gt; 6]</code> at bit position <code>i &amp; 63</code> (LSB-first). Bits <code>[n, ⌈n/64⌉×64)</code> are <strong>always zero</strong> (padding). This invariant is maintained by all write operations and must be restored by <code>not()</code> after flipping.</p>
+<p><strong>Total file size</strong>: <code>16 + ⌈n/64⌉ × 8</code> bytes.</p>
+<h3 id="lifecycle">Lifecycle</h3>
+<h4 id="builder-persistentbitvecbuilder">Builder (<code>PersistentBitVecBuilder</code>)</h4>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">PersistentBitVecBuilder</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="n">mmap</span><span class="p">:</span><span class="w"> </span><span class="nc">MmapMut</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n</span><span class="p">:</span><span class="w">    </span><span class="kt">usize</span><span class="p">,</span>
+<span class="p">}</span>
+</code></pre></div>
+<p>The file and mmap are created immediately at construction. The header is written once at <code>new()</code> or copied from the source at <code>build_from*()</code>. <code>close()</code> is a single flush — there is no tail to append, unlike <code>PersistentCompactIntVec</code>.</p>
+<p><strong><code>new(n: usize, path: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Creates the file, writes the header, zero-extends to <code>16 + ⌈n/64⌉×8</code> bytes, mmaps immediately. All bits default to 0.</p>
+<p><strong><code>build_from(source: &amp;PersistentBitVec, path: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>OS-level file copy (no per-bit iteration), then mmap. Initialisation cost: O(file_size).</p>
+<p><strong><code>build_from_counts(source: &amp;PersistentCompactIntVec, threshold: u32, path: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Creates a new file, iterates <code>source</code> with its merge-scan iterator (O(n)), and writes bits directly into u64 words:</p>
+<div class="highlight"><pre><span></span><code><span class="c1">// bit i = 1 iff source[i] &gt;= threshold</span>
+<span class="n">words</span><span class="p">[</span><span class="n">slot</span><span class="w"> </span><span class="o">&gt;&gt;</span><span class="w"> </span><span class="mi">6</span><span class="p">]</span><span class="w"> </span><span class="o">|=</span><span class="w"> </span><span class="mi">1</span><span class="k">u64</span><span class="w"> </span><span class="o">&lt;&lt;</span><span class="w"> </span><span class="p">(</span><span class="n">slot</span><span class="w"> </span><span class="o">&amp;</span><span class="w"> </span><span class="mi">63</span><span class="p">);</span>
+</code></pre></div>
+<p>Handles overflow values (≥ 255) transparently — the count iterator returns the true u32 value regardless.</p>
+<p><strong><code>build_from_presence(source: &amp;PersistentCompactIntVec, path: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Shorthand for <code>build_from_counts(source, 1, path)</code>.</p>
+<p><strong>Bit-level access</strong></p>
+<div class="highlight"><pre><span></span><code><span class="k">fn</span><span class="w"> </span><span class="nf">get</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">slot</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="kt">bool</span>
+<span class="nc">fn</span><span class="w"> </span><span class="n">set</span><span class="p">(</span><span class="o">&amp;</span><span class="k">mut</span><span class="w"> </span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">slot</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">,</span><span class="w"> </span><span class="n">value</span><span class="p">:</span><span class="w"> </span><span class="kt">bool</span><span class="p">)</span>
+</code></pre></div>
+<p>Byte-level mmap access: <code>mmap[16 + slot/8]</code>, bit <code>slot % 8</code>. O(1).</p>
+<p><strong>Word-level bulk operations</strong></p>
+<p>All operate on <code>⌈n/64⌉</code> u64 words. O(n/64) per call.</p>
+<div class="highlight"><pre><span></span><code><span class="n">builder</span><span class="p">.</span><span class="n">and</span><span class="p">(</span><span class="o">&amp;</span><span class="n">other</span><span class="p">);</span><span class="w">   </span><span class="c1">// self[i] &amp;= other[i]  for all i</span>
+<span class="n">builder</span><span class="p">.</span><span class="n">or</span><span class="p">(</span><span class="o">&amp;</span><span class="n">other</span><span class="p">);</span><span class="w">    </span><span class="c1">// self[i] |= other[i]</span>
+<span class="n">builder</span><span class="p">.</span><span class="n">xor</span><span class="p">(</span><span class="o">&amp;</span><span class="n">other</span><span class="p">);</span><span class="w">   </span><span class="c1">// self[i] ^= other[i]</span>
+<span class="n">builder</span><span class="p">.</span><span class="n">not</span><span class="p">();</span><span class="w">         </span><span class="c1">// self[i]  = !self[i], then re-zero padding bits</span>
+</code></pre></div>
+<p><code>and</code>/<code>or</code>/<code>xor</code> read <code>other</code>'s word slice directly (no allocation). <code>not()</code> flips all words then masks the last word's padding bits to restore the invariant.</p>
+<p><strong><code>close(self) -&gt; io::Result&lt;()&gt;</code></strong></p>
+<p>Flushes the mmap. The header was written at construction and is never rewritten. O(1) in Rust code.</p>
+<h4 id="reader-persistentbitvec">Reader (<code>PersistentBitVec</code>)</h4>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">PersistentBitVec</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="n">mmap</span><span class="p">:</span><span class="w"> </span><span class="nc">Mmap</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n</span><span class="p">:</span><span class="w">    </span><span class="kt">usize</span><span class="p">,</span>
+<span class="w">    </span><span class="n">path</span><span class="p">:</span><span class="w"> </span><span class="nc">PathBuf</span><span class="p">,</span>
+<span class="p">}</span>
+</code></pre></div>
+<p><strong><code>open(path: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Mmaps the file, validates magic, reads <code>n</code> from bytes <code>[8..16]</code>. O(1).</p>
+<p><strong><code>get(slot: usize) -&gt; bool</code></strong></p>
+<p>Byte-level read from <code>mmap[16 + slot/8]</code>. O(1).</p>
+<p><strong><code>iter() -&gt; BitIter&lt;'_&gt;</code></strong></p>
+<p>Sequential scan, byte by byte, yielding <code>bool</code> values in slot order. Implements <code>ExactSizeIterator</code>. O(n).</p>
+<p><strong>Aggregates</strong></p>
+<div class="highlight"><pre><span></span><code><span class="k">fn</span><span class="w"> </span><span class="nf">count_ones</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w">  </span><span class="p">-&gt;</span><span class="w"> </span><span class="kt">u64</span><span class="w">   </span><span class="c1">// popcount over all words; padding bits are 0</span>
+<span class="k">fn</span><span class="w"> </span><span class="nf">count_zeros</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="kt">u64</span><span class="w">   </span><span class="c1">// n - count_ones()</span>
+</code></pre></div>
+<p><code>count_ones</code> iterates <code>⌈n/64⌉</code> words and calls <code>u64::count_ones()</code> (maps to <code>POPCNT</code>). O(n/64).</p>
+<p><strong>Distance methods</strong></p>
+<p>Both operate word by word. O(n/64).</p>
+<table>
+<thead>
+<tr>
+<th>Method</th>
+<th>Formula</th>
+<th>Notes</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td><code>jaccard_dist(&amp;other) -&gt; f64</code></td>
+<td><code>1 − \|A∩B\| / \|A∪B\|</code></td>
+<td><code>(a&amp;b).count_ones()</code>, <code>(a\|b).count_ones()</code> per word</td>
+</tr>
+<tr>
+<td><code>hamming_dist(&amp;other) -&gt; u64</code></td>
+<td>number of differing bits</td>
+<td><code>(a^b).count_ones()</code> per word</td>
+</tr>
+</tbody>
+</table>
+<p>Edge case (both all-zero → union = 0): <code>jaccard_dist</code> returns 0.0.</p>
+<h3 id="implementation-notes">Implementation notes</h3>
+<h4 id="u64-word-view">u64 word view</h4>
+<p>The unsafe cast from <code>&amp;[u8]</code> to <code>&amp;[u64]</code> is sound because:</p>
+<ol>
+<li><code>mmap</code> base is page-aligned (≥ 4096-byte boundary).</li>
+<li>Data offset = 16, and <code>16 % 8 == 0</code> → the data pointer is 8-byte aligned.</li>
+<li>Data length = <code>⌈n/64⌉ × 8</code> bytes — always a multiple of 8.</li>
+</ol>
+<p>This gives zero-copy word-level access with no intermediate allocation.</p>
+<h4 id="padding-invariant">Padding invariant</h4>
+<p>Writing <code>not()</code> without masking the last word would corrupt <code>count_ones()</code>, <code>hamming_dist()</code>, and <code>jaccard_dist()</code>. The mask applied after flipping is <code>(1u64 &lt;&lt; (n % 64)) - 1</code> (no-op if <code>n % 64 == 0</code>). All other operations (<code>and</code>, <code>or</code>, <code>xor</code>) preserve existing zero padding since they can only clear or preserve bits already set by <code>not()</code>.</p>
+<h3 id="complexity">Complexity</h3>
+<table>
+<thead>
+<tr>
+<th>Operation</th>
+<th>Time</th>
+<th>Notes</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td><code>new</code> / <code>open</code></td>
+<td>O(1)</td>
+<td>mmap setup + header parse</td>
+</tr>
+<tr>
+<td><code>get</code> / <code>set</code> (builder or reader)</td>
+<td>O(1)</td>
+<td>byte-level mmap</td>
+</tr>
+<tr>
+<td><code>iter()</code></td>
+<td>O(n)</td>
+<td>byte-by-byte scan</td>
+</tr>
+<tr>
+<td><code>count_ones</code> / <code>count_zeros</code></td>
+<td>O(n/64)</td>
+<td>POPCNT per u64 word</td>
+</tr>
+<tr>
+<td><code>and</code> / <code>or</code> / <code>xor</code> / <code>not</code></td>
+<td>O(n/64)</td>
+<td>word-level bitwise ops</td>
+</tr>
+<tr>
+<td><code>jaccard_dist</code> / <code>hamming_dist</code></td>
+<td>O(n/64)</td>
+<td>word AND/OR/XOR + POPCNT</td>
+</tr>
+<tr>
+<td><code>build_from</code></td>
+<td>O(file_size)</td>
+<td>OS copy</td>
+</tr>
+<tr>
+<td><code>build_from_counts</code> / <code>build_from_presence</code></td>
+<td>O(n)</td>
+<td>count iter + word fill</td>
+</tr>
+<tr>
+<td><code>close</code></td>
+<td>O(1)</td>
+<td>flush only</td>
+</tr>
+</tbody>
+</table>
+<hr />
+<h2 id="persistentbitmatrix-column-major-directory">PersistentBitMatrix — column-major directory</h2>
+<h3 id="design">Design</h3>
+<p>A directory containing <code>meta.json</code> and N column files <code>col_000000.pbiv</code>, <code>col_000001.pbiv</code>, …, each a <code>PersistentBitVec</code>. Used for presence/absence matrices: one column per genome, one bit per MPHF slot.</p>
+<div class="highlight"><pre><span></span><code>presence/
+  meta.json          {&quot;n&quot;: &lt;n_slots&gt;, &quot;n_cols&quot;: &lt;G&gt;}
+  col_000000.pbiv    genome 0
+  col_000001.pbiv    genome 1
+  ...
+</code></pre></div>
+<p>Column-major layout makes per-genome set operations (Jaccard, Hamming, AND/OR) cache-friendly — each genome is a contiguous file. Row access (which genomes contain a given kmer) requires one O(1) read per column.</p>
+<h3 id="builder-persistentbitmatrixbuilder">Builder (<code>PersistentBitMatrixBuilder</code>)</h3>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">PersistentBitMatrixBuilder</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="n">dir</span><span class="p">:</span><span class="w">    </span><span class="nc">PathBuf</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n</span><span class="p">:</span><span class="w">      </span><span class="kt">usize</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n_cols</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">,</span>
+<span class="p">}</span>
+</code></pre></div>
+<p><strong><code>new(n: usize, dir: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Creates the directory (including parents).</p>
+<p><strong><code>add_col(&amp;mut self) -&gt; io::Result&lt;PersistentBitVecBuilder&gt;</code></strong></p>
+<p>Creates <code>col_NNNNNN.pbiv</code> for the next column and returns its builder. The caller fills the column and calls <code>builder.close()</code> before calling <code>add_col</code> again.</p>
+<p><strong><code>close(self) -&gt; io::Result&lt;()&gt;</code></strong></p>
+<p>Writes <code>meta.json</code> with the final <code>n</code> and <code>n_cols</code>.</p>
+<h3 id="reader-persistentbitmatrix">Reader (<code>PersistentBitMatrix</code>)</h3>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">PersistentBitMatrix</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="n">cols</span><span class="p">:</span><span class="w"> </span><span class="nb">Vec</span><span class="o">&lt;</span><span class="n">PersistentBitVec</span><span class="o">&gt;</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n</span><span class="p">:</span><span class="w">    </span><span class="kt">usize</span><span class="p">,</span>
+<span class="p">}</span>
+</code></pre></div>
+<p><strong><code>open(dir: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Reads <code>meta.json</code>, opens all <code>col_NNNNNN.pbiv</code> files.</p>
+<p><strong><code>row(slot: usize) -&gt; Box&lt;[bool]&gt;</code></strong></p>
+<p>Returns the presence vector: <code>[col_0[slot], col_1[slot], …, col_{G-1}[slot]]</code>. One byte read per column. O(G).</p>
+<p><strong><code>col(c: usize) -&gt; &amp;PersistentBitVec</code></strong></p>
+<p>Direct access to a single column for column-oriented operations.</p>
+<h3 id="layerdata-implementation">LayerData implementation</h3>
+<div class="highlight"><pre><span></span><code><span class="k">impl</span><span class="w"> </span><span class="n">LayerData</span><span class="w"> </span><span class="k">for</span><span class="w"> </span><span class="n">PersistentBitMatrix</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">type</span><span class="w"> </span><span class="nc">Item</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="nb">Box</span><span class="o">&lt;</span><span class="p">[</span><span class="kt">bool</span><span class="p">]</span><span class="o">&gt;</span><span class="p">;</span>
+<span class="w">    </span><span class="k">fn</span><span class="w"> </span><span class="nf">open</span><span class="p">(</span><span class="n">layer_dir</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Path</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">OLMResult</span><span class="o">&lt;</span><span class="bp">Self</span><span class="o">&gt;</span><span class="w"> </span><span class="p">{</span><span class="w"> </span><span class="cm">/* opens layer_dir/presence/ */</span><span class="w"> </span><span class="p">}</span>
+<span class="w">    </span><span class="k">fn</span><span class="w"> </span><span class="nf">read</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">slot</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nb">Box</span><span class="o">&lt;</span><span class="p">[</span><span class="kt">bool</span><span class="p">]</span><span class="o">&gt;</span><span class="w">   </span><span class="p">{</span><span class="w"> </span><span class="bp">self</span><span class="p">.</span><span class="n">row</span><span class="p">(</span><span class="n">slot</span><span class="p">)</span><span class="w"> </span><span class="p">}</span>
+<span class="p">}</span>
+</code></pre></div>
+
+
+
+
+
+
+
+
+
+
+
+
+                
+              </article>
+            </div>
+          
+          
+<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>
+        </div>
+        
+      </main>
+      
+        <footer class="md-footer">
+  
+  <div class="md-footer-meta md-typeset">
+    <div class="md-footer-meta__inner md-grid">
+      <div class="md-copyright">
+  
+  
+    Made with
+    <a href="https://squidfunk.github.io/mkdocs-material/" target="_blank" rel="noopener">
+      Material for MkDocs
+    </a>
+  
+</div>
+      
+    </div>
+  </div>
+</footer>
+      
+    </div>
+    <div class="md-dialog" data-md-component="dialog">
+      <div class="md-dialog__inner md-typeset"></div>
+    </div>
+    
+    
+    
+      
+      
+      <script id="__config" type="application/json">{"annotate": null, "base": "../..", "features": [], "search": "../../assets/javascripts/workers/search.2c215733.min.js", "tags": null, "translations": {"clipboard.copied": "Copied to clipboard", "clipboard.copy": "Copy to clipboard", "search.result.more.one": "1 more on this page", "search.result.more.other": "# more on this page", "search.result.none": "No matching documents", "search.result.one": "1 matching document", "search.result.other": "# matching documents", "search.result.placeholder": "Type to start searching", "search.result.term.missing": "Missing", "select.version": "Select version"}, "version": null}</script>
+    
+    
+      <script src="../../assets/javascripts/bundle.79ae519e.min.js"></script>
+      
+        <script src="https://unpkg.com/mathjax@3/es5/tex-mml-chtml.js"></script>
+      
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/doc/implementation/persistent_compact_int_vec/index.html b/doc/implementation/persistent_compact_int_vec/index.html
new file mode 100644
index 0000000..5eea493
--- /dev/null
+++ b/doc/implementation/persistent_compact_int_vec/index.html
@@ -0,0 +1,1596 @@
+
+<!doctype html>
+<html lang="en" class="no-js">
+  <head>
+    
+      <meta charset="utf-8">
+      <meta name="viewport" content="width=device-width,initial-scale=1">
+      
+      
+      
+      
+        <link rel="prev" href="../obilayeredmap/">
+      
+      
+        <link rel="next" href="../persistent_bit_vec/">
+      
+      
+        
+      
+      
+      <link rel="icon" href="../../assets/images/favicon.png">
+      <meta name="generator" content="mkdocs-1.6.1, mkdocs-material-9.7.6">
+    
+    
+      
+        <title>PersistentCompactIntVec - obikmer</title>
+      
+    
+    
+      <link rel="stylesheet" href="../../assets/stylesheets/main.484c7ddc.min.css">
+      
+      
+
+
+    
+    
+      
+    
+    
+      
+        
+        
+        <link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
+        <link rel="stylesheet" href="https://fonts.googleapis.com/css?family=Roboto:300,300i,400,400i,700,700i%7CRoboto+Mono:400,400i,700,700i&display=fallback">
+        <style>:root{--md-text-font:"Roboto";--md-code-font:"Roboto Mono"}</style>
+      
+    
+    
+    <script>__md_scope=new URL("../..",location),__md_hash=e=>[...e].reduce(((e,_)=>(e<<5)-e+_.charCodeAt(0)),0),__md_get=(e,_=localStorage,t=__md_scope)=>JSON.parse(_.getItem(t.pathname+"."+e)),__md_set=(e,_,t=localStorage,a=__md_scope)=>{try{t.setItem(a.pathname+"."+e,JSON.stringify(_))}catch(e){}}</script>
+    
+      
+
+    
+    
+  </head>
+  
+  
+    <body dir="ltr">
+  
+    
+    <input class="md-toggle" data-md-toggle="drawer" type="checkbox" id="__drawer" autocomplete="off">
+    <input class="md-toggle" data-md-toggle="search" type="checkbox" id="__search" autocomplete="off">
+    <label class="md-overlay" for="__drawer"></label>
+    <div data-md-component="skip">
+      
+        
+        <a href="#persistentcompactintvec-and-persistentcompactintmatrix" class="md-skip">
+          Skip to content
+        </a>
+      
+    </div>
+    <div data-md-component="announce">
+      
+    </div>
+    
+    
+      
+
+  
+
+<header class="md-header md-header--shadow" data-md-component="header">
+  <nav class="md-header__inner md-grid" aria-label="Header">
+    <a href="../.." title="obikmer" class="md-header__button md-logo" aria-label="obikmer" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    <label class="md-header__button md-icon" for="__drawer">
+      
+      <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M3 6h18v2H3zm0 5h18v2H3zm0 5h18v2H3z"/></svg>
+    </label>
+    <div class="md-header__title" data-md-component="header-title">
+      <div class="md-header__ellipsis">
+        <div class="md-header__topic">
+          <span class="md-ellipsis">
+            obikmer
+          </span>
+        </div>
+        <div class="md-header__topic" data-md-component="header-topic">
+          <span class="md-ellipsis">
+            
+              PersistentCompactIntVec
+            
+          </span>
+        </div>
+      </div>
+    </div>
+    
+    
+      <script>var palette=__md_get("__palette");if(palette&&palette.color){if("(prefers-color-scheme)"===palette.color.media){var media=matchMedia("(prefers-color-scheme: light)"),input=document.querySelector(media.matches?"[data-md-color-media='(prefers-color-scheme: light)']":"[data-md-color-media='(prefers-color-scheme: dark)']");palette.color.media=input.getAttribute("data-md-color-media"),palette.color.scheme=input.getAttribute("data-md-color-scheme"),palette.color.primary=input.getAttribute("data-md-color-primary"),palette.color.accent=input.getAttribute("data-md-color-accent")}for(var[key,value]of Object.entries(palette.color))document.body.setAttribute("data-md-color-"+key,value)}</script>
+    
+    
+    
+    
+  </nav>
+  
+</header>
+    
+    <div class="md-container" data-md-component="container">
+      
+      
+        
+          
+        
+      
+      <main class="md-main" data-md-component="main">
+        <div class="md-main__inner md-grid">
+          
+            
+              
+              <div class="md-sidebar md-sidebar--primary" data-md-component="sidebar" data-md-type="navigation" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+
+
+<nav class="md-nav md-nav--primary" aria-label="Navigation" data-md-level="0">
+  <label class="md-nav__title" for="__drawer">
+    <a href="../.." title="obikmer" class="md-nav__button md-logo" aria-label="obikmer" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    obikmer
+  </label>
+  
+  <ul class="md-nav__list" data-md-scrollfix>
+    
+      
+      
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../.." class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Home
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+    
+      
+      
+  
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_2" >
+        
+          
+          <label class="md-nav__link" for="__nav_2" id="__nav_2_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Theory
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_2_label" aria-expanded="false">
+          <label class="md-nav__title" for="__nav_2">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Theory
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../kmers/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmers and super-kmers
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/encoding/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    DNA encoding
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/entropy/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Entropy filter
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/minimizer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Minimizer selection
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../theory/indexing/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Partitioning architecture
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+      
+      
+  
+  
+    
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--active md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_3" checked>
+        
+          
+          <label class="md-nav__link" for="__nav_3" id="__nav_3_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Implementation
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_3_label" aria-expanded="true">
+          <label class="md-nav__title" for="__nav_3">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Implementation
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../superkmer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    SuperKmer
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../kmer/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../chunkreader/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Chunk reader
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../pipeline/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Construction pipeline
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obipipeline/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obipipeline library
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../storage/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    On-disk storage
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../mphf/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    MPHF selection
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../unitig_evidence/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Unitig evidence encoding
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+    
+  
+  
+  
+    <li class="md-nav__item md-nav__item--active">
+      
+      <input class="md-nav__toggle md-toggle" type="checkbox" id="__toc">
+      
+      
+        
+      
+      
+        <label class="md-nav__link md-nav__link--active" for="__toc">
+          
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+          <span class="md-nav__icon md-icon"></span>
+        </label>
+      
+      <a href="./" class="md-nav__link md-nav__link--active">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+      
+        
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#purpose" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Purpose
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#persistentcompactintvec-single-column-file" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PersistentCompactIntVec — single-column file
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PersistentCompactIntVec — single-column file">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#design" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Design
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#file-format" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        File format
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#lifecycle" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Lifecycle
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Lifecycle">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#builder-persistentcompactintvecbuilder" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Builder (PersistentCompactIntVecBuilder)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#reader-persistentcompactintvec" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Reader (PersistentCompactIntVec)
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#step-computation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Step computation
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#complexity" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Complexity
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#persistentcompactintmatrix-column-major-directory" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PersistentCompactIntMatrix — column-major directory
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PersistentCompactIntMatrix — column-major directory">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#design_1" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Design
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#builder-persistentcompactintmatrixbuilder" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Builder (PersistentCompactIntMatrixBuilder)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#reader-persistentcompactintmatrix" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Reader (PersistentCompactIntMatrix)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#layerdata-implementation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        LayerData implementation
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+      
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+      
+      
+  
+  
+  
+  
+    
+    
+    
+    
+    
+    <li class="md-nav__item md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_4" >
+        
+          
+          <label class="md-nav__link" for="__nav_4" id="__nav_4_label" tabindex="0">
+            
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Architecture
+  
+
+    
+  </span>
+  
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_4_label" aria-expanded="false">
+          <label class="md-nav__title" for="__nav_4">
+            <span class="md-nav__icon md-icon"></span>
+            
+  
+    Architecture
+  
+
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/sequences/invariant/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Sequences
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+  </ul>
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+            
+              
+              <div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#purpose" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Purpose
+      
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#persistentcompactintvec-single-column-file" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PersistentCompactIntVec — single-column file
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PersistentCompactIntVec — single-column file">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#design" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Design
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#file-format" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        File format
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#lifecycle" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Lifecycle
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Lifecycle">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#builder-persistentcompactintvecbuilder" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Builder (PersistentCompactIntVecBuilder)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#reader-persistentcompactintvec" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Reader (PersistentCompactIntVec)
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#step-computation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Step computation
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#complexity" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Complexity
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#persistentcompactintmatrix-column-major-directory" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        PersistentCompactIntMatrix — column-major directory
+      
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PersistentCompactIntMatrix — column-major directory">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#design_1" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Design
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#builder-persistentcompactintmatrixbuilder" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Builder (PersistentCompactIntMatrixBuilder)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#reader-persistentcompactintmatrix" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        Reader (PersistentCompactIntMatrix)
+      
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#layerdata-implementation" class="md-nav__link">
+    <span class="md-ellipsis">
+      
+        LayerData implementation
+      
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+          
+          
+            <div class="md-content" data-md-component="content">
+              
+              <article class="md-content__inner md-typeset">
+                
+                  
+
+
+
+<h1 id="persistentcompactintvec-and-persistentcompactintmatrix">PersistentCompactIntVec and PersistentCompactIntMatrix</h1>
+<h2 id="purpose">Purpose</h2>
+<p><code>PersistentCompactIntVec</code> stores a dense array of non-negative integers indexed by MPHF slot where the vast majority of values are small (0–254) and large values are rare. It is designed for mmap-compatible random and sequential access with minimal memory footprint and optimal cache behaviour.</p>
+<p>Motivation from observed count distributions in genomics data: 99.9% of k-mer counts fit in a u8; overflow (count ≥ 255) affects ~0.07% of distinct k-mers but can reach values above 10⁶ (chloroplast, ribosomal repeats).</p>
+<p><code>PersistentCompactIntMatrix</code> wraps multiple <code>PersistentCompactIntVec</code> columns in a directory, exposing a column-major matrix with row-access API. A vector is a matrix with 1 column.</p>
+<hr />
+<h2 id="persistentcompactintvec-single-column-file">PersistentCompactIntVec — single-column file</h2>
+<h3 id="design">Design</h3>
+<p>Two-tier structure:</p>
+<ol>
+<li><strong>Primary array</strong> — <code>[u8; n]</code>, stored at offset 40 in the PCIV file and mmap'd. Values 0–254 are stored directly. Value <strong>255 is a sentinel</strong> meaning "look in overflow".</li>
+<li><strong>Overflow section</strong> — sorted list of <code>(slot: u64, value: u32)</code> pairs for all slots where the true value ≥ 255, with a <strong>sparse L1-fitting index</strong> for fast lookup.</li>
+</ol>
+<div class="highlight"><pre><span></span><code>primary[slot] &lt; 255  →  return primary[slot]
+primary[slot] == 255 →  binary search in overflow
+</code></pre></div>
+<h3 id="file-format">File format</h3>
+<p>Single <code>.pciv</code> file. Write order: header placeholder → primary → overflow + index → header overwrite at offset 0.</p>
+<div class="highlight"><pre><span></span><code>offset 0:
+  magic:      [u8; 4]   = b&quot;PCIV&quot;
+  _pad:       [u8; 4]   = 0
+  n:          u64        number of slots
+  n_overflow: u64        number of overflow entries
+  n_index:    u64        number of sparse index entries
+  step:       u64        sparse index step (0 = no index)
+
+offset 40:
+  primary:    [u8; n]    one byte per slot, 255 = overflow sentinel
+
+offset 40 + n:
+  data:       [(slot: u64, value: u32); n_overflow]   12 bytes each, sorted by slot
+
+offset 40 + n + n_overflow × 12:
+  index:      [(slot: u64, pos: u64); n_index]         16 bytes each, sparse index
+</code></pre></div>
+<p>The index entries point into <code>data</code>: <code>index[i] = (slot of data[i×step], i×step)</code>.</p>
+<p>All integer fields are little-endian. Slot indices are stored as <code>u64</code> in the file; they are <code>usize</code> in Rust code.</p>
+<h3 id="lifecycle">Lifecycle</h3>
+<h4 id="builder-persistentcompactintvecbuilder">Builder (<code>PersistentCompactIntVecBuilder</code>)</h4>
+<p>Used during construction. The primary section is <strong>mmap'd immediately</strong> at construction time (both for <code>new</code> and <code>build_from</code>), so the file exists and is addressable from the start. The overflow is held in a <code>HashMap&lt;usize, u32&gt;</code> in RAM.</p>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">PersistentCompactIntVecBuilder</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="n">path</span><span class="p">:</span><span class="w">     </span><span class="nc">PathBuf</span><span class="p">,</span>
+<span class="w">    </span><span class="n">mmap</span><span class="p">:</span><span class="w">     </span><span class="nc">MmapMut</span><span class="p">,</span><span class="w">            </span><span class="c1">// primary section live in the file from the start</span>
+<span class="w">    </span><span class="n">n</span><span class="p">:</span><span class="w">        </span><span class="kt">usize</span><span class="p">,</span>
+<span class="w">    </span><span class="n">overflow</span><span class="p">:</span><span class="w"> </span><span class="nc">HashMap</span><span class="o">&lt;</span><span class="kt">usize</span><span class="p">,</span><span class="w"> </span><span class="kt">u32</span><span class="o">&gt;</span><span class="p">,</span><span class="w"> </span><span class="c1">// values ≥ 255</span>
+<span class="p">}</span>
+</code></pre></div>
+<p><strong><code>new(n: usize, path: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Creates the file, pre-allocates <code>HEADER_SIZE + n</code> zero bytes, mmaps it. The primary is zero-initialised (all slots = 0). Returns immediately ready for <code>set</code> / <code>get</code>.</p>
+<p><strong><code>build_from(source: &amp;PersistentCompactIntVec, path: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Copies the source PCIV file to <code>path</code> (OS-level copy — no per-slot iteration), mmaps the copy, then loads the overflow section into a <code>HashMap</code>. Initialisation cost: O(file copy) + O(n_overflow), not O(n).</p>
+<p>At <code>close()</code>, the primary section is <strong>not rewritten</strong>: it is already in the file via mmap. Only the overflow data, the sparse index, and the header are updated.</p>
+<p><strong><code>set(slot: usize, value: u32)</code> / <code>get(slot: usize) -&gt; u32</code></strong></p>
+<p>Direct mmap byte access for the primary; HashMap for the overflow. Both O(1). Mutations can move a slot between tiers freely (downward mutation removes the HashMap entry; upward mutation adds it).</p>
+<p><strong>Element-wise operations — <code>min</code>, <code>max</code>, <code>add</code>, <code>diff</code></strong></p>
+<p>Each takes a <code>&amp;PersistentCompactIntVec</code> of equal length and updates <code>self</code> in place via <code>set</code>:</p>
+<div class="highlight"><pre><span></span><code><span class="n">builder</span><span class="p">.</span><span class="n">min</span><span class="p">(</span><span class="o">&amp;</span><span class="n">other</span><span class="p">);</span><span class="w">   </span><span class="c1">// self[i] = min(self[i], other[i])</span>
+<span class="n">builder</span><span class="p">.</span><span class="n">max</span><span class="p">(</span><span class="o">&amp;</span><span class="n">other</span><span class="p">);</span><span class="w">   </span><span class="c1">// self[i] = max(self[i], other[i])</span>
+<span class="n">builder</span><span class="p">.</span><span class="n">add</span><span class="p">(</span><span class="o">&amp;</span><span class="n">other</span><span class="p">);</span><span class="w">   </span><span class="c1">// self[i] = self[i].checked_add(other[i])  (panics on u32 overflow)</span>
+<span class="n">builder</span><span class="p">.</span><span class="n">diff</span><span class="p">(</span><span class="o">&amp;</span><span class="n">other</span><span class="p">);</span><span class="w">  </span><span class="c1">// self[i] = self[i].saturating_sub(other[i])</span>
+</code></pre></div>
+<p>All iterate <code>other</code> with <code>other.iter()</code> (merge-scan, O(n_other)).</p>
+<p><strong><code>close(self) -&gt; io::Result&lt;()&gt;</code></strong></p>
+<ol>
+<li>Flush and drop the mmap (primary changes are now on disk).</li>
+<li>Sort the overflow HashMap into <code>Vec&lt;(usize, u32)&gt;</code>.</li>
+<li>Truncate the file to <code>HEADER_SIZE + n</code> (removes old data+index if <code>build_from</code> was used).</li>
+<li>Append sorted overflow data, then sparse index.</li>
+<li>Seek to offset 0, overwrite the header with final values.</li>
+</ol>
+<h4 id="reader-persistentcompactintvec">Reader (<code>PersistentCompactIntVec</code>)</h4>
+<p>Used at query time. The whole file is mmap'd; only the sparse index is copied into a <code>Vec</code> at open time (≤ 32 KB, L1-resident).</p>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">PersistentCompactIntVec</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="n">mmap</span><span class="p">:</span><span class="w">           </span><span class="nc">Mmap</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n</span><span class="p">:</span><span class="w">              </span><span class="kt">usize</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n_overflow</span><span class="p">:</span><span class="w">     </span><span class="kt">usize</span><span class="p">,</span>
+<span class="w">    </span><span class="n">step</span><span class="p">:</span><span class="w">           </span><span class="kt">usize</span><span class="p">,</span>
+<span class="w">    </span><span class="n">index</span><span class="p">:</span><span class="w">          </span><span class="nb">Vec</span><span class="o">&lt;</span><span class="p">(</span><span class="kt">usize</span><span class="p">,</span><span class="w"> </span><span class="kt">usize</span><span class="p">)</span><span class="o">&gt;</span><span class="p">,</span><span class="w">  </span><span class="c1">// (slot, pos) — L1-resident</span>
+<span class="w">    </span><span class="n">primary_offset</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">,</span><span class="w">               </span><span class="c1">// = 40 (HEADER_SIZE)</span>
+<span class="w">    </span><span class="n">data_offset</span><span class="p">:</span><span class="w">    </span><span class="kt">usize</span><span class="p">,</span><span class="w">               </span><span class="c1">// = 40 + n</span>
+<span class="w">    </span><span class="n">path</span><span class="p">:</span><span class="w">           </span><span class="nc">PathBuf</span><span class="p">,</span>
+<span class="p">}</span>
+</code></pre></div>
+<p><strong><code>open(path: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Mmaps the file, parses the 40-byte header, copies the sparse index entries into a <code>Vec</code>. The primary and data sections stay mmap'd.</p>
+<p><strong><code>get(slot: usize) -&gt; u32</code> — random access</strong></p>
+<div class="highlight"><pre><span></span><code>primary[slot] &lt; 255  →  return it directly
+
+step == 0:
+    binary_search(data[0..n_overflow], slot)
+
+step &gt; 0:
+    i = upper_bound(index[..].slot, slot) − 1     // in L1-resident Vec
+    binary_search(data[index[i].pos .. index[i+1].pos], slot)
+</code></pre></div>
+<p><strong><code>iter() -&gt; Iter&lt;'_&gt;</code> — sequential scan, O(n)</strong></p>
+<p>Merge-scan: reads primary bytes in order; on sentinel 255, advances a sequential pointer into the sorted data section rather than doing a binary search. This gives O(n + n_overflow) with no random access into the data section.</p>
+<p><code>Iter</code> implements <code>ExactSizeIterator</code>. <code>&amp;PersistentCompactIntVec</code> implements <code>IntoIterator</code>.</p>
+<p><strong>Aggregate</strong></p>
+<div class="highlight"><pre><span></span><code><span class="k">fn</span><span class="w"> </span><span class="nf">sum</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="kt">u64</span><span class="w">   </span><span class="c1">// Σ self[i] as u64, via iter()</span>
+</code></pre></div>
+<p><strong>Distance methods</strong></p>
+<p>All take <code>&amp;other</code> of equal length, iterate both with <code>zip(self.iter(), other.iter())</code>, and return <code>f64</code>.</p>
+<table>
+<thead>
+<tr>
+<th>Method</th>
+<th>Formula</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td><code>bray_dist</code></td>
+<td><code>1 − 2·Σmin(aᵢ,bᵢ) / (Σaᵢ + Σbᵢ)</code></td>
+</tr>
+<tr>
+<td><code>relfreq_bray_dist</code></td>
+<td>Bray-Curtis on relative frequencies: <code>1 − Σmin(pᵢ,qᵢ)</code> where <code>pᵢ = aᵢ/Σa</code></td>
+</tr>
+<tr>
+<td><code>euclidean_dist</code></td>
+<td><code>√Σ(aᵢ − bᵢ)²</code></td>
+</tr>
+<tr>
+<td><code>relfreq_euclidean_dist</code></td>
+<td>Euclidean on relative frequencies</td>
+</tr>
+<tr>
+<td><code>hellinger_euclidean_dist</code></td>
+<td><code>√Σ(√pᵢ − √qᵢ)²</code> — Euclidean on sqrt(relfreq)</td>
+</tr>
+<tr>
+<td><code>hellinger_dist</code></td>
+<td><code>hellinger_euclidean_dist / √2</code> — standard Hellinger distance ∈ [0, 1]</td>
+</tr>
+<tr>
+<td><code>threshold_jaccard_dist(&amp;other, threshold: u32)</code></td>
+<td><code>1 − \|A∩B\| / \|A∪B\|</code> where presence iff count ≥ threshold</td>
+</tr>
+<tr>
+<td><code>jaccard_dist</code></td>
+<td><code>threshold_jaccard_dist(&amp;other, 1)</code></td>
+</tr>
+</tbody>
+</table>
+<p>Edge cases (both vectors all-zero, or union empty for Jaccard): distance = 0.0.</p>
+<h3 id="step-computation">Step computation</h3>
+<p>Chosen at <code>close()</code> once <code>n_overflow</code> is known:</p>
+<div class="highlight"><pre><span></span><code>L1_INDEX_ENTRIES = 2048
+
+step = 0                                if n_overflow ≤ 2048
+step = ⌈n_overflow / 2048⌉             otherwise
+</code></pre></div>
+<h3 id="complexity">Complexity</h3>
+<table>
+<thead>
+<tr>
+<th>Operation</th>
+<th>Time</th>
+<th>Notes</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td><code>set</code> / <code>get</code> (builder)</td>
+<td>O(1)</td>
+<td>mmap byte + HashMap</td>
+</tr>
+<tr>
+<td><code>get</code> (reader, no overflow)</td>
+<td>O(1)</td>
+<td>single mmap byte</td>
+</tr>
+<tr>
+<td><code>get</code> (reader, with index)</td>
+<td>O(log step)</td>
+<td>≤ 2 memory regions</td>
+</tr>
+<tr>
+<td><code>get</code> (reader, no index)</td>
+<td>O(log n_overflow)</td>
+<td>data fits in a few cache lines</td>
+</tr>
+<tr>
+<td><code>iter()</code> full scan</td>
+<td>O(n + n_overflow)</td>
+<td>merge-scan, no binary search</td>
+</tr>
+<tr>
+<td><code>sum</code>, distances</td>
+<td>O(n)</td>
+<td>via <code>iter()</code> / <code>zip(iter(), iter())</code></td>
+</tr>
+<tr>
+<td><code>min</code> / <code>max</code> / <code>add</code> / <code>diff</code></td>
+<td>O(n)</td>
+<td>via <code>other.iter()</code> + builder <code>set</code></td>
+</tr>
+<tr>
+<td><code>close</code></td>
+<td>O(n_overflow log n_overflow)</td>
+<td>sort + sequential write</td>
+</tr>
+<tr>
+<td><code>open</code></td>
+<td>O(n_index)</td>
+<td>index copy into Vec</td>
+</tr>
+<tr>
+<td><code>build_from</code></td>
+<td>O(file_size) + O(n_overflow)</td>
+<td>OS copy + HashMap load</td>
+</tr>
+</tbody>
+</table>
+<hr />
+<h2 id="persistentcompactintmatrix-column-major-directory">PersistentCompactIntMatrix — column-major directory</h2>
+<h3 id="design_1">Design</h3>
+<p>A directory containing <code>meta.json</code> and N column files <code>col_000000.pciv</code>, <code>col_000001.pciv</code>, …, each a <code>PersistentCompactIntVec</code>. This is the type used by <code>LayerData</code> — a single-column matrix is functionally equivalent to a vector but shares the same interface as multi-column matrices.</p>
+<div class="highlight"><pre><span></span><code>counts/
+  meta.json          {&quot;n&quot;: &lt;n_slots&gt;, &quot;n_cols&quot;: &lt;N&gt;}
+  col_000000.pciv
+  col_000001.pciv
+  ...
+</code></pre></div>
+<h3 id="builder-persistentcompactintmatrixbuilder">Builder (<code>PersistentCompactIntMatrixBuilder</code>)</h3>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">PersistentCompactIntMatrixBuilder</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="n">dir</span><span class="p">:</span><span class="w">    </span><span class="nc">PathBuf</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n</span><span class="p">:</span><span class="w">      </span><span class="kt">usize</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n_cols</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">,</span>
+<span class="p">}</span>
+</code></pre></div>
+<p><strong><code>new(n: usize, dir: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Creates the directory (including parents). Does not write <code>meta.json</code> yet.</p>
+<p><strong><code>add_col(&amp;mut self) -&gt; io::Result&lt;PersistentCompactIntVecBuilder&gt;</code></strong></p>
+<p>Creates <code>col_NNNNNN.pciv</code> for the next column and returns its builder. The caller fills the column and calls <code>builder.close()</code> before calling <code>add_col</code> again.</p>
+<p><strong><code>close(self) -&gt; io::Result&lt;()&gt;</code></strong></p>
+<p>Writes <code>meta.json</code> with the final <code>n</code> and <code>n_cols</code>. Must be called after all column builders are closed.</p>
+<h3 id="reader-persistentcompactintmatrix">Reader (<code>PersistentCompactIntMatrix</code>)</h3>
+<div class="highlight"><pre><span></span><code><span class="k">struct</span><span class="w"> </span><span class="nc">PersistentCompactIntMatrix</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="n">cols</span><span class="p">:</span><span class="w"> </span><span class="nb">Vec</span><span class="o">&lt;</span><span class="n">PersistentCompactIntVec</span><span class="o">&gt;</span><span class="p">,</span>
+<span class="w">    </span><span class="n">n</span><span class="p">:</span><span class="w">    </span><span class="kt">usize</span><span class="p">,</span>
+<span class="p">}</span>
+</code></pre></div>
+<p><strong><code>open(dir: &amp;Path) -&gt; io::Result&lt;Self&gt;</code></strong></p>
+<p>Reads <code>meta.json</code>, opens all <code>col_NNNNNN.pciv</code> files.</p>
+<p><strong><code>row(slot: usize) -&gt; Box&lt;[u32]&gt;</code></strong></p>
+<p>Returns the full row: <code>[col_0[slot], col_1[slot], …, col_{N-1}[slot]]</code>. One mmap access per column. O(N).</p>
+<p><strong><code>col(c: usize) -&gt; &amp;PersistentCompactIntVec</code></strong></p>
+<p>Direct access to a single column for column-oriented operations (distance computations, iteration).</p>
+<h3 id="layerdata-implementation">LayerData implementation</h3>
+<div class="highlight"><pre><span></span><code><span class="k">impl</span><span class="w"> </span><span class="n">LayerData</span><span class="w"> </span><span class="k">for</span><span class="w"> </span><span class="n">PersistentCompactIntMatrix</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">type</span><span class="w"> </span><span class="nc">Item</span><span class="w"> </span><span class="o">=</span><span class="w"> </span><span class="nb">Box</span><span class="o">&lt;</span><span class="p">[</span><span class="kt">u32</span><span class="p">]</span><span class="o">&gt;</span><span class="p">;</span>
+<span class="w">    </span><span class="k">fn</span><span class="w"> </span><span class="nf">open</span><span class="p">(</span><span class="n">layer_dir</span><span class="p">:</span><span class="w"> </span><span class="kp">&amp;</span><span class="nc">Path</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nc">OLMResult</span><span class="o">&lt;</span><span class="bp">Self</span><span class="o">&gt;</span><span class="w"> </span><span class="p">{</span><span class="w"> </span><span class="cm">/* opens layer_dir/counts/ */</span><span class="w"> </span><span class="p">}</span>
+<span class="w">    </span><span class="k">fn</span><span class="w"> </span><span class="nf">read</span><span class="p">(</span><span class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span class="w"> </span><span class="n">slot</span><span class="p">:</span><span class="w"> </span><span class="kt">usize</span><span class="p">)</span><span class="w"> </span><span class="p">-&gt;</span><span class="w"> </span><span class="nb">Box</span><span class="o">&lt;</span><span class="p">[</span><span class="kt">u32</span><span class="p">]</span><span class="o">&gt;</span><span class="w">    </span><span class="p">{</span><span class="w"> </span><span class="bp">self</span><span class="p">.</span><span class="n">row</span><span class="p">(</span><span class="n">slot</span><span class="p">)</span><span class="w"> </span><span class="p">}</span>
+<span class="p">}</span>
+</code></pre></div>
+
+
+
+
+
+
+
+
+
+
+
+
+                
+              </article>
+            </div>
+          
+          
+<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>
+        </div>
+        
+      </main>
+      
+        <footer class="md-footer">
+  
+  <div class="md-footer-meta md-typeset">
+    <div class="md-footer-meta__inner md-grid">
+      <div class="md-copyright">
+  
+  
+    Made with
+    <a href="https://squidfunk.github.io/mkdocs-material/" target="_blank" rel="noopener">
+      Material for MkDocs
+    </a>
+  
+</div>
+      
+    </div>
+  </div>
+</footer>
+      
+    </div>
+    <div class="md-dialog" data-md-component="dialog">
+      <div class="md-dialog__inner md-typeset"></div>
+    </div>
+    
+    
+    
+      
+      
+      <script id="__config" type="application/json">{"annotate": null, "base": "../..", "features": [], "search": "../../assets/javascripts/workers/search.2c215733.min.js", "tags": null, "translations": {"clipboard.copied": "Copied to clipboard", "clipboard.copy": "Copy to clipboard", "search.result.more.one": "1 more on this page", "search.result.more.other": "# more on this page", "search.result.none": "No matching documents", "search.result.one": "1 matching document", "search.result.other": "# matching documents", "search.result.placeholder": "Type to start searching", "search.result.term.missing": "Missing", "select.version": "Select version"}, "version": null}</script>
+    
+    
+      <script src="../../assets/javascripts/bundle.79ae519e.min.js"></script>
+      
+        <script src="https://unpkg.com/mathjax@3/es5/tex-mml-chtml.js"></script>
+      
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/doc/implementation/pipeline/index.html b/doc/implementation/pipeline/index.html
index a9798f4..f95b9a7 100644
--- a/doc/implementation/pipeline/index.html
+++ b/doc/implementation/pipeline/index.html
@@ -767,6 +767,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -849,6 +933,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/implementation/storage/index.html b/doc/implementation/storage/index.html
index 047e47d..d216fcb 100644
--- a/doc/implementation/storage/index.html
+++ b/doc/implementation/storage/index.html
@@ -723,6 +723,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -805,6 +889,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/implementation/superkmer/index.html b/doc/implementation/superkmer/index.html
index f8ab366..2537ee6 100644
--- a/doc/implementation/superkmer/index.html
+++ b/doc/implementation/superkmer/index.html
@@ -745,6 +745,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -827,6 +911,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/implementation/unitig_evidence/index.html b/doc/implementation/unitig_evidence/index.html
index 3a479d8..1ad5be1 100644
--- a/doc/implementation/unitig_evidence/index.html
+++ b/doc/implementation/unitig_evidence/index.html
@@ -6,7 +6,7 @@
 <meta charset="utf-8"/>
 <meta content="width=device-width,initial-scale=1" name="viewport"/>
 <link href="../mphf/" rel="prev"/>
-<link href="../../architecture/sequences/invariant/" rel="next"/>
+<link href="../obilayeredmap/" rel="next"/>
 <link href="../../assets/images/favicon.png" rel="icon"/>
 <meta content="mkdocs-1.6.1, mkdocs-material-9.7.6" name="generator"/>
 <title>Unitig evidence encoding - obikmer</title>
@@ -467,6 +467,37 @@
 </nav>
 </li>
 <li class="md-nav__item">
+<a class="md-nav__link" href="#non-determinism-of-the-unitig-decomposition">
+<span class="md-ellipsis">
+      
+        Non-determinism of the unitig decomposition
+      
+    </span>
+</a>
+<nav aria-label="Non-determinism of the unitig decomposition" class="md-nav">
+<ul class="md-nav__list">
+<li class="md-nav__item">
+<a class="md-nav__link" href="#source-of-non-determinism">
+<span class="md-ellipsis">
+      
+        Source of non-determinism
+      
+    </span>
+</a>
+</li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="#consequence-for-mphf-construction">
+<span class="md-ellipsis">
+      
+        Consequence for MPHF construction
+      
+    </span>
+</a>
+</li>
+</ul>
+</nav>
+</li>
+<li class="md-nav__item">
 <a class="md-nav__link" href="#open-questions">
 <span class="md-ellipsis">
       
@@ -478,6 +509,42 @@
 </ul>
 </nav>
 </li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="../obilayeredmap/">
+<span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+</a>
+</li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="../persistent_compact_int_vec/">
+<span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+</a>
+</li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="../persistent_bit_vec/">
+<span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+</a>
+</li>
 </ul>
 </nav>
 </li>
@@ -513,6 +580,18 @@
   
 
     
+  </span>
+</a>
+</li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="../../architecture/index_architecture/">
+<span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
   </span>
 </a>
 </li>
@@ -698,6 +777,37 @@
 </nav>
 </li>
 <li class="md-nav__item">
+<a class="md-nav__link" href="#non-determinism-of-the-unitig-decomposition">
+<span class="md-ellipsis">
+      
+        Non-determinism of the unitig decomposition
+      
+    </span>
+</a>
+<nav aria-label="Non-determinism of the unitig decomposition" class="md-nav">
+<ul class="md-nav__list">
+<li class="md-nav__item">
+<a class="md-nav__link" href="#source-of-non-determinism">
+<span class="md-ellipsis">
+      
+        Source of non-determinism
+      
+    </span>
+</a>
+</li>
+<li class="md-nav__item">
+<a class="md-nav__link" href="#consequence-for-mphf-construction">
+<span class="md-ellipsis">
+      
+        Consequence for MPHF construction
+      
+    </span>
+</a>
+</li>
+</ul>
+</nav>
+</li>
+<li class="md-nav__item">
 <a class="md-nav__link" href="#open-questions">
 <span class="md-ellipsis">
       
@@ -774,7 +884,8 @@ b_B = \left\lceil \log_2 U \right\rceil + \left\lceil \log_2 L_{max} \right\rcei
 </tr>
 </tbody>
 </table>
-<p>On <em>Betula nana</em> (k=31, 256 partitions), m_u ≈ 37.9 kmers/unitig on average; no unitig length distribution data measured yet. The <code>rank</code> field (kmer index within the unitig) fits in a <code>u8</code> as long as no unitig exceeds 255 kmers — guaranteed by the split strategy below.</p>
+<p><strong>Structural maximum from superkmer construction.</strong> For k=31 and m=11, the maximum number of consecutive kmers sharing the same minimiser is k − m + 1 = <strong>21 kmers</strong> (the minimiser traverses from position k−m to 0 as the window slides). A unitig that is a single full superkmer therefore has exactly 21 kmers. This is confirmed by a bimodal distribution in empirical data: a sharp peak at 21 kmers appears in all partitions, including the anomalous partition 145. The observed maximum is ~46 kmers (unitigs spanning more than one superkmer), well within u8 range.</p>
+<p>On <em>Betula nana</em> (k=31, 256 partitions), m_u ≈ 37.9 kmers/unitig on average. The <code>rank</code> field (kmer index within the unitig) fits in a <code>u8</code> as long as no unitig exceeds 255 kmers — guaranteed by the split strategy below and amply satisfied by empirical maximums (~46 kmers observed).</p>
 <h3 id="split-strategy-for-long-unitigs">Split strategy for long unitigs</h3>
 <p>For the rare cases where a unitig exceeds 255 kmers, the unitig is split into chunks of at most 255 kmers, with a <strong>k−1 nucleotide overlap</strong> at each junction — identical to the way super-kmers are delimited at partition boundaries. Each chunk is self-contained and independently decodable.</p>
 <div class="highlight"><pre><span></span><code>original unitig: kmer_0 … kmer_254 | kmer_255 … kmer_N
@@ -1026,6 +1137,43 @@ kmer      = nucleotides(unitig_id)[rank .. rank + k]   // 2-bit packed slice
 <h3 id="forward-vs-reverse-complement">Forward vs reverse complement</h3>
 <p>The De Bruijn graph stores only canonical kmers. The evidence encodes the canonical orientation. Callers that need the strand of the original kmer must compare the retrieved kmer with its revcomp at query time; this is a single 64-bit comparison.</p>
 <hr/>
+<h2 id="non-determinism-of-the-unitig-decomposition">Non-determinism of the unitig decomposition</h2>
+<p>The unitig extraction is <strong>not deterministic</strong>: two runs on identical input can produce a different number of unitigs with different sequences, while covering exactly the same canonical k-mer set.</p>
+<h3 id="source-of-non-determinism">Source of non-determinism</h3>
+<p>The graph nodes are stored in a hash map whose iteration order depends on the hash seed (random per run with <code>ahash::RandomState::new()</code>). The <code>start_iter</code> first pass emits every node whose <code>can_extend_left</code> flag is false — which includes not only true dead-end nodes but also <strong>branch points</strong> (nodes with 2 or more left neighbours, for which <code>unique_neighbor</code> returns <code>None</code>).</p>
+<p>When a branch point is encountered before its upstream neighbours, it claims the downstream chain and those neighbours later produce length-k degenerate unitigs. When upstream neighbours are encountered first, they extend through the branch point and consume it.</p>
+<p><strong>Example</strong> — fork topology (k = 31):</p>
+<div class="highlight"><pre><span></span><code>A → B ← C
+    ↓
+    D
+</code></pre></div>
+<p>All four nodes are in the graph. B has two left neighbours (A and C), so <code>can_extend_left = false</code>; B also has one right neighbour D, so <code>can_extend_right = true</code>.</p>
+<table>
+<thead>
+<tr>
+<th>iteration order</th>
+<th>unitigs produced</th>
+<th>count</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td>A first, then B, C</td>
+<td>ABD · C</td>
+<td>2</td>
+</tr>
+<tr>
+<td>B first, then A, C</td>
+<td>BD · A · C</td>
+<td>3</td>
+</tr>
+</tbody>
+</table>
+<p>Both tilings cover the same 4 canonical k-mers.</p>
+<p>Pure cycles (all nodes have both extensions present) are unaffected by this: they are never emitted in the first pass and each cycle produces exactly one unitig regardless of which node the second pass starts from. Only the cycle cut point (and therefore the sequence content) varies.</p>
+<h3 id="consequence-for-mphf-construction">Consequence for MPHF construction</h3>
+<p>The MPHF is built from the <strong>k-mer set</strong>, not from the unitig sequences themselves. Because both tilings contain the same canonical k-mers, the resulting MPHF is identical. The non-determinism is benign for this use case.</p>
+<hr/>
 <h2 id="open-questions">Open questions</h2>
 <ul>
 <li><strong>Rank field width</strong>: u8 covers 255 kmers; storing lengths and ranks in kmer units (not nucleotides) buys k−1 extra units of headroom at no cost. On <em>B. nana</em> (k=31), m_u ≈ 38 — well within u8 range on average, but the maximum unitig length has not been measured yet. For genomes with very long unitigs, u16 may be needed; the header could record the actual width if portability is required.</li>
diff --git a/doc/index.html b/doc/index.html
index 73ae778..763d9c1 100644
--- a/doc/index.html
+++ b/doc/index.html
@@ -708,6 +708,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="implementation/obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="implementation/persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="implementation/persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -790,6 +874,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/kmers/index.html b/doc/kmers/index.html
index a066512..7b4795c 100644
--- a/doc/kmers/index.html
+++ b/doc/kmers/index.html
@@ -740,6 +740,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../implementation/obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../implementation/persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../implementation/persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -822,6 +906,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/sitemap.xml.gz b/doc/sitemap.xml.gz
index 25db22c..e43d52e 100644
Binary files a/doc/sitemap.xml.gz and b/doc/sitemap.xml.gz differ
diff --git a/doc/theory/encoding/index.html b/doc/theory/encoding/index.html
index f17a033..6adf132 100644
--- a/doc/theory/encoding/index.html
+++ b/doc/theory/encoding/index.html
@@ -712,6 +712,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -794,6 +878,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/theory/entropy/index.html b/doc/theory/entropy/index.html
index 3296a6e..20e5a37 100644
--- a/doc/theory/entropy/index.html
+++ b/doc/theory/entropy/index.html
@@ -767,6 +767,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -849,6 +933,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/theory/indexing/index.html b/doc/theory/indexing/index.html
index c54ca12..97513e3 100644
--- a/doc/theory/indexing/index.html
+++ b/doc/theory/indexing/index.html
@@ -712,6 +712,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -794,6 +878,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/doc/theory/minimizer/index.html b/doc/theory/minimizer/index.html
index 95da5d2..0c56933 100644
--- a/doc/theory/minimizer/index.html
+++ b/doc/theory/minimizer/index.html
@@ -756,6 +756,90 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/obilayeredmap/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    obilayeredmap crate
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_compact_int_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentCompactIntVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../implementation/persistent_bit_vec/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    PersistentBitVec
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -838,6 +922,34 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../../architecture/index_architecture/" class="md-nav__link">
+        
+  
+  
+  <span class="md-ellipsis">
+    
+  
+    Kmer index
+  
+
+    
+  </span>
+  
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/docmd/architecture/index_architecture.md b/docmd/architecture/index_architecture.md
index 102b92f..9db00a2 100644
--- a/docmd/architecture/index_architecture.md
+++ b/docmd/architecture/index_architecture.md
@@ -58,12 +58,230 @@ trait DataStore {
 
 Concrete types from `obicompactvec`:
 
-| Type | `Item` | Use |
-|---|---|---|
-| `PersistentCompactIntMatrix` | `Box<[u32]>` | count per sample per slot |
-| `PersistentBitMatrix` | `Box<[bool]>` | presence per sample per slot |
+| Type | `Item` | Column stats | Use |
+|---|---|---|---|
+| `PersistentCompactIntMatrix` | `Box<[u32]>` | `sum() -> Array1<u64>` | count per sample per slot |
+| `PersistentBitMatrix` | `Box<[bool]>` | `count_ones() -> Array1<u64>` | presence per sample per slot |
 
-A `DataStore` knows nothing about kmers or MPHFs. It is indexed by `usize` slot only. The path to its on-disk files is managed by the `LayeredPartition`, not embedded in the store type.
+`sum()` and `count_ones()` are the bridge between the per-matrix level and cross-layer aggregation: they give the total weight of each column within one (partition, layer) pair, which can be summed to get global column weights.
+
+A `DataStore` knows nothing about kmers or MPHFs. It is indexed by `usize` slot only.
+
+---
+
+## Distance matrix API on DataStore types
+
+Both `PersistentCompactIntMatrix` and `PersistentBitMatrix` expose two families of distance matrix methods.
+
+### Full distance matrices
+
+Compute the final `n_cols × n_cols` distance matrix from data within a single matrix. Internally parallelised over the upper triangle via rayon.
+
+```rust
+// PersistentCompactIntMatrix
+fn bray_dist_matrix(&self)              -> Array2<f64>
+fn relfreq_bray_dist_matrix(&self)      -> Array2<f64>
+fn euclidean_dist_matrix(&self)         -> Array2<f64>
+fn relfreq_euclidean_dist_matrix(&self) -> Array2<f64>
+fn hellinger_dist_matrix(&self)         -> Array2<f64>
+fn jaccard_dist_matrix(&self)           -> Array2<f64>
+fn threshold_jaccard_dist_matrix(&self, threshold: u32) -> Array2<f64>
+
+// PersistentBitMatrix
+fn jaccard_dist_matrix(&self)           -> Array2<f64>
+fn hamming_dist_matrix(&self)           -> Array2<u64>
+```
+
+These are convenience methods. For a `LayeredDataStore` or `PartitionedDataStore` they cannot be used directly — the partial API is required.
+
+### Partial distance matrices
+
+Return additive components that can be summed element-wise across (partition, layer) pairs before computing the final distance. This is what makes cross-layer and cross-partition aggregation possible.
+
+**Category 1 — self-contained partials**: additive without any external parameter.
+
+```rust
+// PersistentCompactIntMatrix
+fn partial_bray_dist_matrix(&self)
+    -> (Array2<u64>,  // sum_min[i,j]
+        Array1<u64>)  // col_sums[k]
+
+fn partial_euclidean_dist_matrix(&self)       -> Array2<f64>   // sum of squared diffs
+fn partial_threshold_jaccard_dist_matrix(&self, threshold: u32)
+    -> (Array2<u64>,  // inter[i,j]
+        Array2<u64>)  // union[i,j]
+
+// PersistentBitMatrix
+fn partial_jaccard_dist_matrix(&self)
+    -> (Array2<u64>,  // inter[i,j]
+        Array2<u64>)  // union[i,j]
+fn partial_hamming_dist_matrix(&self)         -> Array2<u64>   // differing bits
+```
+
+**Category 2 — normalised partials**: require global column sums as input, computed beforehand across all (partition, layer) pairs.
+
+```rust
+// PersistentCompactIntMatrix only
+fn partial_relfreq_bray_dist_matrix(&self, col_sums: &Array1<u64>)
+    -> Array2<f64>   // Σ_slot min(a_slot/sum_i, b_slot/sum_j)
+
+fn partial_relfreq_euclidean_dist_matrix(&self, col_sums: &Array1<u64>)
+    -> Array2<f64>   // Σ_slot (a_slot/sum_i - b_slot/sum_j)²
+
+fn partial_hellinger_euclidean_dist_matrix(&self, col_sums: &Array1<u64>)
+    -> Array2<f64>   // Σ_slot (√(a/sum_i) - √(b/sum_j))²
+```
+
+The `col_sums` parameter must reflect the GLOBAL count across all layers and all partitions — passing a per-layer sum would give a wrong result. This constraint drives the two-pass algorithm described below.
+
+---
+
+## Progressive aggregation principle
+
+Aggregation is **hierarchical**: each level computes its contribution by aggregating from the level immediately below it. No level skips a level or collects raw data from two levels down.
+
+```
+PersistentCompactIntMatrix::sum()       — column sums for one (partition, layer) matrix
+        ↓ Σ across layers
+LayeredCompactIntMatrix::sum()          — column sums for one partition
+        ↓ Σ across partitions
+PartitionedCompactIntMatrix::sum()      — global column sums
+```
+
+The same cascade applies to every partial computation:
+
+```
+PersistentCompactIntMatrix::partial_bray_dist_matrix()   — one (partition, layer)
+        ↓ element-wise Σ across layers
+LayeredCompactIntMatrix::partial_bray()                   — one partition
+        ↓ element-wise Σ across partitions
+PartitionedCompactIntMatrix::partial_bray()               — global partial → final dist
+```
+
+This means `LayeredCompactIntMatrix` never inspects individual `PersistentCompactIntVec` columns directly, and `PartitionedCompactIntMatrix` never inspects individual layers. Each level presents a stable API surface to the level above.
+
+---
+
+## LayeredDataStore — aggregation within one partition
+
+A `LayeredDataStore` holds one `DataStore` per layer within a single partition:
+
+```rust
+struct LayeredCompactIntMatrix { layers: Vec<PersistentCompactIntMatrix> }
+struct LayeredBitMatrix         { layers: Vec<PersistentBitMatrix> }
+```
+
+### Column statistics
+
+```rust
+// LayeredCompactIntMatrix
+fn sum(&self) -> Array1<u64>
+    // = layers.par_iter().map(|m| m.sum()).reduce(element-wise +)
+
+// LayeredBitMatrix
+fn count_ones(&self) -> Array1<u64>
+    // = layers.par_iter().map(|m| m.count_ones()).reduce(element-wise +)
+```
+
+### Self-contained partials
+
+Each method reduces across layers by element-wise addition of per-layer matrices:
+
+```rust
+fn partial_bray(&self)          -> (Array2<u64>, Array1<u64>)
+    // Σ_l layer_l.partial_bray_dist_matrix()
+
+fn partial_euclidean(&self)      -> Array2<f64>
+    // Σ_l layer_l.partial_euclidean_dist_matrix()
+
+fn partial_jaccard(&self)        -> (Array2<u64>, Array2<u64>)
+    // Σ_l layer_l.partial_jaccard_dist_matrix()  [bit matrix]
+    // Σ_l layer_l.partial_threshold_jaccard_dist_matrix()  [int matrix]
+
+fn partial_hamming(&self)        -> Array2<u64>
+    // Σ_l layer_l.partial_hamming_dist_matrix()  [bit matrix]
+```
+
+### Normalised partials (require global sums from above)
+
+```rust
+fn partial_relfreq_bray(&self, global_sums: &Array1<u64>) -> Array2<f64>
+    // Σ_l layer_l.partial_relfreq_bray_dist_matrix(global_sums)
+
+fn partial_relfreq_euclidean(&self, global_sums: &Array1<u64>) -> Array2<f64>
+    // Σ_l layer_l.partial_relfreq_euclidean_dist_matrix(global_sums)
+
+fn partial_hellinger(&self, global_sums: &Array1<u64>) -> Array2<f64>
+    // Σ_l layer_l.partial_hellinger_euclidean_dist_matrix(global_sums)
+```
+
+`global_sums` is provided by the `PartitionedDataStore`; this level does not compute it.
+
+---
+
+## PartitionedDataStore — aggregation across all partitions
+
+A `PartitionedDataStore` holds one `LayeredDataStore` per partition:
+
+```rust
+struct PartitionedCompactIntMatrix { partitions: Vec<LayeredCompactIntMatrix> }
+struct PartitionedBitMatrix         { partitions: Vec<LayeredBitMatrix> }
+```
+
+### Column statistics
+
+```rust
+fn sum(&self) -> Array1<u64>
+    // = partitions.par_iter().map(|p| p.sum()).reduce(element-wise +)
+```
+
+`p.sum()` is itself a reduction across layers (see above) — the cascade is preserved.
+
+### Self-contained metrics — single pass
+
+```rust
+fn bray_dist_matrix(&self) -> Array2<f64> {
+    let (sum_min, col_sums) = partitions
+        .par_iter()
+        .map(|p| p.partial_bray())
+        .reduce(element-wise +);
+    // finalise
+    for (i,j): dist[i,j] = 1 - 2·sum_min[i,j] / (col_sums[i] + col_sums[j])
+}
+```
+
+### Normalised metrics — two passes
+
+```rust
+fn relfreq_bray_dist_matrix(&self) -> Array2<f64> {
+    // pass 1 — progressive: PartitionedDataStore::sum()
+    //   calls LayeredDataStore::sum() per partition (parallel)
+    //     calls PersistentCompactIntMatrix::sum() per layer (parallel)
+    let global_sums = self.sum();
+
+    // pass 2 — per-partition partial using global_sums (parallel)
+    let matrix = partitions
+        .par_iter()
+        .map(|p| p.partial_relfreq_bray(&global_sums))
+        .reduce(element-wise +);
+    // finalise
+    for (i,j): dist[i,j] = 1 - matrix[i,j]
+}
+```
+
+`global_sums` is exact because each kmer belongs to exactly one (partition, layer) pair — no double-counting. Pass 1 is itself fully parallel at every level of the hierarchy.
+
+---
+
+## Parallelism model
+
+| Level | Unit | Coordination |
+|---|---|---|
+| Across partitions | `LayeredDataStore` | none — fully independent |
+| Across layers (self-contained) | `(partition, layer)` pair | none — disjoint kmer sets |
+| Across layers (normalised, pass 1) | `(partition, layer)` pair | none — sums are additive |
+| Across layers (normalised, pass 2) | `(partition, layer)` pair | global_sums broadcast read-only |
+| Within a DataStore (distance matrix) | upper-triangle pair `(i,j)` | none — rayon par_iter |
 
 ---
 
@@ -80,65 +298,19 @@ for each layer l in p:
 return None
 ```
 
-O(n_layers) MPHF probes in the worst case; O(1) expected (kmer in layer 0). No cross-layer data fusion — the result comes from exactly one layer.
+O(n_layers) MPHF probes worst case; O(1) expected. No cross-layer fusion — the result comes from exactly one (partition, layer).
 
-### Sequence scan — `sequence → Vec<(kmer, Option<Item>)>`
-
-Decompose into canonical kmers, group by partition, dispatch to each partition in parallel. Within a partition, probe layers in order per kmer. Collect results.
-
-Parallelism: across partitions (independent). Within a partition: per-kmer probing is sequential across layers but different kmers are independent.
-
-### Aggregation — `→ Accumulator`
-
-For operations that traverse all kmers (distance, presence matrix, global counts):
+### Aggregation — `→ Result`
 
 ```
 result = reduce(
-    for p in partitions:             // parallel
-        for l in layers(p):          // parallel
+    for p in partitions:            // parallel
+        for l in layers(p):         // parallel
             partial(DataStore_p_l)
 )
 ```
 
-Each `(partition, layer)` contributes an independent `Partial`. Global result = `reduce(all partials)`.
-
----
-
-## Aggregator pattern
-
-```rust
-trait Aggregator<D: DataStore> {
-    type Partial: Send;
-    type Result;
-    fn partial(&self, store: &D) -> Self::Partial;
-    fn reduce(&self, parts: impl Iterator<Item=Self::Partial>) -> Self::Result;
-}
-```
-
-Concrete aggregators:
-
-| Aggregator | `Partial` | `Result` |
-|---|---|---|
-| `BrayCurtis(i, j)` | `(sum_min, sum_a, sum_b): (u64, u64, u64)` | `f64` |
-| `Jaccard(i, j)` | `(inter, union): (u64, u64)` | `f64` |
-| `Hellinger(i, j)` | `(sum_sqrt_prod, sum_a, sum_b): (f64, f64, f64)` | `f64` |
-| `DistanceMatrix(metric)` | `n×n partial matrix` | `n×n f64 matrix` |
-| `PresenceQuery(kmer)` | — | routed to point query |
-
-The `partial` for `BrayCurtis(i, j)` on a `PersistentCompactIntMatrix` with columns i and j already exists as `PersistentCompactIntVec::partial_bray_dist` — it needs to be lifted to the column-pair level on the matrix.
-
----
-
-## Parallelism model
-
-| Level | Unit | Coordination |
-|---|---|---|
-| Across partitions | `LayeredPartition` | none — fully independent |
-| Across layers (aggregation) | `(partition, layer)` pair | none — disjoint kmer sets |
-| Within a layer (point query) | n/a — single layer per kmer | n/a |
-| DataStore derivation | one `(partition, layer)` per task | none |
-
-The dispatch model: `PartitionedIndex::aggregate(aggregator)` fans out over partitions (rayon `par_iter`), each partition fans out over its layers, collects partials, then a top-level `reduce` combines.
+For normalised metrics replace with the two-pass scheme above.
 
 ---
 
@@ -149,17 +321,11 @@ Because the `MphfLayer` is independent of its data stores, new stores can be der
 ```
 // count → presence/absence, parallel across (partition, layer)
 for (p, l) in all_partition_layer_pairs().par_iter():
-    count_store = open PersistentCompactIntMatrix at (p, l)
+    count_store   = open PersistentCompactIntMatrix at (p, l)
     presence_store = PersistentBitMatrix::from_count_matrix(count_store, threshold, dir)
-    attach presence_store to MphfLayer(p, l)
 ```
 
-Other derivations:
-- Threshold a count matrix → binary presence matrix
-- Union two presence matrices (same MPHF, different samples)
-- Merge two count matrices (saturating add, column-wise)
-
-All derivations are local to a `(partition, layer)` pair and fully parallelisable.
+Other derivations: threshold a count matrix → binary presence matrix; union two presence matrices; merge two count matrices (saturating add, column-wise). All are local to one `(partition, layer)` pair.
 
 ---
 
@@ -169,11 +335,12 @@ The current `obilayeredmap` crate implements a subset of this architecture. Key
 
 - `Layer<D: LayerData>` fuses `MphfLayer` and one `DataStore` into a single generic type. Multiple data stores on the same MPHF are not supported.
 - `LayerData::open(dir)` embeds the path convention (`counts/`, `presence/`) inside the store type, preventing the `PartitionedIndex` from managing paths externally.
-- The `Aggregator` pattern is not yet implemented; partial distance methods exist on `PersistentCompactIntVec` but are not composed across layers and partitions.
-- No `PartitionedIndex` type exists; `LayeredMap` is a single-partition structure.
+- `LayeredDataStore` and `PartitionedDataStore` do not yet exist; `LayeredMap` is a single-partition structure without a distance matrix API.
+- The partial distance methods exist on `PersistentCompactIntMatrix` and `PersistentBitMatrix` and are tested; they are not yet composed across layers and partitions.
 
 Planned refactoring:
 1. Extract `MphfLayer` from `Layer<D>` as an autonomous type.
 2. Replace `LayerData` trait with `DataStore` trait (no path knowledge).
-3. Implement `LayeredPartition` that holds `Vec<MphfLayer>` and attaches data stores externally.
-4. Implement `PartitionedIndex` with parallel dispatch and the `Aggregator` pattern.
+3. Implement `LayeredCompactIntMatrix` / `LayeredBitMatrix` with the partial + full distance APIs described above.
+4. Implement `PartitionedCompactIntMatrix` / `PartitionedBitMatrix` with two-pass support for normalised metrics.
+5. Implement `PartitionedIndex` for point queries with parallel dispatch.
diff --git a/src/obicompactvec/src/intmatrix.rs b/src/obicompactvec/src/intmatrix.rs
index 4f6742f..9ea70a8 100644
--- a/src/obicompactvec/src/intmatrix.rs
+++ b/src/obicompactvec/src/intmatrix.rs
@@ -36,7 +36,20 @@ impl PersistentCompactIntMatrix {
     // ── Distance matrices ─────────────────────────────────────────────────────
 
     pub fn bray_dist_matrix(&self) -> Array2<f64> {
-        self.pairwise(|i, j| self.col(i).bray_dist(self.col(j)))
+        let sum_min  = self.partial_bray_dist_matrix();
+        let col_sums = self.sum();
+        let n = self.n_cols();
+        let mut m = Array2::zeros((n, n));
+        for i in 0..n {
+            for j in 0..n {
+                if i != j {
+                    let denom = col_sums[i] + col_sums[j];
+                    m[[i, j]] = if denom == 0 { 0.0 }
+                                 else { 1.0 - 2.0 * sum_min[[i, j]] as f64 / denom as f64 };
+                }
+            }
+        }
+        m
     }
 
     pub fn relfreq_bray_dist_matrix(&self) -> Array2<f64> {
@@ -74,23 +87,11 @@ impl PersistentCompactIntMatrix {
 
     // ── Partial matrices (additively decomposable across layers) ──────────────
 
-    /// Returns `(sum_min[n×n], col_sums[n])`.
-    /// `sum_min[i,j]` = Σ_slot min(col_i[slot], col_j[slot]).
-    /// `col_sums[k]` = Σ_slot col_k[slot].
-    /// Reduce across layers by element-wise addition before computing the final distance.
-    pub fn partial_bray_dist_matrix(&self) -> (Array2<u64>, Array1<u64>) {
-        let n = self.n_cols();
-
-        let col_sums: Vec<u64> = (0..n)
-            .into_par_iter()
-            .map(|i| self.col(i).sum())
-            .collect();
-
-        let sum_min = self.pairwise_u64(|i, j| {
-            self.col(i).partial_bray_dist(self.col(j)).0
-        });
-
-        (sum_min, Array1::from_vec(col_sums))
+    /// Returns `sum_min[n×n]` where `sum_min[i,j]` = Σ_slot min(col_i[slot], col_j[slot]).
+    /// The denominator `col_sums[i] + col_sums[j]` is obtained from `self.sum()`.
+    /// Additive across layers by element-wise addition.
+    pub fn partial_bray_dist_matrix(&self) -> Array2<u64> {
+        self.pairwise_u64(|i, j| self.col(i).partial_bray_dist(self.col(j)))
     }
 
     /// Returns sum of squared differences `[n×n]`.
diff --git a/src/obicompactvec/src/reader.rs b/src/obicompactvec/src/reader.rs
index 8a23667..0f4ce25 100644
--- a/src/obicompactvec/src/reader.rs
+++ b/src/obicompactvec/src/reader.rs
@@ -141,32 +141,22 @@ impl PersistentCompactIntVec {
     #[inline]
     /// Returns the Bray-Curtis distance between two compact int vectors.
     pub fn bray_dist(&self, other: &PersistentCompactIntVec) -> f64 {
-        let (sum_min, denom) = self.partial_bray_dist(other);
+        let sum_min = self.partial_bray_dist(other);
+        let denom = self.sum() + other.sum();
         if denom == 0 {
             return 0.0;
         }
         1.0 - 2.0 * sum_min as f64 / denom as f64
     }
 
-    /// Returns the partial Bray-Curtis distance between two compact int vectors.
-    ///
-    /// Returns a tuple `(sum_min, denom)` where `sum_min` is the sum of the minimum values
-    /// at each index, and `denom` is the sum of the values in both vectors.
-    /// This is used internally by [`bray_dist`] and to easily compute the Bray-Curtis distance
-    /// over a set of vector pairs.
-    ///
-    /// Returns the tuple `(sum_min, sum_a + sum_b)` where `sum_min` is the sum of the minimum
-    /// values at each index, `sum_a` is the sum of the first vector's counts, and `sum_b` is
-    /// the sum of the second vector's counts.
-    pub fn partial_bray_dist(&self, other: &PersistentCompactIntVec) -> (u64, u64) {
+    /// Returns `Σ_slot min(self[slot], other[slot])` — the additive numerator of Bray-Curtis.
+    /// The denominator `sum_a + sum_b` is obtained from `self.sum() + other.sum()`.
+    pub fn partial_bray_dist(&self, other: &PersistentCompactIntVec) -> u64 {
         assert_eq!(self.n, other.len(), "length mismatch");
-        let (sum_min, sum_a, sum_b) = self
-            .iter()
+        self.iter()
             .zip(other.iter())
-            .fold((0u64, 0u64, 0u64), |(sm, sa, sb), (a, b)| {
-                (sm + a.min(b) as u64, sa + a as u64, sb + b as u64)
-            });
-        (sum_min, sum_a + sum_b)
+            .map(|(a, b)| a.min(b) as u64)
+            .sum()
     }
 
     /// Returns the relative frequency Bray-Curtis distance between two compact int vectors.
diff --git a/src/obicompactvec/src/tests/intmatrix.rs b/src/obicompactvec/src/tests/intmatrix.rs
index c195b42..2b9d45e 100644
--- a/src/obicompactvec/src/tests/intmatrix.rs
+++ b/src/obicompactvec/src/tests/intmatrix.rs
@@ -126,21 +126,17 @@ fn jaccard_dist_matrix_values_match_pairwise() {
 #[test]
 fn partial_bray_dist_matrix_consistent() {
     let (_d, m) = make_matrix(&[&[1, 0, 1], &[1, 1, 0], &[0, 1, 1]]);
-    let (sum_min, col_sums) = m.partial_bray_dist_matrix();
+    let sum_min  = m.partial_bray_dist_matrix();
+    let col_sums = m.sum();
     let n = m.n_cols();
 
-    // symmetry of sum_min
+    // symmetry
     for i in 0..n {
         for j in 0..n {
             assert_eq!(sum_min[[i, j]], sum_min[[j, i]]);
         }
     }
 
-    // col_sums correct
-    for k in 0..n {
-        assert_eq!(col_sums[k], m.col(k).sum());
-    }
-
     // reconstruct distance from partials and compare to direct method
     for i in 0..n {
         for j in i + 1..n {

Type	`Item`	Column stats	Use
`PersistentCompactIntMatrix`	`Box<[u32]>`	`sum() -> Array1<u64>`	count per sample per slot
`PersistentBitMatrix`	`Box<[bool]>`	`count_ones() -> Array1<u64>`	presence per sample per slot
Level	Unit	Coordination
Across partitions	`LayeredDataStore`	none — fully independent
Across layers (self-contained)	`(partition, layer)` pair	none — disjoint kmer sets
Across layers (normalised, pass 1)	`(partition, layer)` pair	none — sums are additive
Across layers (normalised, pass 2)	`(partition, layer)` pair	global_sums broadcast read-only
Within a DataStore (distance matrix)	upper-triangle pair `(i,j)`	none — rayon par_iter
Mode	Description	Payload type	Storage
1. Set	membership test only	`()`	—
2. Count	occurrences per kmer per sample	`PersistentCompactIntMatrix`	`counts/` directory
3. Presence/absence matrix	which genomes contain each kmer	`PersistentBitMatrix`	`presence/` directory
4. Count matrix	occurrences per kmer per genome	`PersistentCompactIntMatrix`	`counts/` directory
Type	`Item`	Description
`()`	`()`	mode 1 — membership only
`PersistentCompactIntMatrix`	`Box<[u32]>`	modes 2/4 — one count per column
`PersistentBitMatrix`	`Box<[bool]>`	mode 3 — one presence bit per column
crate	role
`ptr_hash 1.1`	MPHF per layer (epserde serialisation)
`cacheline-ef 1.1`	compact remap storage inside ptr_hash
`epserde 0.8`	zero-copy serialisation of MPHF
`memmap2`	mmap of layer files
`obiskio`	unitig file writer/reader
`obicompactvec`	payload types: `PersistentCompactIntMatrix`, `PersistentBitMatrix`
Method	Formula	Notes
`jaccard_dist(&other) -> f64`	`1 − \\|A∩B\\| / \\|A∪B\\|`	`(a&b).count_ones()`, `(a\\|b).count_ones()` per word
`hamming_dist(&other) -> u64`	number of differing bits	`(a^b).count_ones()` per word
Operation	Time	Notes
`new` / `open`	O(1)	mmap setup + header parse
`get` / `set` (builder or reader)	O(1)	byte-level mmap
`iter()`	O(n)	byte-by-byte scan
`count_ones` / `count_zeros`	O(n/64)	POPCNT per u64 word
`and` / `or` / `xor` / `not`	O(n/64)	word-level bitwise ops
`jaccard_dist` / `hamming_dist`	O(n/64)	word AND/OR/XOR + POPCNT
`build_from`	O(file_size)	OS copy
`build_from_counts` / `build_from_presence`	O(n)	count iter + word fill
`close`	O(1)	flush only
Method	Formula
`bray_dist`	`1 − 2·Σmin(aᵢ,bᵢ) / (Σaᵢ + Σbᵢ)`
`relfreq_bray_dist`	Bray-Curtis on relative frequencies: `1 − Σmin(pᵢ,qᵢ)` where `pᵢ = aᵢ/Σa`
`euclidean_dist`	`√Σ(aᵢ − bᵢ)²`
`relfreq_euclidean_dist`	Euclidean on relative frequencies
`hellinger_euclidean_dist`	`√Σ(√pᵢ − √qᵢ)²` — Euclidean on sqrt(relfreq)
`hellinger_dist`	`hellinger_euclidean_dist / √2` — standard Hellinger distance ∈ [0, 1]
`threshold_jaccard_dist(&other, threshold: u32)`	`1 − \\|A∩B\\| / \\|A∪B\\|` where presence iff count ≥ threshold
`jaccard_dist`	`threshold_jaccard_dist(&other, 1)`
Operation	Time	Notes
`set` / `get` (builder)	O(1)	mmap byte + HashMap
`get` (reader, no overflow)	O(1)	single mmap byte
`get` (reader, with index)	O(log step)	≤ 2 memory regions
`get` (reader, no index)	O(log n_overflow)	data fits in a few cache lines
`iter()` full scan	O(n + n_overflow)	merge-scan, no binary search
`sum`, distances	O(n)	via `iter()` / `zip(iter(), iter())`
`min` / `max` / `add` / `diff`	O(n)	via `other.iter()` + builder `set`
`close`	O(n_overflow log n_overflow)	sort + sequential write
`open`	O(n_index)	index copy into Vec
`build_from`	O(file_size) + O(n_overflow)	OS copy + HashMap load