kvcache — package search across npm, PyPI, crates.io, RubyGems, Go, Maven & NuGet

Subquadratic O(N log N) sparse attention kernel for Rust LLM inference on edge devices, with optional FastGRNN salience gating for near-linear O(N) scaling

MaintenanceHealthy

PopularityNiche

SecurityClean

DepsZero deps

Maintained. Niche but maintained, actively maintained.

bare-metal-enginev0.7.1

crates.io

From-scratch LLM inference engine for Apple Silicon — 233 tok/sec, 85+ Metal GPU kernels

Maintained. Niche but maintained, actively maintained.

candle-cuda-vmmv0.1.1

crates.io

CUDA Virtual Memory Management bindings for elastic KV cache allocation in Candle

Aging — last published 7 months ago — check before adopting.

tensorlogic-trustformersv0.1.0

crates.io

Transformer-as-rules: Self-attention and FFN layers as einsum expressions

Maintained. Niche but maintained, actively maintained.

all-closev0.1.0

crates.io

LLM inference in Rust

Aging — last published 10 months ago — check before adopting.

axonml-llmv0.6.2

crates.io

Large Language Model architectures for the Axonml ML framework

Maintained. Niche but maintained, actively maintained.

cgn-corev0.1.1

crates.io

Cognitora shared library: config, errors, hashing, prefix-trie

Maintained. Niche but maintained, actively maintained.

cgn-protov0.1.1

crates.io

Cognitora gRPC stubs (tonic-generated)

Maintained. Niche but maintained, actively maintained.

cgn-tlsv0.1.1

crates.io

Cognitora: rustls helpers and mTLS bootstrap

Maintained. Niche but maintained, actively maintained.

ferrotorch-nnv0.6.1

crates.io

Neural network modules for ferrotorch — layers, losses, initialization

Maintained. Niche but maintained, actively maintained.