BETAmodules.com is in beta — open to partnerships & joint ventures.Build with us

Home Search Compare Equivalents

One search box and one honest, consistent read on every open-source library — across every ecosystem.

npmPyPIcrates.ioRubyGemsGoMavenNuGet

Discover

Tools

Compare Equivalents

Data

deps.dev OSV advisories npm registry PyPI

About

Methodology Partner with us

© 2026 Modules · A precision instrument for picking dependencies.Data refreshed continuously from public registries, deps.dev & OSV

cross-ecosystem search · live

Results for agent-eval-harness

Found in 2 of 7 ecosystemsnpm 1–24 of 70,794 · 1 match across other registries

How we search: free-text on npm, crates.io, RubyGems, NuGet and Maven. PyPI and Go do exact-name lookup only. Tip: click an ecosystem chip below to filter; click Show all ecosystems to come back.

Sort

Auto-load on scroll

npm matches

Showing 24 of 70,794 · JavaScript

See all npm →

agent-eval-harnessv0.1.0

Static + schema + routing + spawn-fixture eval harness for *.md subagents (Claude Code, etc.). Catches description bloat, fence-mimicry, low routing margin, and schema regressions before they ship.

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-typesv0.1.0

Shared domain types and Zod schemas for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-trajectoryv0.1.0

Trajectory loading, evaluation, and comparison for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-latencyv0.1.0

Latency monitoring, SLA enforcement, and optimization analysis for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-suitev0.1.0

Orchestrated evaluation suite runner with results aggregation for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-costv0.1.0

Cost tracking, budget management, and reporting for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-goldenv0.1.0

Golden trajectory management, comparison, and curation for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-observabilityv0.1.0

OpenTelemetry observability (tracing, metrics, logging, dashboards) for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-tool-usev0.1.0

Tool-use validation (selection, schema compliance, result verification) for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-judgev0.1.0

Provider-agnostic LLM-as-judge with calibration and consensus for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-mcp-serverv0.1.0

Three-layer MCP tool server (judge, suite, gate) for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-gatev0.1.0

CI regression gates, threshold checks, and JUnit/GitHub integration for agent-eval-harness

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@reaatech/agent-eval-harness-cliv0.1.0

CLI interface for agent-eval-harness with eval, judge, compare, gate, golden, report, and serve commands

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

@plaited/agent-eval-harnessv1.0.0

General-purpose eval harness for running trials against CLI agents

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

deepagentsv1.10.2

Deep Agents - a library for building controllable AI agents with LangGraph

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

static-evalv2.1.1

evaluate statically-analyzable expressions

MaintenanceAbandoned

PopularityUnknown

Abandoned. Last published 2 years ago.

@tangle-network/agent-evalv0.83.0

Evaluate and improve AI agents from runs, traces, judges, and feedback. Compare candidates, cluster failures, measure lift, and gate releases.

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

agent-harness-kitv0.22.0

Solo-dev harness engineering kit for Claude Code, with experimental Codex and Kiro CLI runtime rendering.

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

stable-harnessv0.0.145

Stable application runtime and operator control plane for agent workspaces.

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

simple-evalv2.0.0

Simple JavaScript expression evaluator

MaintenanceAging

PopularityUnknown

Aging — last published over a year ago — check before adopting.

Evaluate node require() module content directly

MaintenanceAbandoned

PopularityUnknown

Abandoned. Last published 4 years ago.

expr-eval-forkv3.0.3

Mathematical expression evaluator fork with exports map, prototype pollution and code injection security fixes

MaintenanceHealthy

PopularityUnknown

Maintained. Maintained, actively maintained.

math-expression-evaluatorv2.0.7

A flexible math expression evaluator

MaintenanceAging

PopularityUnknown

Aging — last published 12 months ago — check before adopting.

node-evalv2.0.0

require or eval modules

MaintenanceAbandoned

PopularityUnknown

Abandoned. Last published 8 years ago.

1 2 3 4 5…2950

PyPI matches

Exact match · Python

agent-eval-harnessv0.1.0

A local-first, lightweight harness for AI agent evaluations

MaintenanceHealthy

PopularityNiche

Maintained. Niche but maintained, actively maintained.