Configuration Management System#

Note: This document describes the legacy config_loader system. For new development, please use the centralized type-safe configuration system documented in docs/CONFIGURATION.md. The new system uses src/config/marcus_config.py and provides better type safety, IDE autocomplete, and validation.

Overview#

Marcus’s Configuration Management System provides a comprehensive, hierarchical configuration framework that manages settings from multiple sources with sophisticated validation, type conversion, and environment-specific overrides. The system supports both legacy single-project configurations and modern multi-project setups, serving as the backbone for all system configuration needs.

Architecture#

Core Components#

The Configuration Management System consists of three primary components:

ConfigLoader (src/config/config_loader.py)
- Singleton pattern for centralized configuration loading
- Multi-source configuration with precedence handling
- Legacy configuration migration capabilities
- Project and provider management
Settings (src/config/settings.py)
- High-level configuration access layer
- Specialized configuration getters for different domains
- Environment variable integration
- Configuration validation framework
HybridInferenceConfig (src/config/hybrid_inference_config.py)
- Specialized configuration for AI dependency inference
- Preset configurations for different use cases
- Performance tuning parameters
- Cost optimization controls

Configuration Hierarchy#

The system implements a sophisticated configuration hierarchy with the following precedence (highest to lowest):

Environment Variables (highest priority)
marcus.config.json file
Default values (lowest priority)

File Discovery Strategy#

The _load_config() method checks for configuration in this order (highest priority first):

MARCUS_CONFIG environment variable (highest priority) — if set, the path it points to is loaded immediately before any file-based search.
./config_marcus.json (current working directory)
{project_root}/config_marcus.json (project root)
~/.marcus/config_marcus.json (user home directory)

Integration in Marcus Ecosystem#

Core System Dependencies#

The Configuration Management System is a foundational dependency for virtually every Marcus component:

AI Providers: API keys, model selection, inference parameters
Kanban Integration: Provider credentials, board/project mappings
Monitoring Systems: Intervals, thresholds, alerting rules
Communication Hub: Channel configurations, notification settings
Intelligence Engines: Algorithm tuning parameters
Worker Agents: Execution environments, resource limits

Multi-Project Support#

The system supports both single-project (legacy) and multi-project configurations:

{
  "projects": {
    "project-uuid-1": {
      "name": "Frontend Redesign",
      "provider": "github",
      "config": {
        "owner": "company",
        "repo": "frontend",
        "project_number": 1
      }
    }
  },
  "active_project": "project-uuid-1",
  "providers": {
    "github": {
      "token": "ghp_..."
    },
    "planka": {
      "base_url": "https://planka.company.com",
      "email": "marcus@company.com"
    }
  }
}

Workflow Integration#

In the Marcus Lifecycle#

The Configuration Management System is invoked at multiple points in the typical Marcus workflow:

1. System Initialization#

create_project → ConfigLoader singleton creation → Configuration loading and validation

2. Agent Registration#

register_agent → Settings.get_team_config() → Agent-specific configuration retrieval

3. Task Processing#

request_next_task → AI model configuration → Kanban provider settings → Monitoring thresholds

4. Progress Reporting#

report_progress → Communication settings → Notification configurations

5. Blocker Management#

report_blocker → Escalation rules → Risk thresholds → Alert configurations

6. Task Completion#

finish_task → Post-completion monitoring → Performance tracking settings

Configuration Access Patterns#

The system provides multiple access patterns for different use cases:

# Direct access via ConfigLoader
from src.config.config_loader import get_config
config = get_config()
api_key = config.get("ai.anthropic_api_key")

# High-level access via Settings
from src.config.settings import Settings
settings = Settings()
risk_thresholds = settings.get_risk_thresholds()

# Convenience functions
from src.config.config_loader import get_anthropic_api_key
api_key = get_anthropic_api_key()

Special Features#

1. Automatic Legacy Migration#

The system automatically detects and migrates legacy single-project configurations to the new multi-project format:

def _migrate_legacy_config(self):
    """Migrate legacy single-project config to multi-project format"""
    if "project_id" in self._config and "projects" not in self._config:
        # Creates default project from legacy config
        # Preserves all existing settings
        # Maintains backward compatibility

2. Intelligent Type Conversion#

Environment variable overrides include automatic type conversion based on existing configuration values:

def _set_nested_value(self, path: str, value: str):
    """Set nested value with type conversion"""
    if isinstance(current_value, bool):
        config[final_key] = value.lower() in ("true", "1", "yes", "on")
    elif isinstance(current_value, int):
        config[final_key] = int(value)
    elif isinstance(current_value, float):
        config[final_key] = float(value)

3. Feature Configuration Compatibility#

Supports both old boolean format and new object format for feature flags:

def get_feature_config(self, feature: str) -> Dict[str, Any]:
    """Handle both old and new feature configuration formats"""
    # Old: "events": true
    # New: "events": {"enabled": true, "store_history": true}

4. Hybrid Inference Optimization#

The HybridInferenceConfig provides sophisticated tuning for AI-powered dependency inference:

@dataclass
class HybridInferenceConfig:
    pattern_confidence_threshold: float = 0.8  # Pattern vs AI threshold
    ai_confidence_threshold: float = 0.7       # AI acceptance threshold
    combined_confidence_boost: float = 0.15    # Agreement bonus
    max_ai_pairs_per_batch: int = 20          # Batch size optimization

Technical Implementation#

Singleton Pattern Implementation#

The ConfigLoader uses a thread-safe singleton pattern:

class ConfigLoader:
    _instance = None
    _config = None
    _config_path = None

    def __new__(cls):
        if cls._instance is None:
            cls._instance = super(ConfigLoader, cls).__new__(cls)
        return cls._instance

Deep Configuration Merging#

The Settings class implements recursive dictionary merging:

def _deep_merge(self, base: Dict[str, Any], update: Dict[str, Any]) -> Dict[str, Any]:
    """Recursively merge dictionaries"""
    for key, value in update.items():
        if key in result and isinstance(result[key], dict) and isinstance(value, dict):
            result[key] = self._deep_merge(result[key], value)
        else:
            result[key] = value

Dot-Notation Path Resolution#

Both ConfigLoader and Settings support dot-notation for nested configuration access:

def get(self, path: str, default: Any = None) -> Any:
    """Get configuration value using dot notation"""
    keys = path.split(".")
    value = self._config
    for key in keys:
        if isinstance(value, dict) and key in value:
            value = value[key]
        else:
            return default
    return value

Performance Considerations#

Pros#

Singleton Pattern: Single configuration load per process lifecycle
Lazy Loading: Configuration loaded only when first accessed
Memory Efficiency: Shared configuration instance across all components
Caching: Environment variable processing cached after first load
Validation Optimization: Validation only performed when explicitly requested

Cons#

Global State: Singleton pattern creates implicit global dependencies
Reload Complexity: Configuration changes require explicit reload() calls
Memory Persistence: Configuration held in memory for entire process lifetime
Thread Safety: Current implementation not fully thread-safe for concurrent modifications

Task Complexity Handling#

Simple Tasks#

For simple task configurations, the system provides:

Default values that work out-of-the-box
Minimal configuration requirements
Environment variable overrides for quick adjustments

Complex Tasks#

For complex multi-agent, multi-project scenarios:

Multi-project configuration with provider abstraction
Team-specific configuration profiles
Advanced AI tuning parameters
Sophisticated escalation and monitoring rules

Configuration Presets#

The HybridInferenceConfig includes preset configurations for different complexity levels:

PRESETS = {
    'conservative': HybridInferenceConfig(
        pattern_confidence_threshold=0.9,
        ai_confidence_threshold=0.8,
        max_ai_pairs_per_batch=10
    ),
    'balanced': HybridInferenceConfig(),  # Default values
    'aggressive': HybridInferenceConfig(
        pattern_confidence_threshold=0.7,
        ai_confidence_threshold=0.6,
        max_ai_pairs_per_batch=30
    ),
    'cost_optimized': HybridInferenceConfig(
        pattern_confidence_threshold=0.85,
        max_ai_pairs_per_batch=50,
        cache_ttl_hours=48
    ),
    'pattern_only': HybridInferenceConfig(
        enable_ai_inference=False  # Disables AI entirely; patterns only
    )
}

Board-Specific Considerations#

Provider Abstraction#

The system abstracts kanban provider specifics through a unified configuration interface:

def get_kanban_config(self) -> Dict[str, Any]:
    """Get complete kanban configuration for selected provider"""
    provider = self.get("kanban.provider", "planka")
    base_config = {"provider": provider, **self.get(f"kanban.{provider}", {})}
    return base_config

Board Mapping#

Different providers require different configuration structures:

Planka: project_id and board_id
GitHub: owner, repo, and project_number
Linear: team_id and project_id

The system handles these differences transparently through provider-specific configuration sections.

Cato Integration#

While Cato (the decision-making AI component) doesn’t have explicit configuration integration, it leverages the Configuration Management System through:

AI Provider Settings: Model selection, temperature, token limits
Decision Thresholds: Risk assessment parameters
Context Management: Memory and context retention settings
Performance Tuning: Batch sizes and caching parameters

Design Rationale#

Why This Approach#

Flexibility: Supports multiple configuration sources and formats
Evolution: Seamless migration from legacy to modern configurations
Separation of Concerns: Different configuration aspects handled by specialized components
Extensibility: Easy addition of new configuration domains
Environment Agnostic: Works across development, staging, and production environments

Alternative Approaches Considered#

Environment Variables Only: Too limited for complex nested configurations
Database-Stored Configuration: Added complexity and dependency requirements
Multiple Configuration Files: Increased management overhead and inconsistency risk
Runtime Configuration APIs: Security and persistence concerns

Trade-offs Made#

Complexity vs. Flexibility: Chose comprehensive system over simple key-value storage
Memory vs. Disk: Cached in-memory configuration vs. repeated file reads
Validation vs. Performance: Optional validation to maintain startup speed
Backward Compatibility vs. Clean Design: Maintained legacy support during transition

Future Evolution#

Short-term Enhancements#

Thread Safety: Full thread-safe configuration access for concurrent operations
Hot Reloading: Automatic configuration reload on file changes
Configuration Validation: Enhanced validation with detailed error reporting
Environment Profiles: Built-in development/staging/production profile support

Medium-term Roadmap#

Dynamic Configuration: Runtime configuration updates without process restart
Configuration History: Audit trail for configuration changes
Distributed Configuration: Support for configuration synchronization across multiple instances
Schema Validation: JSON Schema-based configuration validation

Long-term Vision#

AI-Driven Configuration: Automatic configuration optimization based on usage patterns
Self-Healing Configuration: Automatic recovery from configuration errors
Configuration Analytics: Deep insights into configuration impact on system performance
Template-Based Configuration: Reusable configuration templates for common setups

Error Handling and Resilience#

Configuration Load Failures#

The system implements graceful degradation when configuration loading fails:

try:
    config_loader = get_config()
    # Use centralized configuration
except Exception as e:
    # Fall back to defaults
    print(f"Warning: Could not load from config loader: {e}")

Validation Strategies#

Configuration validation is optional but comprehensive when enabled:

def validate(self) -> bool:
    """Validate configuration for consistency and completeness"""
    # Check required API keys
    # Validate monitoring intervals
    # Verify communication channels
    return True

Recovery Mechanisms#

Graceful Fallbacks: Default values for all configuration options
Partial Configuration: System operates with incomplete configuration
Configuration Repair: Automatic fixing of common configuration issues
User Guidance: Clear error messages with suggested fixes

Integration Examples#

AI Provider Configuration#

from src.config.config_loader import get_config

config = get_config()
ai_config = config.get_ai_config()

# Used by AI providers for model initialization
anthropic_client = AnthropicClient(
    api_key=ai_config.get('anthropic_api_key'),
    model=ai_config.get('model', 'claude-3-sonnet'),
    temperature=ai_config.get('temperature', 0.7)
)

Monitoring System Configuration#

from src.config.settings import Settings

settings = Settings()
risk_thresholds = settings.get_risk_thresholds()
escalation_rules = settings.get_escalation_rules()

# Used by monitoring systems for threshold-based alerting
if project_risk > risk_thresholds['high_risk']:
    escalate_after = escalation_rules['critical_path_delay_hours']
    schedule_escalation(task, escalate_after)

Hybrid Inference Configuration#

from src.config.config_loader import get_config

config = get_config()
hybrid_config = config.get_hybrid_inference_config()

# Used by dependency inference for performance tuning
if pattern_confidence > hybrid_config.pattern_confidence_threshold:
    # Skip AI analysis, trust pattern
    return pattern_dependencies
else:
    # Use AI for validation
    return ai_analyze_dependencies(tasks, hybrid_config)

This Configuration Management System represents one of Marcus’s most critical foundational components, enabling the flexible, scalable, and maintainable configuration of the entire system while supporting both simple single-project setups and complex multi-project enterprise deployments.