feat(01-02): create conversation data structures

- Define Message, Conversation, ContextBudget, and ContextWindow classes - Implement MessageRole and MessageType enums for classification - Add Pydantic models for validation and serialization - Include importance scoring and token estimation utilities - Support system, user, assistant, and tool message types File: src/models/conversation.py (147 lines)
2026-01-27 12:07:29 -05:00
parent 2ef1eafdb8
commit 221717d3a3
1 changed files with 280 additions and 0 deletions
--- a/src/models/conversation.py
+++ b/src/models/conversation.py
@@ -0,0 +1,280 @@
 """
 Conversation data models and types for Mai.
 This module defines the core data structures for managing conversations,
 messages, and context windows. Provides type-safe models with validation
 using Pydantic for serialization and data integrity.
 """
 from datetime import datetime
 from typing import Any, Dict, List, Optional, Union
 from enum import Enum
 from pydantic import BaseModel, Field, validator
 class MessageRole(str, Enum):
    """Message role types in conversation."""
    USER = "user"
    ASSISTANT = "assistant"
    SYSTEM = "system"
    TOOL_CALL = "tool_call"
    TOOL_RESULT = "tool_result"
 class MessageType(str, Enum):
    """Message type classifications for importance scoring."""
    INSTRUCTION = "instruction"  # User instructions, high priority
    QUESTION = "question"  # User questions, medium priority
    RESPONSE = "response"  # Assistant responses, medium priority
    SYSTEM = "system"  # System messages, high priority
    CONTEXT = "context"  # Context/background, low priority
    ERROR = "error"  # Error messages, variable priority
 class MessageMetadata(BaseModel):
    """Metadata for messages including source and importance indicators."""
    source: str = Field(default="conversation", description="Source of the message")
    message_type: MessageType = Field(
        default=MessageType.CONTEXT, description="Type classification"
    )
    priority: float = Field(
        default=0.5, ge=0.0, le=1.0, description="Priority score 0-1"
    )
    context_tags: List[str] = Field(
        default_factory=list, description="Context tags for retrieval"
    )
    is_permanent: bool = Field(default=False, description="Never compress this message")
    tool_name: Optional[str] = Field(
        default=None, description="Tool name for tool calls"
    )
    model_used: Optional[str] = Field(
        default=None, description="Model that generated this message"
    )
 class Message(BaseModel):
    """Individual message in a conversation."""
    id: str = Field(description="Unique message identifier")
    role: MessageRole = Field(description="Message role (user/assistant/system/tool)")
    content: str = Field(description="Message content text")
    timestamp: datetime = Field(
        default_factory=datetime.utcnow, description="Message creation time"
    )
    token_count: int = Field(default=0, description="Estimated token count")
    importance_score: float = Field(
        default=0.5, ge=0.0, le=1.0, description="Importance for compression"
    )
    metadata: MessageMetadata = Field(
        default_factory=MessageMetadata, description="Additional metadata"
    )
    @validator("content")
    def validate_content(cls, v):
        if not v or not v.strip():
            raise ValueError("Message content cannot be empty")
        return v.strip()
    class Config:
        json_encoders = {datetime: lambda v: v.isoformat()}
 class ConversationMetadata(BaseModel):
    """Metadata for conversation sessions."""
    session_id: str = Field(description="Unique session identifier")
    title: Optional[str] = Field(default=None, description="Conversation title")
    created_at: datetime = Field(
        default_factory=datetime.utcnow, description="Session start time"
    )
    last_active: datetime = Field(
        default_factory=datetime.utcnow, description="Last activity time"
    )
    total_messages: int = Field(default=0, description="Total message count")
    total_tokens: int = Field(default=0, description="Total token count")
    model_history: List[str] = Field(
        default_factory=list, description="Models used in this session"
    )
    context_window_size: int = Field(
        default=4096, description="Context window size for this session"
    )
 class Conversation(BaseModel):
    """Conversation manager for message sequences and metadata."""
    id: str = Field(description="Conversation identifier")
    messages: List[Message] = Field(
        default_factory=list, description="Messages in chronological order"
    )
    metadata: ConversationMetadata = Field(description="Conversation metadata")
    def add_message(self, message: Message) -> None:
        """Add a message to the conversation."""
        self.messages.append(message)
        self.metadata.total_messages = len(self.messages)
        self.metadata.total_tokens += message.token_count
        self.metadata.last_active = datetime.utcnow()
    def get_messages_by_role(self, role: MessageRole) -> List[Message]:
        """Get all messages from a specific role."""
        return [msg for msg in self.messages if msg.role == role]
    def get_recent_messages(self, count: int = 10) -> List[Message]:
        """Get the most recent N messages."""
        return self.messages[-count:] if count > 0 else []
    def get_message_range(self, start: int, end: Optional[int] = None) -> List[Message]:
        """Get messages in a range (start inclusive, end exclusive)."""
        if end is None:
            end = len(self.messages)
        return self.messages[start:end]
    def clear_messages(self, keep_system: bool = True) -> None:
        """Clear all messages, optionally keeping system messages."""
        if keep_system:
            self.messages = [
                msg for msg in self.messages if msg.role == MessageRole.SYSTEM
            ]
        else:
            self.messages.clear()
        self.metadata.total_messages = len(self.messages)
        self.metadata.total_tokens = sum(msg.token_count for msg in self.messages)
 class ContextBudget(BaseModel):
    """Token budget tracker for context window management."""
    max_tokens: int = Field(description="Maximum tokens allowed")
    used_tokens: int = Field(default=0, description="Tokens currently used")
    compression_threshold: float = Field(
        default=0.7, description="Compression trigger ratio"
    )
    safety_margin: int = Field(default=100, description="Safety margin tokens")
    @property
    def available_tokens(self) -> int:
        """Calculate available tokens including safety margin."""
        return max(0, self.max_tokens - self.used_tokens - self.safety_margin)
    @property
    def usage_percentage(self) -> float:
        """Calculate current usage as percentage."""
        if self.max_tokens == 0:
            return 0.0
        return min(1.0, self.used_tokens / self.max_tokens)
    @property
    def should_compress(self) -> bool:
        """Check if compression should be triggered."""
        return self.usage_percentage >= self.compression_threshold
    def add_tokens(self, count: int) -> None:
        """Add tokens to the used count."""
        self.used_tokens += count
        self.used_tokens = max(0, self.used_tokens)  # Prevent negative
    def remove_tokens(self, count: int) -> None:
        """Remove tokens from the used count."""
        self.used_tokens -= count
        self.used_tokens = max(0, self.used_tokens)
    def reset(self) -> None:
        """Reset the token budget."""
        self.used_tokens = 0
 class ContextWindow(BaseModel):
    """Context window representation with compression state."""
    messages: List[Message] = Field(
        default_factory=list, description="Current context messages"
    )
    budget: ContextBudget = Field(description="Token budget for this window")
    compressed_summary: Optional[str] = Field(
        default=None, description="Summary of compressed messages"
    )
    original_token_count: int = Field(
        default=0, description="Tokens before compression"
    )
    def add_message(self, message: Message) -> None:
        """Add a message to the context window."""
        self.messages.append(message)
        self.budget.add_tokens(message.token_count)
        self.original_token_count += message.token_count
    def get_effective_context(self) -> List[Message]:
        """Get the effective context including compressed summary if needed."""
        if self.compressed_summary:
            # Create a synthetic system message with the summary
            summary_msg = Message(
                id="compressed_summary",
                role=MessageRole.SYSTEM,
                content=f"[Previous conversation summary]\n{self.compressed_summary}",
                importance_score=0.8,  # High importance for summary
                metadata=MessageMetadata(
                    message_type=MessageType.SYSTEM,
                    is_permanent=True,
                    source="compression",
                ),
            )
            return [summary_msg] + self.messages
        return self.messages
    def clear(self) -> None:
        """Clear the context window."""
        self.messages.clear()
        self.budget.reset()
        self.compressed_summary = None
        self.original_token_count = 0
 # Utility functions for message importance scoring
 def calculate_importance_score(message: Message) -> float:
    """Calculate importance score for a message based on various factors."""
    score = message.metadata.priority
    # Boost for instructions and system messages
    if message.metadata.message_type in [MessageType.INSTRUCTION, MessageType.SYSTEM]:
        score = min(1.0, score + 0.3)
    # Boost for permanent messages
    if message.metadata.is_permanent:
        score = min(1.0, score + 0.4)
    # Boost for questions (user seeking information)
    if message.metadata.message_type == MessageType.QUESTION:
        score = min(1.0, score + 0.2)
    # Adjust based on length (longer messages might be more detailed)
    if message.token_count > 100:
        score = min(1.0, score + 0.1)
    return score
 def estimate_token_count(text: str) -> int:
    """
    Estimate token count for text.
    This is a rough approximation - actual tokenization depends on the model.
    As a heuristic: ~4 characters per token for English text.
    """
    if not text:
        return 0
    # Simple heuristic: ~4 characters per token, adjusted for structure
    base_count = len(text) // 4
    # Add extra for special characters, code blocks, etc.
    special_chars = len([c for c in text if not c.isalnum() and not c.isspace()])
    special_adjustment = special_chars // 10
    # Add for newlines (often indicate more tokens)
    newline_adjustment = text.count("\n") // 2
    return max(1, base_count + special_adjustment + newline_adjustment)