Rosie/requirements-training.txt

# Additional requirements for model training
# Install with: pip install -r requirements-training.txt

# Deep Learning
torch>=2.0.0
torchvision>=0.15.0
torchaudio>=2.0.0

# Training utilities
wandb>=0.15.0  # Experiment tracking
tensorboard>=2.13.0  # Tensorboard logging
tqdm>=4.65.0  # Progress bars

# Data processing
datasets>=2.13.0  # HuggingFace datasets
transformers>=4.30.0  # For comparison/reference only
sentencepiece>=0.1.99  # Alternative tokenizer
tokenizers>=0.13.3  # Fast tokenizers

# Optimization
apex  # NVIDIA apex for mixed precision (optional, requires CUDA)
accelerate>=0.20.0  # Multi-GPU training

# Data collection
requests>=2.31.0
beautifulsoup4>=4.12.0
lxml>=4.9.0