Fixed dynamic expand

2025-04-26 22:42:49 -04:00 · 2025-04-26 22:42:49 -04:00 · a9b4871420
commit a9b4871420
parent 5f74b2c64c
4 changed files with 12 additions and 8 deletions
--- a/model/brain.py
+++ b/model/brain.py
@ -3,6 +3,8 @@ import torch
 import torch.nn.functional as F
 from model.memory import save_dream
 from model.brain_state import model, tokenizer, DEVICE
+from model.journal import record_to_journal
+from model.trainer import train_on_message
 from context.context import get_recent_context

 recent_dreams = []
@ -59,9 +61,7 @@ def daydream():

    if score > 0.45:
        save_dream(sentence, score)
-        from model.journal import record_to_journal
        record_to_journal(sentence)
-        from model.trainer import train_on_message
        train_on_message(sentence)

    if len(recent_dreams) > 10:
--- a/model/dynamic_expand.py
+++ b/model/dynamic_expand.py
@ -4,20 +4,24 @@ from model.brain_state import model, tokenizer, DEVICE

 optimizer = torch.optim.Adam(model.parameters(), lr=1e-4)

+_last_expansion_vocab_size = 0
+

 def get_optimizer():
    return optimizer


 def expand_model_if_needed():
-    global model, optimizer
+    global model, optimizer, _last_expansion_vocab_size

    current_vocab_size = len(tokenizer.vocab) + 10
-    old_vocab_size = model.head.out_features

+    if current_vocab_size - _last_expansion_vocab_size < 5:
+        return  # Only expand every 5 words
+
+    old_vocab_size = model.head.out_features
    if current_vocab_size <= old_vocab_size:
        return  # No expansion needed
-
    print(f"Expanding model from {old_vocab_size} -> {current_vocab_size}")

    old_state = model.state_dict()
--- a/model/trainer.py
+++ b/model/trainer.py
@ -12,7 +12,7 @@ def log_loss(value: float):
        f.write(f"{time.time()},{round(value, 4)}\n")


-def train_on_message(text: str):
+def train_on_message(text: str, source: str = "user"):
    expand_model_if_needed()

    model.train()
@ -45,4 +45,4 @@ def train_on_message(text: str):
    opt.step()

    log_loss(loss.item())
-    add_to_context(text)
+    add_to_context(text, source=source)
--- a/reader/reader.py
+++ b/reader/reader.py
@ -46,6 +46,6 @@ async def read_books_forever():
                save_progress(progress)

                if is_valid_line(line):
-                    train_on_message(line)
+                    train_on_message(line, source="book")
                set_next_action(READ_DELAY, "Reading")
                await asyncio.sleep(READ_DELAY)