External Publication

Szukam feedbacku — własna reprezentacja semantyczna "bryła" dla małych modeli

Hugging Face Forums [Unofficial] April 17, 2026

Cześć! Jestem Krzysiek — samouk, pracuję nad tym po nocnych zmianach, sam, od grudnia 2025.

Zbudowałem coś co nazywam “bryłami” — zamiast podawać modelowi surowy tekst, parser rozkłada zdanie na obiekty z 20 tokenami metadanych: kolor emocji, pilność, siła intencji, źródło informacji, ważność, kontynuacja tematu, relacje między elementami.

Wyniki (ten sam Transformer 53M, ten sam korpus 1.92MB, te same hiperparametry):

v7 (surowy tekst): val_ppl = 31.06
v8 (+ affect/is_core): val_ppl = 24.12
v9 (+ pragmatyki): val_ppl = 24.02

22% poprawy bez zmiany architektury modelu — tylko bogatsze wejście. Wszystko na RTX 2060 12GB.

Hipoteza: “bryła wozi gotowe znaczenie, żeby model mniej liczył od nowa.”

Szukam:

Feedbacku — czy to ma sens? Co poprawić?
Ludzi z podobnymi problemami na słabym sprzęcie
Pomysłów na zastosowania których nie widzę
Może współpracy

Nie jestem ekspertem. Nie udaję. Uczę się i eksperymentuję. Jeśli robisz coś podobnego — odezwij się!

Discussion in the ATmosphere