Szukam feedbacku — własna reprezentacja semantyczna "bryła" dla małych modeli
Hugging Face Forums [Unofficial]
April 17, 2026
Cześć! Jestem Krzysiek — samouk, pracuję nad tym po nocnych zmianach, sam, od grudnia 2025.
Zbudowałem coś co nazywam “bryłami” — zamiast podawać modelowi surowy tekst, parser rozkłada zdanie na obiekty z 20 tokenami metadanych: kolor emocji, pilność, siła intencji, źródło informacji, ważność, kontynuacja tematu, relacje między elementami.
Wyniki (ten sam Transformer 53M, ten sam korpus 1.92MB, te same hiperparametry):
- v7 (surowy tekst): val_ppl = 31.06
- v8 (+ affect/is_core): val_ppl = 24.12
- v9 (+ pragmatyki): val_ppl = 24.02
22% poprawy bez zmiany architektury modelu — tylko bogatsze wejście. Wszystko na RTX 2060 12GB.
Hipoteza: “bryła wozi gotowe znaczenie, żeby model mniej liczył od nowa.”
Szukam:
- Feedbacku — czy to ma sens? Co poprawić?
- Ludzi z podobnymi problemami na słabym sprzęcie
- Pomysłów na zastosowania których nie widzę
- Może współpracy
Nie jestem ekspertem. Nie udaję. Uczę się i eksperymentuję. Jeśli robisz coś podobnego — odezwij się!
Discussion in the ATmosphere