External Publication
Visit Post

Ez lesz az utolsó hogy válaszolok neked, mert ott van szépen minden levezetve amit írtam, és nem,…

SztupY [Unofficial] May 1, 2026
Source

adolftmblr:

sztupy:

adolftmblr:

sztupy:

adolftmblr:

sztupy:

dorka:

sztupy:

sztupy:

moncsak:

pappito:

sztupy:

adolftmblr:

sztupy:

lencse:

sztupy:

lencse:

sztupy:

rosszulorzott:

sztupy:

lassukmiboolelunk:

sztupy:

lassukmiboolelunk:

sztupy:

lassukmiboolelunk:

foone:

jadeharleyinc:

0x4468c7a6a728:

it’s the year of regexslop

[0-9][0-9][0-9][0-9] is the year of regexslop!

\d{4} is the year of regexslop!

Uristen erről jut eszembe hogy hónapok óta akarok itt valakitől egy dátumregex-segítséget kérni csak mindig elfelejtem meg nem merek mások terhére lenni fasságokkal aztán anyázok

[1-9]\d*( AD| BC)? is the year of regexslop!

Köszönettel, a MemoQ-ban már idegbajt kapok a folyamatos manuális dátumozástól, és ha jól értem/gondolom/remélem elvileg regexben lehet automatizálni a dátumok átalakítását

Folyószövegekben vannak ezek a rohadékok, és 2026.12.24. helyett szeretnék nagyon 24. 12. 2026.-ot. De persze asse tudom hogy az eredetit felismeri-e dátumként vagy hogy lényeges-e egyáltalán hogy felismeri-e vagy nem.

Akartam screenshotot csatolni, de viszonylag töküres a teljes autoátalakító ablakom, szóval minek, de ezt találtam a neten (eskü numerikus is létezik belőle) (ja ez is numerikus, nem tűnt fel) (nem tudom mit kérdezek :C

Bármi megfejtést nagyon köszönök!

Bal oldalra: (\d+).(\d+).(\d+).

Jobb oldalra: $3. $2. $1.

Urstn, működik*, KÖSZÖNÖM

(*egyelőre a previewban, már csak ki kell találnom hogyan írom felül a találati listában a mittoménmiket, de helyzetünk biztató!)

Amúgy persze van határidős munkám, úgyhogy jöjjön egy kis Regexp gyorstalpaló!

Regexp lényege hogy szöveges tartalomban mintát találj, aztán esetleg azt átalakítsd egy másik szöveges tartalommá. Többnyire egy nagy Regexp szabvány van, de természetesen ettől függetlenül mindig vannak kisebb-nagyobb eltérések rendszerek között. Az alábbi a vadonban leginkább megtalálható verzióról szól.

  1. Minden, ami nem különleges karakter az önmagát jelenti. Azaz például a “bojler eladó” egy olyan reguláris kifejezés ami csak és kizárólag a “bojler eladó” szöveget találja meg. A legtöbb karakter, beleértve az összes kisbetűt nagybetűt, szóközt és számot ilyen.
  2. Van pár különleges karakter ami viszont mást jelent. Általában ezek az alábbiak: [ ] ( ) { } . \ / + * ? | ^ $. Ha ezek közül valamelyiket akarjuk megkeresni a szövegben, akkor mindenképp elé kell raknunk egy \ jelet. (Sasszemű olvasók láthatják, hogy a \ is különleges, hát az például pont ezért). Azaz például a “2026.12.01” egy olyan kifejezés ami csak és kizárólag a “2026.12.01” szöveget találja meg a dokumentumban.

(Van néhány rendszer ami kicsit máshogy működik, van ahol például a + önmagában nem különleges, de a \+ már igen. Áltlalában a +, (, ), \ karakterek azok ahol néha pont hogy -t kell elé tenni, hogy különleges legyen, mert önmagában nem az. De az interneten keresett kifejezések nagy része az általában követi a szabványt.)

  1. A +, * és ? az a rögtön előtte lévő jelet különlegesíti azzal, hogy nem csak egyet keres belőle hanem a jeltől függően akár többet is. + az a legalább egy, a ? a legfeljebb egy, a * meg az akármennyit jelenti.

Például a “A+RGH” kifejezés az megtalálja az “ARGH”, “AAAAARGH”, “AAAAAAAAAARGH” akármelyikét, de az “RGH”-t már nem.

Az “A?RGH” az vagy “RGH” vagy “ARGH” más nem lehet (az A legfeljebb egyszer szerepelhet)

Az “A*RGH” pedig a kettő együtt, szóval “RGH”, “ARGH”, meg “AAAAAARGH” bármelyike

  1. Ha pontosan meg akarjuk adni hogy hányszor akarjuk a jelet látni arra való a { }. “A{1,4}RGH” az “ARGH”, “AARGH” meg “AAAARGH”, de nem “AAAAARGH”. Lehet konkrét számot megadni {4} (pontosan 4) meg nyitott intervallumot is {4,} (minimum 4) vagy {,4} (maximum 4)
  2. Ha nem csak egyetlen karaktert akarunk módosítani a fenti módosítókkal akkor csoportosítani kell zárójelekkel. A “(La)+-La” az a “La-La”, “La-La-La”, “La-La-La-La”, “La-La-La-La-La” stb bármelyike lehet.
  3. Ha nem egy konkrét karaktert keresünk, hanem egy listából akarunk választani arra való a [ ]. Összes szám? “[0-9]”; Összes kisbetű? “[a-z]”. Összes kisbetű, nagybetű meg szám? “[0-9a-zA-Z]”. Kisbetű, nagybetű, páratlan számok, kötőjel meg pont? “[a-zA-Z13579.-]”. Fontos, hogy [ ] között csak a ] számít különleges karakternek, bármi mást lehet használni, például a pontot. A - -t, is de annak vagy a legelső vagy legutolsó opciónak kell lennie.
  4. A ^ karakter az első helyen invertálja a listát. A “[^0-9]” az az akármi ami nem számjegy. Ha ^-t akarunk keresni akkor ne tegyük az első helyre, pl. “[a-z^]” az az összes kisbetű ÉS a ^ karakter
  5. A “.” az az akármiből pontosan egy darab. A “.*” az az akármiből akármennyi. A “.” az meg ugye a pont, mint karakter
  6. A ^ a sor eleje, a $ meg a sor vége. A “^[0-9]+$” megkeresi nekünk az összes olyan sort, ami kizárólag számjegyből áll
  7. Végezetül a | a vagy, amivel lehet alternatívákat megadni. Lehet tippelni, hogy a “Zámbó (Jimmy|Árp(i|ád))” mit jelenthet. Ugyanitt példa arra hogy hogyan lehet zárójeleket egymásba pakolni.
  8. Van pár karakter ami különlegesíthető a -vel. A “\d” az ugyanaz, mint a “[0-9]”, a “\w” az a “[a-zA-Z_]”, a “\s” az az akármilyen szóköz jellegű karakter. Nagybetűsítve meg pont az ellenkezője, “\W” az például a “[^a-zA-Z_]”
  9. A fentieket összeadva például egy egész számnak látszó tárgy az a “[+-]?(0|[1-9]\d*)”. Miért? Az elején van egy opcionális előjel, utána pedig vagy egy 0 jön, vagy egy 1-9 közötti számjegy amit akármennyi másik számjegy követ.

Ez a fenti csak a keresésre vonatkozik, de itt jön a trükk, hogy lehet velük helyettesíteni is. Ilyenkor jön elő a () második szerepe: ezzel lehet kijelölni a találatokban a fontos részeket.

Például, ha egy dátumot akarunk magyar formátumból brit formátumba rakni, akkor az a keresésnél “(\d{4}).(\d{2}).(\d{2}).”, az eredmény oldalon pedig “$3/$2/$1”. A számok a zárójelezett részek eredeti sorrendjére utalnak, tehát a $3 az a harmadik zárójel tartalmát jelenti. Ha zárójeleket egymásba teszünk akkor az továbbra is működik a “Zámbó (Jimmy|Árp(i|ád))” esetben, ha ráeresztjük a Zámbó Árpád-ra, akkor a $1 az “Árpád” lesz, a $2 meg “ád”. Ha Zámbó Jimmy-re eresztjük rá akkor a $1 Jimmy lesz a $2 meg semmi.

Az eredmény oldalon sajnos nem mindig van szabvány, vannak rendszerek amik $1, $2, $3-at várnak, de vannak amik meg \1, \2, \3-al dolgoznak, ott például “\3/\2/\1” lenne a megoldás. Az ökölszabály az az, hogy mindig pont a másik, mint ahogy kigondoltad és leírtad, hogy aztán vissza kelljen vonnod és újra átírni a másik formátumba.

Eredmény oldalon általában nincsenek különleges karakterek, kivéve a $ (ami a helyettesítést jelenti) meg a , ami ugye a különlegestelenítő karakter. Néhány rendszerben még a / elé is kell . tehát lehet, hogy a “$3/$2/$1” az a te rendszeredben a “\3/\2/\1”

[\p{Ll}]

@sztupy én figyellek egy ideje, túl gyakran van határidős munkád. Nem akarsz valami nyugisabbra váltani?

Szívesen, de sajnos még nem nyertem a lottón, a gyerekem meg szeret nem éhenhalni!

Fhu, visszaolvasva tök beszólogatósnak érződik, amit írtam, pedig csak poénnak szántam. Bocsánatot kérek.

Nem vettem zokon, ne aggódj :D

Na de ez az a tudás, amire az AI korában már semmi szükség nincs.

Valakit mégis érdekelt ¯\(ツ)

hát meg mondjuk olyan mondja aki ért ehhez, egy LLm generált válasz után még meg kéne kérdeznem a/egy sztupy-t, hogy hülyeséget beszélt-e az “AI”

Elég az AI-t megkérdezned, és teszteltetned vele, amit mond. Ez az egyik jó dolog benne.

AI: A! Én: Biztos nem B? AI: De, igazad van, B! Én: Akkor most A vagy B? AI: C!

És akkor ezek után döntsd el, hogy melyik.

Az még oké, hogy azt mondod, hogy írasd meg az AI-val, de aztán hogy ugyanazzal az AI-val tesztelteted, hogy igazat mondott-e az számomra akkora hülyeségnek hangzik mint ide a bélapátfalvi Szűz Mária könnyei. Ha esetleg olyat mondasz, hogy egy másik AI-val ellenőriztesd, még azt mondom abba van ráció.

De most elhasználom bélapátfalva éves vízhasználatát egy példával. Nézzük!

Laikus számára jónak hangzik, technikailag tényleg itt találhatóak a rovásírásos jelek az Unicode szabványban.

No de ha nem nézed meg nem veszed észre, hogy a U+10CFA-U+10CFF régió valójában nem betűket tartalmaz! A helyes válasz, az valójában

\b[\u{10C80}-\u{10CF2}]+\b

Nézzük sikerül-e rávezetni a ChatGPT-t erre a válaszra!

Sikerül, bár akkor jönne a kérdés, hogy

  1. Miért nem ezzel kezdte
  2. Ha nem lennék laikus expert a témában honnan a faszból szoptam volna ki, hogy ez probléma?

De most már jó, ugye?

NOPE

Akik évek óta követnek, és olvasták a rovásírásos unicode cikkemet

Consider to use non-historic ligatures in Old Hungarian font, “w” and “y” are not real ligatures · Issue #2021 · googlefonts/noto-fonts

azok tudhatják, hogy a fenti keresés nem fogja megtalálni a dz, dzs, w, y és q betűket, azok ugyanis összevont unicode karakterek.

ChatGPT nem hisz nekem, pedig hát én olvastam az Unicode szabványt, ő meg nem. De lássuk sikerül-e még jobban rávezetni

Tagad a kis geci. Lássuk ha belinkelem neki a megoldást akkor esetleg rájön

Jé baszd meg nem mondod, hogy nekem van igazan szopjál sünt. Na de most hogy már bélapátfalva kifogyott a vízből, kérdés. hogy jó-e a regexp amit kiszart magából?

Határeset, egy kettest azért megajánlok neki, hogy ne bukjon meg, de azért haladjunk tovább

De aztán elakad, hogy hát a kérdésem nem is olyan könnyű, és hát Bélapátfalva vízkeszlete már elfogyott, elhasználhatom-e Rudabánya vízkészletét is, pretty please?

HASZNÁLD EL GECI!

Ezek után elkezdte szépen leírni nekem a regexet meg mindent, de hát egyből kitűnik, hogy a q a w meg y már ránézésre is el van baszva, nem lehet mindegyik ugyanazzal a ligatúrával képezve (Q az K+SZ, W az V+V, Y meg J+I a modern használatban)

MI A BÜDÖS KURVAGECI? HOGY MÉG ÉN DOLGOZZAK?

Lófaszt papa, itt van neked két magyar zsákfalu összes vize, dolgozzál meg értük.

Na ez már jó, ugye?

NEM

Kihagyta hogy minden betűből van kisbetű meg nagybetű!

Final! Tudod, mint az MKKPs 12. kerületi Transparecny International jelentés, hogy TI_Mo_atvilagitasi_jelentes_Hegyvidek_final (5).docx

De persze ezt is elcseszte, mert nem csak a dz meg DZ-t fogadja el, hanem a dZ-t meg Dz-it ami helytelen.

De ez már jó, ugye?

LÓFASZT PAPA!

Na de ez már ugye tényleg jó?

Fasztugyja, ránézésre lehet, de most már egész Heves megye szomjan halt, úgyhogy inkább abbahagyom.

Az AI korában nem kell már gondolkodni az baszd meg tényleg, a faszom beleverem az egészbe.

Hamarabb megírtam volna kézzel és egyből helyes lenne.

Mert nem claude.

Chad is so february 2026

Csak a te kedvedért elhasználom Borsod-Abaúj-Zemplén márnemvármegye vízkészletét is, és örömmel jelentem, hogy Claude (a Sonnet 4 csak mondjuk, nem az Opus) majdnem pontosan ugyanolyan hülye, mint a ChatGPT, de a kedvenceim:

  1. Az elején helyesen megállpítja, hogy a kisbetűk, nagybetűk és számok az három külön dolog, de aztán úgy dönt a számokat is automatikusan bepakolja a szókereső rendszerbe
  2. Futtattatni akart velem egy python scriptet a saját gépemen (bátor voltam, engedtem neki és nem törölte le az összes production adatot), aminek az eredményét teljesen félreértelmezte (szerinte a Q az az N betűvel ekvivalens)
  3. Utána miután vele is közöltem, hogy nesze ott a honlap minden infóval meg visszaírt, hogy bocs weblapokat nem tudok olvasni :D De faszom python scriptet futtathatsz geci :D
  4. A folyamat az eredményre vezetésre amúgy ugyanaz volt, az egyetlen pont amiben a Claude ezerszer jobb volt, hogy egyszer sem próbált nem működő regexpet rámtukmákolni, minden amit kidobott magából az legalább tényleg regexp volt és nem kommentekkel teletákolt regexpnek látszó tárgy.

Nekem ezt mondja:

Gratulálok, neked átlépte az első akadályt, bár még mindig elégtelen. Már csak 10 másik akadály van hátra, igaz az 5. lépés után már meg lehet neki ajánlani a kettest.

(elolvastad egyáltalán amit írtam, vagy majd megkérded ChatGPT-t hogy vonatozza ki a lényeget?)

Azt nem nagyon értettem, amit írtál, de amit a Claude írt, azt igen:

Ezzel még mindig van valami hiba?

Q, W, X, Y

Plusz kisbetű / nagybetű különbségek a ligatúráknál

De mondjuk ezt mind szépen leírtam fent, csak el kellett volna olvasni

Ez lesz az utolsó hogy válaszolok neked, mert ott van szépen minden levezetve amit írtam, és nem, még ez se helyes, de már szódával elmegy egy kettes értékeléssel.

Discussion in the ATmosphere

Loading comments...