{
"$type": "site.standard.document",
"bskyPostRef": {
"cid": "bafyreicdkkcvushwpa2endigyj5xajgfyn2uplxczbg5xm3urfou7ippla",
"uri": "at://did:plc:npppinc2x6on5fmrcemn2p5o/app.bsky.feed.post/3mktavbql32d2"
},
"coverImage": {
"$type": "blob",
"ref": {
"$link": "bafkreiafrxmwke33k2bz7gcg3xi5bhjc7dbfiuxng4wpsuj2kfe65hz2uy"
},
"mimeType": "image/png",
"size": 12891
},
"path": "/post/815442869350498304",
"publishedAt": "2026-05-01T20:22:00.000Z",
"site": "https://tumblr.sztupy.hu",
"tags": [
"adolftmblr",
"sztupy",
"dorka",
"moncsak",
"pappito",
"lencse",
"rosszulorzott",
"lassukmiboolelunk",
"foone",
"jadeharleyinc",
"0x4468c7a6a728",
"@sztupy",
"Consider to use non-historic ligatures in Old Hungarian font, “w” and “y” are not real ligatures · Issue #2021 · googlefonts/noto-fonts",
"TI_Mo_atvilagitasi_jelentes_Hegyvidek_final (5).docx"
],
"textContent": "adolftmblr:\n\n> sztupy:\n>\n>> dorka:\n>>\n>>> sztupy:\n>>>\n>>>> sztupy:\n>>>>\n>>>>> moncsak:\n>>>>>\n>>>>>> pappito:\n>>>>>>\n>>>>>>> sztupy:\n>>>>>>>\n>>>>>>>> adolftmblr:\n>>>>>>>>\n>>>>>>>>> sztupy:\n>>>>>>>>>\n>>>>>>>>>> lencse:\n>>>>>>>>>>\n>>>>>>>>>>> sztupy:\n>>>>>>>>>>>\n>>>>>>>>>>>> lencse:\n>>>>>>>>>>>>\n>>>>>>>>>>>>> sztupy:\n>>>>>>>>>>>>>\n>>>>>>>>>>>>>> rosszulorzott:\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>> sztupy:\n>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> lassukmiboolelunk:\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>> sztupy:\n>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>> lassukmiboolelunk:\n>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>> sztupy:\n>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>> lassukmiboolelunk:\n>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>> foone:\n>>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>>> jadeharleyinc:\n>>>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>>>> 0x4468c7a6a728:\n>>>>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>>>>> it’s the year of regexslop\n>>>>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>>>> [0-9][0-9][0-9][0-9] is the year of regexslop!\n>>>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>>> \\d{4} is the year of regexslop!\n>>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>> Uristen erről jut eszembe hogy hónapok óta akarok itt valakitől egy dátumregex-segítséget kérni csak mindig elfelejtem ~~meg nem merek mások terhére lenni fasságokkal~~ aztán anyázok\n>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>> [1-9]\\d*( AD| BC)? is the year of regexslop!\n>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>> Köszönettel, a MemoQ-ban már idegbajt kapok a folyamatos manuális dátumozástól, és ha jól értem/gondolom/remélem elvileg regexben lehet automatizálni a dátumok átalakítását\n>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>> Folyószövegekben vannak ezek a rohadékok, és 2026.12.24. helyett szeretnék nagyon 24. 12. 2026.-ot. De persze asse tudom hogy az eredetit felismeri-e dátumként vagy hogy lényeges-e egyáltalán hogy felismeri-e vagy nem.\n>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>> Akartam screenshotot csatolni, de viszonylag töküres a teljes autoátalakító ablakom, szóval minek, de ezt találtam a neten (eskü numerikus is létezik belőle) (ja ez is numerikus, nem tűnt fel) (nem tudom mit kérdezek :C\n>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>> Bármi megfejtést nagyon köszönök!\n>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>> Bal oldalra: (\\d+).(\\d+).(\\d+).\n>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>> Jobb oldalra: $3. $2. $1.\n>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>> Urstn, működik*, KÖSZÖNÖM\n>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>> (*egyelőre a previewban, már csak ki kell találnom hogyan írom felül a találati listában a mittoménmiket, de helyzetünk biztató!)\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> Amúgy persze van határidős munkám, úgyhogy jöjjön egy kis Regexp gyorstalpaló!\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> Regexp lényege hogy szöveges tartalomban mintát találj, aztán esetleg azt átalakítsd egy másik szöveges tartalommá. Többnyire egy nagy Regexp szabvány van, de természetesen ettől függetlenül mindig vannak kisebb-nagyobb eltérések rendszerek között. Az alábbi a vadonban leginkább megtalálható verzióról szól.\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> 1. Minden, ami nem különleges karakter az önmagát jelenti. Azaz például a “bojler eladó” egy olyan reguláris kifejezés ami csak és kizárólag a “bojler eladó” szöveget találja meg. A legtöbb karakter, beleértve az összes kisbetűt nagybetűt, szóközt és számot ilyen.\n>>>>>>>>>>>>>>>> 2. Van pár különleges karakter ami viszont mást jelent. Általában ezek az alábbiak: [ ] ( ) { } . \\ / + * ? | ^ $. Ha ezek közül valamelyiket akarjuk megkeresni a szövegben, akkor mindenképp elé kell raknunk egy \\ jelet. (Sasszemű olvasók láthatják, hogy a \\ is különleges, hát az például pont ezért). Azaz például a “2026.12.01” egy olyan kifejezés ami csak és kizárólag a “2026.12.01” szöveget találja meg a dokumentumban.\n>\n> (Van néhány rendszer ami kicsit máshogy működik, van ahol például a + önmagában nem különleges, de a \\\\+ már igen. Áltlalában a +, (, ), \\ karakterek azok ahol néha pont hogy -t kell elé tenni, hogy különleges legyen, mert önmagában nem az. De az interneten keresett kifejezések nagy része az általában követi a szabványt.)\n>>>>>>>>>>>>>>>> 3. A +, * és ? az a rögtön előtte lévő jelet különlegesíti azzal, hogy nem csak egyet keres belőle hanem a jeltől függően akár többet is. + az a legalább egy, a ? a legfeljebb egy, a * meg az akármennyit jelenti.\n>\n> Például a “A+RGH” kifejezés az megtalálja az “ARGH”, “AAAAARGH”, “AAAAAAAAAARGH” akármelyikét, de az “RGH”-t már nem.\n>\n> Az “A?RGH” az vagy “RGH” vagy “ARGH” más nem lehet (az A legfeljebb egyszer szerepelhet)\n>\n> Az “A*RGH” pedig a kettő együtt, szóval “RGH”, “ARGH”, meg “AAAAAARGH” bármelyike\n>>>>>>>>>>>>>>>> 4. Ha pontosan meg akarjuk adni hogy hányszor akarjuk a jelet látni arra való a { }. “A{1,4}RGH” az “ARGH”, “AARGH” meg “AAAARGH”, de nem “AAAAARGH”. Lehet konkrét számot megadni {4} (pontosan 4) meg nyitott intervallumot is {4,} (minimum 4) vagy {,4} (maximum 4)\n>>>>>>>>>>>>>>>> 5. Ha nem csak egyetlen karaktert akarunk módosítani a fenti módosítókkal akkor csoportosítani kell zárójelekkel. A “(La)+-La” az a “La-La”, “La-La-La”, “La-La-La-La”, “La-La-La-La-La” stb bármelyike lehet.\n>>>>>>>>>>>>>>>> 6. Ha nem egy konkrét karaktert keresünk, hanem egy listából akarunk választani arra való a [ ]. Összes szám? “[0-9]”; Összes kisbetű? “[a-z]”. Összes kisbetű, nagybetű meg szám? “[0-9a-zA-Z]”. Kisbetű, nagybetű, páratlan számok, kötőjel meg pont? “[a-zA-Z13579.-]”. Fontos, hogy [ ] között csak a ] számít különleges karakternek, bármi mást lehet használni, például a pontot. A - -t, is de annak vagy a legelső vagy legutolsó opciónak kell lennie.\n>>>>>>>>>>>>>>>> 7. A ^ karakter az első helyen invertálja a listát. A “[^0-9]” az az akármi ami nem számjegy. Ha ^-t akarunk keresni akkor ne tegyük az első helyre, pl. “[a-z^]” az az összes kisbetű ÉS a ^ karakter\n>>>>>>>>>>>>>>>> 8. A “.” az az akármiből pontosan egy darab. A “.*” az az akármiből akármennyi. A “.” az meg ugye a pont, mint karakter\n>>>>>>>>>>>>>>>> 9. A ^ a sor eleje, a $ meg a sor vége. A “^[0-9]+$” megkeresi nekünk az összes olyan sort, ami kizárólag számjegyből áll\n>>>>>>>>>>>>>>>> 10. Végezetül a | a vagy, amivel lehet alternatívákat megadni. Lehet tippelni, hogy a “Zámbó (Jimmy|Árp(i|ád))” mit jelenthet. Ugyanitt példa arra hogy hogyan lehet zárójeleket egymásba pakolni.\n>>>>>>>>>>>>>>>> 11. Van pár karakter ami különlegesíthető a -vel. A “\\d” az ugyanaz, mint a “[0-9]”, a “\\w” az a “[a-zA-Z_]”, a “\\s” az az akármilyen szóköz jellegű karakter. Nagybetűsítve meg pont az ellenkezője, “\\W” az például a “[^a-zA-Z_]”\n>>>>>>>>>>>>>>>> 12. A fentieket összeadva például egy egész számnak látszó tárgy az a “[+-]?(0|[1-9]\\d*)”. Miért? Az elején van egy opcionális előjel, utána pedig vagy egy 0 jön, vagy egy 1-9 közötti számjegy amit akármennyi másik számjegy követ.\n>>>>>>>>>>>>>>>>\n\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> Ez a fenti csak a keresésre vonatkozik, de itt jön a trükk, hogy lehet velük helyettesíteni is. Ilyenkor jön elő a () második szerepe: ezzel lehet kijelölni a találatokban a fontos részeket.\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> Például, ha egy dátumot akarunk magyar formátumból brit formátumba rakni, akkor az a keresésnél “(\\d{4}).(\\d{2}).(\\d{2}).”, az eredmény oldalon pedig “$3/$2/$1”. A számok a zárójelezett részek eredeti sorrendjére utalnak, tehát a $3 az a harmadik zárójel tartalmát jelenti. Ha zárójeleket egymásba teszünk akkor az továbbra is működik a “Zámbó (Jimmy|Árp(i|ád))” esetben, ha ráeresztjük a Zámbó Árpád-ra, akkor a $1 az “Árpád” lesz, a $2 meg “ád”. Ha Zámbó Jimmy-re eresztjük rá akkor a $1 Jimmy lesz a $2 meg semmi.\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> Az eredmény oldalon sajnos nem mindig van szabvány, vannak rendszerek amik $1, $2, $3-at várnak, de vannak amik meg \\1, \\2, \\3-al dolgoznak, ott például “\\3/\\2/\\1” lenne a megoldás. Az ökölszabály az az, hogy mindig pont a másik, mint ahogy kigondoltad és leírtad, hogy aztán vissza kelljen vonnod és újra átírni a másik formátumba.\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> Eredmény oldalon általában nincsenek különleges karakterek, kivéve a $ (ami a helyettesítést jelenti) meg a \\, ami ugye a különlegestelenítő karakter. Néhány rendszerben még a / elé is kell . tehát lehet, hogy a “$3/$2/$1” az a te rendszeredben a “\\3\\/\\2\\/\\1”\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>> [\\p{Ll}]\n>>>>>>>>>>>>>\n>>>>>>>>>>>>> @sztupy én figyellek egy ideje, túl gyakran van határidős munkád. Nem akarsz valami nyugisabbra váltani?\n>>>>>>>>>>>>\n>>>>>>>>>>>> Szívesen, de sajnos még nem nyertem a lottón, a gyerekem meg szeret nem éhenhalni!\n>>>>>>>>>>>\n>>>>>>>>>>> Fhu, visszaolvasva tök beszólogatósnak érződik, amit írtam, pedig csak poénnak szántam. Bocsánatot kérek.\n>>>>>>>>>>\n>>>>>>>>>> Nem vettem zokon, ne aggódj :D\n>>>>>>>>>\n>>>>>>>>> Na de ez az a tudás, amire az AI korában már semmi szükség nincs.\n>>>>>>>>\n>>>>>>>> Valakit mégis érdekelt ¯\\\\_(ツ)_/¯\n>>>>>>>\n>>>>>>> hát meg mondjuk olyan mondja aki ért ehhez, egy LLm generált válasz után még meg kéne kérdeznem a/egy sztupy-t, hogy hülyeséget beszélt-e az “AI”\n>>>>>>\n>>>>>> Elég az AI-t megkérdezned, és teszteltetned vele, amit mond. Ez az egyik jó dolog benne.\n>>>>>\n>>>>>> AI: A!\n> Én: Biztos nem B?\n> AI: De, igazad van, B!\n> Én: Akkor most A vagy B?\n> AI: C!\n>>>>>\n>>>>> És akkor ezek után döntsd el, hogy melyik.\n>>>>>\n>>>>> Az még oké, hogy azt mondod, hogy írasd meg az AI-val, de aztán hogy ugyanazzal az AI-val tesztelteted, hogy igazat mondott-e az számomra akkora hülyeségnek hangzik mint ide a bélapátfalvi Szűz Mária könnyei. Ha esetleg olyat mondasz, hogy egy másik AI-val ellenőriztesd, még azt mondom abba van ráció.\n>>>>\n>>>> De most elhasználom bélapátfalva éves vízhasználatát egy példával. Nézzük!\n>>>>\n>>>> Laikus számára jónak hangzik, technikailag tényleg itt találhatóak a rovásírásos jelek az Unicode szabványban.\n>>>>\n>>>> No de ha nem nézed meg nem veszed észre, hogy a U+10CFA-U+10CFF régió valójában nem betűket tartalmaz! A helyes válasz, az valójában\n>>>>\n>>>>> **\\b[\\u{10C80}-\\u{10CF2}]+\\b**\n>>>>\n>>>> Nézzük sikerül-e rávezetni a ChatGPT-t erre a válaszra!\n>>>>\n>>>> Sikerül, bár akkor jönne a kérdés, hogy\n>>>>\n>>>> 1. Miért nem ezzel kezdte\n>>>> 2. Ha nem lennék laikus expert a témában honnan a faszból szoptam volna ki, hogy ez probléma?\n>>>>\n\n>>>>\n>>>> De most már jó, ugye?\n>>>>\n>>>> # NOPE\n>>>>\n>>>> Akik évek óta követnek, és olvasták a rovásírásos unicode cikkemet\n>>>>\n>>>> Consider to use non-historic ligatures in Old Hungarian font, “w” and “y” are not real ligatures · Issue #2021 · googlefonts/noto-fonts\n>>>>\n>>>> azok tudhatják, hogy a fenti keresés nem fogja megtalálni a dz, dzs, w, y és q betűket, azok ugyanis összevont unicode karakterek.\n>>>>\n>>>> ChatGPT nem hisz nekem, pedig hát én olvastam az Unicode szabványt, ő meg nem. De lássuk sikerül-e még jobban rávezetni\n>>>>\n>>>> Tagad a kis geci. Lássuk ha belinkelem neki a megoldást akkor esetleg rájön\n>>>>\n>>>> Jé baszd meg nem mondod, hogy nekem van igazan szopjál sünt. Na de most hogy már bélapátfalva kifogyott a vízből, kérdés. hogy jó-e a regexp amit kiszart magából?\n>>>>\n>>>> Határeset, egy kettest azért megajánlok neki, hogy ne bukjon meg, de azért haladjunk tovább\n>>>>\n>>>> De aztán elakad, hogy hát a kérdésem nem is olyan könnyű, és hát Bélapátfalva vízkeszlete már elfogyott, elhasználhatom-e Rudabánya vízkészletét is, pretty please?\n>>>>\n>>>> # HASZNÁLD EL GECI!\n>>>>\n>>>> Ezek után elkezdte szépen leírni nekem a regexet meg mindent, de hát egyből kitűnik, hogy a q a w meg y már ránézésre is el van baszva, nem lehet mindegyik ugyanazzal a ligatúrával képezve (Q az K+SZ, W az V+V, Y meg J+I a modern használatban)\n>>>>\n>>>> # MI A BÜDÖS KURVAGECI? HOGY MÉG ÉN DOLGOZZAK?\n>>>>\n>>>> Lófaszt papa, itt van neked két magyar zsákfalu összes vize, dolgozzál meg értük.\n>>>>\n>>>> Na ez már jó, ugye?\n>>>>\n>>>> # NEM\n>>>>\n>>>> Kihagyta hogy minden betűből van kisbetű meg nagybetű!\n>>>>\n>>>>\n>\n>>>>\n>>>> Final! Tudod, mint az MKKPs 12. kerületi Transparecny International jelentés, hogy TI_Mo_atvilagitasi_jelentes_Hegyvidek_final (5).docx\n>>>>\n>>>> De persze ezt is elcseszte, mert nem csak a dz meg DZ-t fogadja el, hanem a dZ-t meg Dz-it ami helytelen.\n>>>>\n>>>> De ez már jó, ugye?\n>>>>\n>>>> # LÓFASZT PAPA!\n>>>>\n>>>> Na de ez már ugye tényleg jó?\n>>>>\n>>>> Fasztugyja, ránézésre lehet, de most már egész Heves megye szomjan halt, úgyhogy inkább abbahagyom.\n>>>>\n>>>> Az AI korában nem kell már gondolkodni az baszd meg tényleg, a faszom beleverem az egészbe.\n>>>>\n>>>> Hamarabb megírtam volna kézzel és egyből helyes lenne.\n>>>\n>>> Mert nem claude.\n>>>\n>>> Chad is so february 2026\n>>\n>> Csak a te kedvedért elhasználom Borsod-Abaúj-Zemplén márnemvármegye vízkészletét is, és örömmel jelentem, hogy Claude (a Sonnet 4 csak mondjuk, nem az Opus) majdnem pontosan ugyanolyan hülye, mint a ChatGPT, de a kedvenceim:\n>>\n>> 1. Az elején helyesen megállpítja, hogy a kisbetűk, nagybetűk és számok az három külön dolog, de aztán úgy dönt a számokat is automatikusan bepakolja a szókereső rendszerbe\n>> 2. Futtattatni akart velem egy python scriptet a saját gépemen (bátor voltam, engedtem neki és nem törölte le az összes production adatot), aminek az eredményét teljesen félreértelmezte (szerinte a Q az az N betűvel ekvivalens)\n>> 3. Utána miután vele is közöltem, hogy nesze ott a honlap minden infóval meg visszaírt, hogy bocs weblapokat nem tudok olvasni :D De faszom python scriptet futtathatsz geci :D\n>> 4. A folyamat az eredményre vezetésre amúgy ugyanaz volt, az egyetlen pont amiben a Claude ezerszer jobb volt, hogy egyszer sem próbált nem működő regexpet rámtukmákolni, minden amit kidobott magából az legalább tényleg regexp volt és nem kommentekkel teletákolt regexpnek látszó tárgy.\n>>\n\n>\n> Nekem ezt mondja:\n\nGratulálok, neked átlépte az első akadályt, bár még mindig elégtelen. Már csak 10 másik akadály van hátra, igaz az 5. lépés után már meg lehet neki ajánlani a kettest.\n\n(elolvastad egyáltalán amit írtam, vagy majd megkérded ChatGPT-t hogy vonatozza ki a lényeget?)",
"title": "Gratulálok, neked átlépte az első akadályt, bár még mindig elégtelen. Már csak 10 másik akadály van…"
}