{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreigqufq4wqhu3b6znefssbksrift26isscd4ktuhhm5vsuenmgjiai",
    "uri": "at://did:plc:npppinc2x6on5fmrcemn2p5o/app.bsky.feed.post/3mkstfzul4og2"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreiafrxmwke33k2bz7gcg3xi5bhjc7dbfiuxng4wpsuj2kfe65hz2uy"
    },
    "mimeType": "image/png",
    "size": 12891
  },
  "path": "/post/815438347229118464",
  "publishedAt": "2026-05-01T19:10:08.000Z",
  "site": "https://tumblr.sztupy.hu",
  "tags": [
    "dorka",
    "sztupy",
    "moncsak",
    "pappito",
    "adolftmblr",
    "lencse",
    "rosszulorzott",
    "lassukmiboolelunk",
    "foone",
    "jadeharleyinc",
    "0x4468c7a6a728",
    "@sztupy",
    "Consider to use non-historic ligatures in Old Hungarian font, “w” and “y” are not real ligatures · Issue #2021 · googlefonts/noto-fonts",
    "TI_Mo_atvilagitasi_jelentes_Hegyvidek_final (5).docx"
  ],
  "textContent": "dorka:\n\n> sztupy:\n>\n>> sztupy:\n>>\n>>> moncsak:\n>>>\n>>>> pappito:\n>>>>\n>>>>> sztupy:\n>>>>>\n>>>>>> adolftmblr:\n>>>>>>\n>>>>>>> sztupy:\n>>>>>>>\n>>>>>>>> lencse:\n>>>>>>>>\n>>>>>>>>> sztupy:\n>>>>>>>>>\n>>>>>>>>>> lencse:\n>>>>>>>>>>\n>>>>>>>>>>> sztupy:\n>>>>>>>>>>>\n>>>>>>>>>>>> rosszulorzott:\n>>>>>>>>>>>>\n>>>>>>>>>>>>> sztupy:\n>>>>>>>>>>>>>\n>>>>>>>>>>>>>> lassukmiboolelunk:\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>> sztupy:\n>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> lassukmiboolelunk:\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>> sztupy:\n>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>> lassukmiboolelunk:\n>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>> foone:\n>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>> jadeharleyinc:\n>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>> 0x4468c7a6a728:\n>>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>>> it’s the year of regexslop\n>>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>>> [0-9][0-9][0-9][0-9] is the year of regexslop!\n>>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>>> \\d{4} is the year of regexslop!\n>>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>>> Uristen erről jut eszembe hogy hónapok óta akarok itt valakitől egy dátumregex-segítséget kérni csak mindig elfelejtem ~~meg nem merek mások terhére lenni fasságokkal~~ aztán anyázok\n>>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>>> [1-9]\\d*( AD| BC)? is the year of regexslop!\n>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>> Köszönettel, a MemoQ-ban már idegbajt kapok a folyamatos manuális dátumozástól, és ha jól értem/gondolom/remélem elvileg regexben lehet automatizálni a dátumok átalakítását\n>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>> Folyószövegekben vannak ezek a rohadékok, és 2026.12.24. helyett szeretnék nagyon 24. 12. 2026.-ot. De persze asse tudom hogy az eredetit felismeri-e dátumként vagy hogy lényeges-e egyáltalán hogy felismeri-e vagy nem.\n>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>> Akartam screenshotot csatolni, de viszonylag töküres a teljes autoátalakító ablakom, szóval minek, de ezt találtam a neten (eskü numerikus is létezik belőle) (ja ez is numerikus, nem tűnt fel) (nem tudom mit kérdezek :C\n>>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>>> Bármi megfejtést nagyon köszönök!\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> Bal oldalra: (\\d+).(\\d+).(\\d+).\n>>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>>> Jobb oldalra: $3. $2. $1.\n>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>> Urstn, működik*, KÖSZÖNÖM\n>>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>> (*egyelőre a previewban, már csak ki kell találnom hogyan írom felül a találati listában a mittoménmiket, de helyzetünk biztató!)\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>> Amúgy persze van határidős munkám, úgyhogy jöjjön egy kis Regexp gyorstalpaló!\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>> Regexp lényege hogy szöveges tartalomban mintát találj, aztán esetleg azt átalakítsd egy másik szöveges tartalommá. Többnyire egy nagy Regexp szabvány van, de természetesen ettől függetlenül mindig vannak kisebb-nagyobb eltérések rendszerek között. Az alábbi a vadonban leginkább megtalálható verzióról szól.\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>>   1. Minden, ami nem különleges karakter az önmagát jelenti. Azaz például a “bojler eladó” egy olyan reguláris kifejezés ami csak és kizárólag a “bojler eladó” szöveget találja meg. A legtöbb karakter, beleértve az összes kisbetűt nagybetűt, szóközt és számot ilyen.\n>>>>>>>>>>>>>>   2. Van pár különleges karakter ami viszont mást jelent. Általában ezek az alábbiak: [ ] ( ) { } . \\ / + * ? | ^ $. Ha ezek közül valamelyiket akarjuk megkeresni a szövegben, akkor mindenképp elé kell raknunk egy \\ jelet. (Sasszemű olvasók láthatják, hogy a \\ is különleges, hát az például pont ezért). Azaz például a “2026.12.01” egy olyan kifejezés ami csak és kizárólag a “2026.12.01” szöveget találja meg a dokumentumban.\n>\n> (Van néhány rendszer ami kicsit máshogy működik, van ahol például a + önmagában nem különleges, de a \\\\+ már igen. Áltlalában a +, (, ), \\ karakterek azok ahol néha pont hogy -t kell elé tenni, hogy különleges legyen, mert önmagában nem az. De az interneten keresett kifejezések nagy része az általában követi a szabványt.)\n>>>>>>>>>>>>>>   3. A +, * és ? az a rögtön előtte lévő jelet különlegesíti azzal, hogy nem csak egyet keres belőle hanem a jeltől függően akár többet is. + az a legalább egy, a ? a legfeljebb egy, a * meg az akármennyit jelenti.\n>\n> Például a “A+RGH” kifejezés az megtalálja az “ARGH”, “AAAAARGH”, “AAAAAAAAAARGH” akármelyikét, de az “RGH”-t már nem.\n>\n> Az “A?RGH” az vagy “RGH” vagy “ARGH” más nem lehet (az A legfeljebb egyszer szerepelhet)\n>\n> Az “A*RGH” pedig a kettő együtt, szóval “RGH”, “ARGH”, meg “AAAAAARGH” bármelyike\n>>>>>>>>>>>>>>   4. Ha pontosan meg akarjuk adni hogy hányszor akarjuk a jelet látni arra való a { }. “A{1,4}RGH” az “ARGH”, “AARGH” meg “AAAARGH”, de nem “AAAAARGH”. Lehet konkrét számot megadni {4} (pontosan 4) meg nyitott intervallumot is {4,} (minimum 4) vagy {,4} (maximum 4)\n>>>>>>>>>>>>>>   5. Ha nem csak egyetlen karaktert akarunk módosítani a fenti módosítókkal akkor csoportosítani kell zárójelekkel. A “(La)+-La” az a “La-La”, “La-La-La”, “La-La-La-La”, “La-La-La-La-La” stb bármelyike lehet.\n>>>>>>>>>>>>>>   6. Ha nem egy konkrét karaktert keresünk, hanem egy listából akarunk választani arra való a [ ]. Összes szám? “[0-9]”; Összes kisbetű? “[a-z]”. Összes kisbetű, nagybetű meg szám? “[0-9a-zA-Z]”. Kisbetű, nagybetű, páratlan számok, kötőjel meg pont? “[a-zA-Z13579.-]”. Fontos, hogy [ ] között csak a ] számít különleges karakternek, bármi mást lehet használni, például a pontot. A - -t, is de annak vagy a legelső vagy legutolsó opciónak kell lennie.\n>>>>>>>>>>>>>>   7. A ^ karakter az első helyen invertálja a listát. A “[^0-9]” az az akármi ami nem számjegy. Ha ^-t akarunk keresni akkor ne tegyük az első helyre, pl. “[a-z^]” az az összes kisbetű ÉS a ^ karakter\n>>>>>>>>>>>>>>   8. A “.” az az akármiből pontosan egy darab. A “.*” az az akármiből akármennyi. A “.” az meg ugye a pont, mint karakter\n>>>>>>>>>>>>>>   9. A ^ a sor eleje, a $ meg a sor vége. A “^[0-9]+$” megkeresi nekünk az összes olyan sort, ami kizárólag számjegyből áll\n>>>>>>>>>>>>>>   10. Végezetül a | a vagy, amivel lehet alternatívákat megadni. Lehet tippelni, hogy a “Zámbó (Jimmy|Árp(i|ád))” mit jelenthet. Ugyanitt példa arra hogy hogyan lehet zárójeleket egymásba pakolni.\n>>>>>>>>>>>>>>   11. Van pár karakter ami különlegesíthető a -vel. A “\\d” az ugyanaz, mint a “[0-9]”, a “\\w” az a “[a-zA-Z_]”, a “\\s” az az akármilyen szóköz jellegű karakter. Nagybetűsítve meg pont az ellenkezője, “\\W” az például a “[^a-zA-Z_]”\n>>>>>>>>>>>>>>   12. A fentieket összeadva például egy egész számnak látszó tárgy az a “[+-]?(0|[1-9]\\d*)”. Miért? Az elején van egy opcionális előjel, utána pedig vagy egy 0 jön, vagy egy 1-9 közötti számjegy amit akármennyi másik számjegy követ.\n>>>>>>>>>>>>>>\n\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>> Ez a fenti csak a keresésre vonatkozik, de itt jön a trükk, hogy lehet velük helyettesíteni is. Ilyenkor jön elő a () második szerepe: ezzel lehet kijelölni a találatokban a fontos részeket.\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>> Például, ha egy dátumot akarunk magyar formátumból brit formátumba rakni, akkor az a keresésnél “(\\d{4}).(\\d{2}).(\\d{2}).”, az eredmény oldalon pedig “$3/$2/$1”. A számok a zárójelezett részek eredeti sorrendjére utalnak, tehát a $3 az a harmadik zárójel tartalmát jelenti. Ha zárójeleket egymásba teszünk akkor az továbbra is működik a “Zámbó (Jimmy|Árp(i|ád))” esetben, ha ráeresztjük a Zámbó Árpád-ra, akkor a $1 az “Árpád” lesz, a $2 meg “ád”. Ha Zámbó Jimmy-re eresztjük rá akkor a $1 Jimmy lesz a $2 meg semmi.\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>> Az eredmény oldalon sajnos nem mindig van szabvány, vannak rendszerek amik $1, $2, $3-at várnak, de vannak amik meg \\1, \\2, \\3-al dolgoznak, ott például “\\3/\\2/\\1” lenne a megoldás. Az ökölszabály az az, hogy mindig pont a másik, mint ahogy kigondoltad és leírtad, hogy aztán vissza kelljen vonnod és újra átírni a másik formátumba.\n>>>>>>>>>>>>>>\n>>>>>>>>>>>>>> Eredmény oldalon általában nincsenek különleges karakterek, kivéve a $ (ami a helyettesítést jelenti) meg a \\, ami ugye a különlegestelenítő karakter. Néhány rendszerben még a / elé is kell . tehát lehet, hogy a “$3/$2/$1” az a te rendszeredben a “\\3\\/\\2\\/\\1”\n>>>>>>>>>>>>\n>>>>>>>>>>>> [\\p{Ll}]\n>>>>>>>>>>>\n>>>>>>>>>>> @sztupy én figyellek egy ideje, túl gyakran van határidős munkád. Nem akarsz valami nyugisabbra váltani?\n>>>>>>>>>>\n>>>>>>>>>> Szívesen, de sajnos még nem nyertem a lottón, a gyerekem meg szeret nem éhenhalni!\n>>>>>>>>>\n>>>>>>>>> Fhu, visszaolvasva tök beszólogatósnak érződik, amit írtam, pedig csak poénnak szántam. Bocsánatot kérek.\n>>>>>>>>\n>>>>>>>> Nem vettem zokon, ne aggódj :D\n>>>>>>>\n>>>>>>> Na de ez az a tudás, amire az AI korában már semmi szükség nincs.\n>>>>>>\n>>>>>> Valakit mégis érdekelt ¯\\\\_(ツ)_/¯\n>>>>>\n>>>>> hát meg mondjuk olyan mondja aki ért ehhez, egy LLm generált válasz után még meg kéne kérdeznem a/egy sztupy-t, hogy hülyeséget beszélt-e az “AI”\n>>>>\n>>>> Elég az AI-t megkérdezned, és teszteltetned vele, amit mond. Ez az egyik jó dolog benne.\n>>>\n>>>> AI: A!\n> Én: Biztos nem B?\n> AI: De, igazad van, B!\n> Én: Akkor most A vagy B?\n> AI: C!\n>>>\n>>> És akkor ezek után döntsd el, hogy melyik.\n>>>\n>>> Az még oké, hogy azt mondod, hogy írasd meg az AI-val, de aztán hogy ugyanazzal az AI-val tesztelteted, hogy igazat mondott-e az számomra akkora hülyeségnek hangzik mint ide a bélapátfalvi Szűz Mária könnyei. Ha esetleg olyat mondasz, hogy egy másik AI-val ellenőriztesd, még azt mondom abba van ráció.\n>>\n>> De most elhasználom bélapátfalva éves vízhasználatát egy példával. Nézzük!\n>>\n>> Laikus számára jónak hangzik, technikailag tényleg itt találhatóak a rovásírásos jelek az Unicode szabványban.\n>>\n>> No de ha nem nézed meg nem veszed észre, hogy a U+10CFA-U+10CFF régió valójában nem betűket tartalmaz! A helyes válasz, az valójában\n>>\n>>> **\\b[\\u{10C80}-\\u{10CF2}]+\\b**\n>>\n>> Nézzük sikerül-e rávezetni a ChatGPT-t erre a válaszra!\n>>\n>> Sikerül, bár akkor jönne a kérdés, hogy\n>>\n>>   1. Miért nem ezzel kezdte\n>>   2. Ha nem lennék laikus expert a témában honnan a faszból szoptam volna ki, hogy ez probléma?\n>>\n\n>>\n>> De most már jó, ugye?\n>>\n>> # NOPE\n>>\n>> Akik évek óta követnek, és olvasták a rovásírásos unicode cikkemet\n>>\n>> Consider to use non-historic ligatures in Old Hungarian font, “w” and “y” are not real ligatures · Issue #2021 · googlefonts/noto-fonts\n>>\n>> azok tudhatják, hogy a fenti keresés nem fogja megtalálni a dz, dzs, w, y és q betűket, azok ugyanis összevont unicode karakterek.\n>>\n>> ChatGPT nem hisz nekem, pedig hát én olvastam az Unicode szabványt, ő meg nem. De lássuk sikerül-e még jobban rávezetni\n>>\n>> Tagad a kis geci. Lássuk ha belinkelem neki a megoldást akkor esetleg rájön\n>>\n>> Jé baszd meg nem mondod, hogy nekem van igazan szopjál sünt. Na de most hogy már bélapátfalva kifogyott a vízből, kérdés. hogy jó-e a regexp amit kiszart magából?\n>>\n>> Határeset, egy kettest azért megajánlok neki, hogy ne bukjon meg, de azért haladjunk tovább\n>>\n>> De aztán elakad, hogy hát a kérdésem nem is olyan könnyű, és hát Bélapátfalva vízkeszlete már elfogyott, elhasználhatom-e Rudabánya vízkészletét is, pretty please?\n>>\n>> # HASZNÁLD EL GECI!\n>>\n>> Ezek után elkezdte szépen leírni nekem a regexet meg mindent, de hát egyből kitűnik, hogy a q a w meg y már ránézésre is el van baszva, nem lehet mindegyik ugyanazzal a ligatúrával képezve (Q az K+SZ, W az V+V, Y meg J+I a modern használatban)\n>>\n>> # MI A BÜDÖS KURVAGECI? HOGY MÉG ÉN DOLGOZZAK?\n>>\n>> Lófaszt papa, itt van neked két magyar zsákfalu összes vize, dolgozzál meg értük.\n>>\n>> Na ez már jó, ugye?\n>>\n>> # NEM\n>>\n>> Kihagyta hogy minden betűből van kisbetű meg nagybetű!\n>>\n>>\n>\n>>\n>> Final! Tudod, mint az MKKPs 12. kerületi Transparecny International jelentés, hogy TI_Mo_atvilagitasi_jelentes_Hegyvidek_final (5).docx\n>>\n>> De persze ezt is elcseszte, mert nem csak a dz meg DZ-t fogadja el, hanem a dZ-t meg Dz-it ami helytelen.\n>>\n>> De ez már jó, ugye?\n>>\n>> # LÓFASZT PAPA!\n>>\n>> Na de ez már ugye tényleg jó?\n>>\n>> Fasztugyja, ránézésre lehet, de most már egész Heves megye szomjan halt, úgyhogy inkább abbahagyom.\n>>\n>> Az AI korában nem kell már gondolkodni az baszd meg tényleg, a faszom beleverem az egészbe.\n>>\n>> Hamarabb megírtam volna kézzel és egyből helyes lenne.\n>\n> Mert nem claude.\n>\n> Chad is so february 2026\n\nCsak a te kedvedért elhasználom Borsod-Abaúj-Zemplén márnemvármegye vízkészletét is, és örömmel jelentem, hogy Claude (a Sonnet 4 csak mondjuk, nem az Opus) majdnem pontosan ugyanolyan hülye, mint a ChatGPT, de a kedvenceim:\n\n  1. Futtattatni akart velem egy python scriptet a saját gépemen (bátor voltam, engedtem neki és nem törölte le az összes production adatot), aminek az eredményét teljesen félreértelmezte (szerinte a Q az az N betűvel ekvivalens)\n  2. Utána miután vele is közöltem, hogy nesze ott a honlap minden infóval meg visszaírt, hogy bocs weblapokat nem tudok olvasni :D De faszom python scriptet futtathatsz geci :D\n  3. A folyamat az eredményre vezetésre amúgy ugyanaz volt, az egyetlen pont amiben a Claude ezerszer jobb volt, hogy egyszer sem próbált nem működő regexpet rámtukmákolni, minden amit kidobott magából az legalább tényleg regexp volt és nem kommentekkel teletákolt regexpnek látszó tárgy.\n\n",
  "title": "Csak a te kedvedért elhasználom Borsod-Abaúj-Zemplén márnemvármegye vízkészletét is, és örömmel…"
}