External Publication
Visit Post

Valakit mégis érdekelt ¯\_(ツ)_/¯

SztupY [Unofficial] May 1, 2026
Source

adolftmblr:

sztupy:

lencse:

sztupy:

lencse:

sztupy:

rosszulorzott:

sztupy:

lassukmiboolelunk:

sztupy:

lassukmiboolelunk:

sztupy:

lassukmiboolelunk:

foone:

jadeharleyinc:

0x4468c7a6a728:

it’s the year of regexslop

[0-9][0-9][0-9][0-9] is the year of regexslop!

\d{4} is the year of regexslop!

Uristen erről jut eszembe hogy hónapok óta akarok itt valakitől egy dátumregex-segítséget kérni csak mindig elfelejtem meg nem merek mások terhére lenni fasságokkal aztán anyázok

[1-9]\d*( AD| BC)? is the year of regexslop!

Köszönettel, a MemoQ-ban már idegbajt kapok a folyamatos manuális dátumozástól, és ha jól értem/gondolom/remélem elvileg regexben lehet automatizálni a dátumok átalakítását

Folyószövegekben vannak ezek a rohadékok, és 2026.12.24. helyett szeretnék nagyon 24. 12. 2026.-ot. De persze asse tudom hogy az eredetit felismeri-e dátumként vagy hogy lényeges-e egyáltalán hogy felismeri-e vagy nem.

Akartam screenshotot csatolni, de viszonylag töküres a teljes autoátalakító ablakom, szóval minek, de ezt találtam a neten (eskü numerikus is létezik belőle) (ja ez is numerikus, nem tűnt fel) (nem tudom mit kérdezek :C

Bármi megfejtést nagyon köszönök!

Bal oldalra: (\d+).(\d+).(\d+).

Jobb oldalra: $3. $2. $1.

Urstn, működik*, KÖSZÖNÖM

(*egyelőre a previewban, már csak ki kell találnom hogyan írom felül a találati listában a mittoménmiket, de helyzetünk biztató!)

Amúgy persze van határidős munkám, úgyhogy jöjjön egy kis Regexp gyorstalpaló!

Regexp lényege hogy szöveges tartalomban mintát találj, aztán esetleg azt átalakítsd egy másik szöveges tartalommá. Többnyire egy nagy Regexp szabvány van, de természetesen ettől függetlenül mindig vannak kisebb-nagyobb eltérések rendszerek között. Az alábbi a vadonban leginkább megtalálható verzióról szól.

  1. Minden, ami nem különleges karakter az önmagát jelenti. Azaz például a “bojler eladó” egy olyan reguláris kifejezés ami csak és kizárólag a “bojler eladó” szöveget találja meg. A legtöbb karakter, beleértve az összes kisbetűt nagybetűt, szóközt és számot ilyen.
  2. Van pár különleges karakter ami viszont mást jelent. Általában ezek az alábbiak: [ ] ( ) { } . \ / + * ? | ^ $. Ha ezek közül valamelyiket akarjuk megkeresni a szövegben, akkor mindenképp elé kell raknunk egy \ jelet. (Sasszemű olvasók láthatják, hogy a \ is különleges, hát az például pont ezért). Azaz például a “2026.12.01” egy olyan kifejezés ami csak és kizárólag a “2026.12.01” szöveget találja meg a dokumentumban.

(Van néhány rendszer ami kicsit máshogy működik, van ahol például a + önmagában nem különleges, de a \+ már igen. Áltlalában a +, (, ), \ karakterek azok ahol néha pont hogy -t kell elé tenni, hogy különleges legyen, mert önmagában nem az. De az interneten keresett kifejezések nagy része az általában követi a szabványt.)

  1. A +, * és ? az a rögtön előtte lévő jelet különlegesíti azzal, hogy nem csak egyet keres belőle hanem a jeltől függően akár többet is. + az a legalább egy, a ? a legfeljebb egy, a * meg az akármennyit jelenti.

Például a “A+RGH” kifejezés az megtalálja az “ARGH”, “AAAAARGH”, “AAAAAAAAAARGH” akármelyikét, de az “RGH”-t már nem.

Az “A?RGH” az vagy “RGH” vagy “ARGH” más nem lehet (az A legfeljebb egyszer szerepelhet)

Az “A*RGH” pedig a kettő együtt, szóval “RGH”, “ARGH”, meg “AAAAAARGH” bármelyike

  1. Ha pontosan meg akarjuk adni hogy hányszor akarjuk a jelet látni arra való a { }. “A{1,4}RGH” az “ARGH”, “AARGH” meg “AAAARGH”, de nem “AAAAARGH”. Lehet konkrét számot megadni {4} (pontosan 4) meg nyitott intervallumot is {4,} (minimum 4) vagy {,4} (maximum 4)
  2. Ha nem csak egyetlen karaktert akarunk módosítani a fenti módosítókkal akkor csoportosítani kell zárójelekkel. A “(La)+-La” az a “La-La”, “La-La-La”, “La-La-La-La”, “La-La-La-La-La” stb bármelyike lehet.
  3. Ha nem egy konkrét karaktert keresünk, hanem egy listából akarunk választani arra való a [ ]. Összes szám? “[0-9]”; Összes kisbetű? “[a-z]”. Összes kisbetű, nagybetű meg szám? “[0-9a-zA-Z]”. Kisbetű, nagybetű, páratlan számok, kötőjel meg pont? “[a-zA-Z13579.-]”. Fontos, hogy [ ] között csak a ] számít különleges karakternek, bármi mást lehet használni, például a pontot. A - -t, is de annak vagy a legelső vagy legutolsó opciónak kell lennie.
  4. A ^ karakter az első helyen invertálja a listát. A “[^0-9]” az az akármi ami nem számjegy. Ha ^-t akarunk keresni akkor ne tegyük az első helyre, pl. “[a-z^]” az az összes kisbetű ÉS a ^ karakter
  5. A “.” az az akármiből pontosan egy darab. A “.*” az az akármiből akármennyi. A “.” az meg ugye a pont, mint karakter
  6. A ^ a sor eleje, a $ meg a sor vége. A “^[0-9]+$” megkeresi nekünk az összes olyan sort, ami kizárólag számjegyből áll
  7. Végezetül a | a vagy, amivel lehet alternatívákat megadni. Lehet tippelni, hogy a “Zámbó (Jimmy|Árp(i|ád))” mit jelenthet. Ugyanitt példa arra hogy hogyan lehet zárójeleket egymásba pakolni.
  8. Van pár karakter ami különlegesíthető a -vel. A “\d” az ugyanaz, mint a “[0-9]”, a “\w” az a “[a-zA-Z_]”, a “\s” az az akármilyen szóköz jellegű karakter. Nagybetűsítve meg pont az ellenkezője, “\W” az például a “[^a-zA-Z_]”
  9. A fentieket összeadva például egy egész számnak látszó tárgy az a “[+-]?(0|[1-9]\d*)”. Miért? Az elején van egy opcionális előjel, utána pedig vagy egy 0 jön, vagy egy 1-9 közötti számjegy amit akármennyi másik számjegy követ.

Ez a fenti csak a keresésre vonatkozik, de itt jön a trükk, hogy lehet velük helyettesíteni is. Ilyenkor jön elő a () második szerepe: ezzel lehet kijelölni a találatokban a fontos részeket.

Például, ha egy dátumot akarunk magyar formátumból brit formátumba rakni, akkor az a keresésnél “(\d{4}).(\d{2}).(\d{2}).”, az eredmény oldalon pedig “$3/$2/$1”. A számok a zárójelezett részek eredeti sorrendjére utalnak, tehát a $3 az a harmadik zárójel tartalmát jelenti. Ha zárójeleket egymásba teszünk akkor az továbbra is működik a “Zámbó (Jimmy|Árp(i|ád))” esetben, ha ráeresztjük a Zámbó Árpád-ra, akkor a $1 az “Árpád” lesz, a $2 meg “ád”. Ha Zámbó Jimmy-re eresztjük rá akkor a $1 Jimmy lesz a $2 meg semmi.

Az eredmény oldalon sajnos nem mindig van szabvány, vannak rendszerek amik $1, $2, $3-at várnak, de vannak amik meg \1, \2, \3-al dolgoznak, ott például “\3/\2/\1” lenne a megoldás. Az ökölszabály az az, hogy mindig pont a másik, mint ahogy kigondoltad és leírtad, hogy aztán vissza kelljen vonnod és újra átírni a másik formátumba.

Eredmény oldalon általában nincsenek különleges karakterek, kivéve a $ (ami a helyettesítést jelenti) meg a , ami ugye a különlegestelenítő karakter. Néhány rendszerben még a / elé is kell . tehát lehet, hogy a “$3/$2/$1” az a te rendszeredben a “\3/\2/\1”

[\p{Ll}]

@sztupy én figyellek egy ideje, túl gyakran van határidős munkád. Nem akarsz valami nyugisabbra váltani?

Szívesen, de sajnos még nem nyertem a lottón, a gyerekem meg szeret nem éhenhalni!

Fhu, visszaolvasva tök beszólogatósnak érződik, amit írtam, pedig csak poénnak szántam. Bocsánatot kérek.

Nem vettem zokon, ne aggódj :D

Na de ez az a tudás, amire az AI korában már semmi szükség nincs.

Valakit mégis érdekelt ¯\(ツ)

Discussion in the ATmosphere

Loading comments...