In Google Analytics is het belangrijk om de juiste data te verzamelen en te analyseren om betere beslissingen te kunnen nemen. Google Analytics is een krachtige tool die marketeers helpt bij het verzamelen en analyseren van websitegegevens. Het gebruik van reguliere expressies kan het proces van het analyseren van gegevens nog efficiënter maken. In dit blog bespreken we wat reguliere expressies zijn, welke reguliere expressies worden gebruikt in Google Analytics, waar ze worden gebruikt en geven we voorbeelden van reguliere expressies.
Wat is een reguliere expressie?
Reguliere expressies zijn zoekpatronen die worden gebruikt om specifieke stukken tekst te vinden. Ze worden vaak gebruikt in programmeertalen en teksteditors om tekst te doorzoeken en te bewerken. In Google Analytics worden reguliere expressies gebruikt om zoekopdrachten uit te voeren op gegevens die zijn verzameld door het volgen van websiteactiviteit.
Welke reguliere expressies zijn er in Google Analytics?
Google Analytics ondersteunt een breed scala aan reguliere expressies. Hieronder staan enkele van de meest voorkomende reguliere expressies die worden gebruikt in Google Analytics:
Jokertekens
De punt = . | komt overeen met ieder willekeurig teken (letter, cijfer of symbool) | 1. komt overeen met 10, 1A 1.1 komt overeen met 111, 1A1 |
Het vraagteken = ? | geeft aan dat het voorgaande teken 0 of 1x mag voorkomen | 10? komt overeen met 1, 10 |
De plus = + | geeft aan dat het voorgaande teken 1x of meer mag voorkomen | 10+ komt overeen met 10, 100 |
Het sterretje = * | geeft aan dat het voorgaande teken 0x of meer mag voorkomen | 1* komt overeen met 1, 10 |
De staander = | | maakt een OF-overeenkomst, niet gebruiken aan het einde van een expressie | 1|10 komt overeen met 1, 10 |
Ankers
Het dakje = ^ | geeft de naastliggende tekens aan het begin van een tekenreeks aan | ^10 komt overeen met 10, 100, 10x ^10 komt niet overeen met 110, 110x |
Het Dollarteken = $ | geeft de naastliggende tekens aan het eind van een tekenreeks aan | 10$ komt overeen met 110, 1010 10$ komt niet overeen met 100, 10x |
Groepen
De haakjes = ( ) | komt overeen met de tekens tussen de haakjes in exacte volgorde op een willekeurige plaats in een tekenreeks, wordt ook gebruikt om andere expressies te groeperen | (10) komt overeen met 10, 101, 1011 ([0-9]|[a-z]) komt overeen met elk cijfer of elke kleine letter |
De blokhaakjes = [ ] | komt overeen met de tekens tussen de haakjes in elke volgorde op een willekeurige plaats in een tekenreeks | [10] komt overeen met 012, 120, 210 |
Het minteken = – | maakt een reeks tekens tussen haken die wordt gevonden op een willekeurige plaats in een tekenreeks | [0-9] komt overeen met elk cijfer van 0 tot en met 9 |
Escape
De backslash = \ | geeft aan dat het volgende naastliggende teken letterlijk moet worden geïnterpreteerd en niet als een metateken voor reguliere expressies | \. geeft aan dat de naastliggende punt moet worden geïnterpreteerd als een punt of decimaal in plaats van als een jokerteken. 216\.239\.32\.34 komt overeen met 216.239.32.34 |
Waar worden de reguliere expressies gebruikt in GA?
Reguliere expressies kunnen worden gebruikt in verschillende functies van Google Analytics, zoals filters, doelen, segmenten en aangepaste rapporten. Filters en doelen zijn de meest voorkomende plaatsen waar reguliere expressies worden gebruikt in Google Analytics. Filters worden gebruikt om gegevens te manipuleren voordat ze worden opgeslagen in Google Analytics. Doelen worden gebruikt om gebeurtenissen te definiëren die je wilt volgen, zoals wanneer een gebruiker een pagina bezoekt of een formulier indient.
Voorbeelden van de toepassing van reguliere expressies
^/blog/
– Zoekt naar pagina’s die beginnen met/blog/
, zoals/blog/page1/
en/blog/2021/03/
./$
– Zoekt naar pagina’s die eindigen op/
, zoalshttps://www.example.com/
\.pdf$
– Zoekt naar bestanden die eindigen op.pdf
, zoalshttps://www.example.com/file.pdf
.^/(blog|news)/
– Zoekt naar pagina’s die beginnen met/blog/
of/news/
, zoals/blog/page1/
en/news/2021/03/
.^/checkout/\?.*shipping=US.*$
– Zoekt naar pagina’s die beginnen met/checkout/
en waarbij de verzendoptie is ingesteld op ‘US’, bijvoorbeeldhttps://www.example.com/checkout/?shipping=US
.^[A-Z]{2}-[0-9]{4}$
– Zoekt naar specifieke patronen van tekens, zoalsAB-1234
ofCD-5678
.^/(category|tag)/[a-z-]+/$
– Zoekt naar pagina’s die beginnen met/category/
of/tag/
en die vervolgens gevolgd worden door een reeks van kleine letters of streepjes, zoals/category/example-category/
.
Tips bij het gebruiken van reguliere expressies in Google Analytics
Ons advies is om een reguliere expressie eenvoudig te houden. Ook voor andere gebruikers is het zo makkelijker om deze te interpreteren en (waar nodig) aan te passen. Een backslash (\) kan worden gebruikt om metatekens voor reguliere expressies uit te schakalen. Dit kan je doen als je wilt dat de tekens letterlijk geïnterpreteerd worden. Heb je een punt (.) gebruikt als decimaal scheidingsteken in een IP-adres? Schakel deze dan uit door met een backslash (\.) om te voorkomen dat de punt wordt geïnterpreteerd als jokerteken. Verder hoeven reguliere expressies géén metatekens voor regex te bevatten. Dit kan bijvoorbeeld door een segment te maken voor alle gegeven vanuit Nederland toe te passen. Dus: land komt overeen met regex Nederland.
Een regex is dus veelomvattend. Verbied je ze niet? Dan komen ze overeen met wat je opgeeft. Plus eventueel nog een naasten teken. De site omt dan dus bijvoorbeeld overeen met mijnsite, uwsite, huissite en website. Oftewel: iedere tekenreeks die ‘site’ bevat. Als je een overeenkomst nodig hebt, is het dan ook aan te raden om een regex overeenkomst op te stellen. Als alleen de tekenreeks ‘site’ te vinden is, dan moet de regex zo worden dat ‘site’ zowel aan het begin als eind van de tekenreeks is: ^site$
Hulp nodig bij het instellen van een reguliere expressie? Schakel dan de specialisten van Juist in.