In Google Analytics is tegenwoordig sprake van een overvloed aan data. Het gevaar om het overzicht te verliezen, ligt dan ook op de loer. Voorkom dit door de data op de juiste manier te filteren. Hierdoor behoud je slechts relevante data. Uit ervaring weten wij namelijk dat de basisfuncties binnen de standaardfilter niet altijd voldoende zijn. Daarom lichten wij graag toe wat reguliere expressies zijn. En hoe je dit binnen Google Analytics kan toepassen.
Wat is een reguliere expressie?
Een reguliere expressie staat ook wel bekend als: regex. Het is een veel gebruikte manier om een bepaald patroon te beschrijven. Hiermee herkend een programma de logische opbouw van teksten of getallen. Omdat regex gestandaardiseerd is, kan het binnen vrijwel iedere programmeertaal gebruikt worden. Zo dus ook in Google Analytics.
Welke reguliere expressies zijn er in Google Analytics?
Over het algemeen worden in Google Analytics niet zo’n uitgebreide regex gebruikt. Hieronder geven wij een mooi overzicht van de tekens en symbolen die gebruikt kunnen worden. Netjes uitgesplitst in Jokertekens, Ankers, Groepen en Escape.
Jokertekens
De punt = . | komt overeen met ieder willekeurig teken (letter, cijfer of symbool) | 1. komt overeen met 10, 1A 1.1 komt overeen met 111, 1A1 |
Het vraagteken = ? | geeft aan dat het voorgaande teken 0 of 1x mag voorkomen | 10? komt overeen met 1, 10 |
De plus = + | geeft aan dat het voorgaande teken 1x of meer mag voorkomen | 10+ komt overeen met 10, 100 |
Het sterretje = * | geeft aan dat het voorgaande teken 0x of meer mag voorkomen | 1* komt overeen met 1, 10 |
De staander = | | maakt een OF-overeenkomst, niet gebruiken aan het einde van een expressie | 1|10 komt overeen met 1, 10 |
Ankers
Het dakje = ^ | geeft de naastliggende tekens aan het begin van een tekenreeks aan | ^10 komt overeen met 10, 100, 10x ^10 komt niet overeen met 110, 110x |
Het Dollarteken = $ | geeft de naastliggende tekens aan het eind van een tekenreeks aan | 10$ komt overeen met 110, 1010 10$ komt niet overeen met 100, 10x |
Groepen
De haakjes = ( ) | komt overeen met de tekens tussen de haakjes in exacte volgorde op een willekeurige plaats in een tekenreeks, wordt ook gebruikt om andere expressies te groeperen | (10) komt overeen met 10, 101, 1011 ([0-9]|[a-z]) komt overeen met elk cijfer of elke kleine letter |
De blokhaakjes = [ ] | komt overeen met de tekens tussen de haakjes in elke volgorde op een willekeurige plaats in een tekenreeks | [10] komt overeen met 012, 120, 210 |
Het minteken = – | maakt een reeks tekens tussen haken die wordt gevonden op een willekeurige plaats in een tekenreeks | [0-9] komt overeen met elk cijfer van 0 tot en met 9 |
Escape
De backslash = \ | geeft aan dat het volgende naastliggende teken letterlijk moet worden geïnterpreteerd en niet als een metateken voor reguliere expressies | \. geeft aan dat de naastliggende punt moet worden geïnterpreteerd als een punt of decimaal in plaats van als een jokerteken. 216\.239\.32\.34 komt overeen met 216.239.32.34 |
Waar worden de reguliere expressies gebruikt in GA?
In Google Analytics zijn verschillende plaatsen terug te vinden waar gebruik wordt gemaakt van een zogeheten regex. Dit is onder anderen bij een geavanceerde filter, filters in dashboard widgets, bij het instellen van geavanceerde segmenten én bij aangepaste profielfilters.
Tips bij het gebruiken van reguliere expressies in Google Analytics
Ons advies is om een reguliere expressie eenvoudig te houden. Ook voor andere gebruikers is het zo makkelijker om deze te interpreteren en (waar nodig) aan te passen. Een backslash (\) kan worden gebruikt om metatekens voor reguliere expressies uit te schakalen. Dit kan je doen als je wilt dat de tekens letterlijk geïnterpreteerd worden. Heb je een punt (.) gebruikt als decimaal scheidingsteken in een IP-adres? Schakel deze dan uit door met een backslash (\.) om te voorkomen dat de punt wordt geïnterpreteerd als jokerteken. Verder hoeven reguliere expressies géén metatekens voor regex te bevatten. Dit kan bijvoorbeeld door een segment te maken voor alle gegeven vanuit Nederland toe te passen. Dus: land komt overeen met regex Nederland.
Een regex is dus veelomvattend. Verbied je ze niet? Dan komen ze overeen met wat je opgeeft. Plus eventueel nog een naasten teken. De site omt dan dus bijvoorbeeld overeen met mijnsite, uwsite, huissite en website. Oftewel: iedere tekenreeks die ‘site’ bevat. Als je een overeenkomst nodig hebt, is het dan ook aan te raden om een regex overeenkomst op te stellen. Als alleen de tekenreeks ‘site’ te vinden is, dan moet de regex zo worden dat ‘site’ zowel aan het begin als eind van de tekenreeks is: ^site$
Hulp nodig bij het instellen van een reguliere expressie? Schakel dan de specialisten van Juist in.