Waar ben je naar op zoek?

21.05.2013
7 minuten
Wij zijn Juist

Hoe gebruik je reguliere expressies in Google Analytics?

Juist Redactieteam

In Google Analytics is tegenwoordig sprake van een overvloed aan data. Het gevaar om het overzicht te verliezen, ligt dan ook op de loer. Voorkom dit door de data op de juiste manier te filteren. Hierdoor behoud je slechts relevante data. Uit ervaring weten wij namelijk dat de basisfuncties binnen de standaardfilter niet altijd voldoende zijn. Daarom lichten wij graag toe wat reguliere expressies zijn. En hoe je dit binnen Google Analytics kan toepassen.

Wat is een reguliere expressie?

Een reguliere expressie staat ook wel bekend als: regex. Het is een veel gebruikte manier om een bepaald patroon te beschrijven. Hiermee herkend een programma de logische opbouw van teksten of getallen. Omdat regex gestandaardiseerd is, kan het binnen vrijwel iedere programmeertaal gebruikt worden. Zo dus ook in Google Analytics.

Welke reguliere expressies zijn er in Google Analytics?

Over het algemeen worden in Google Analytics niet zo’n uitgebreide regex gebruikt. Hieronder geven wij een mooi overzicht van de tekens en symbolen die gebruikt kunnen worden. Netjes uitgesplitst in Jokertekens, Ankers, Groepen en Escape.

Jokertekens

De punt = .komt overeen met ieder willekeurig teken (letter, cijfer of symbool)1. komt overeen met
10, 1A

1.1 komt overeen met
111, 1A1
Het vraagteken = ?geeft aan dat het voorgaande teken 0 of 1x mag voorkomen10? komt overeen met
1, 10
De plus = +geeft aan dat het voorgaande teken 1x of meer mag voorkomen10+ komt overeen met
10, 100
Het sterretje = *geeft aan dat het voorgaande teken 0x of meer mag voorkomen1* komt overeen met
1, 10
De staander = |maakt een OF-overeenkomst, niet gebruiken aan het einde van een expressie1|10 komt overeen met
1, 10

Ankers

Het dakje = ^geeft de naastliggende tekens aan het begin van een tekenreeks aan^10 komt overeen met
10100, 10x

^10 komt niet overeen met
110, 110x
Het Dollarteken = $geeft de naastliggende tekens aan het eind van een tekenreeks aan10$ komt overeen met
110, 1010

10$ komt niet overeen met
100, 10x

Groepen

De haakjes = ( )komt overeen met de tekens tussen de haakjes in exacte volgorde op een willekeurige plaats in een tekenreeks, wordt ook gebruikt om andere expressies te groeperen(10) komt overeen met
10101, 1011

([0-9]|[a-z]) komt overeen met
elk cijfer of elke kleine letter
De blokhaakjes = [ ]komt overeen met de tekens tussen de haakjes in elke volgorde op een willekeurige plaats in een tekenreeks[10] komt overeen met
012, 120, 210
Het minteken = –maakt een reeks tekens tussen haken die wordt gevonden op een willekeurige plaats in een tekenreeks[0-9] komt overeen met elk cijfer van 0 tot en met 9

Escape

De backslash = \geeft aan dat het volgende naastliggende teken letterlijk moet worden geïnterpreteerd en niet als een metateken voor reguliere expressies\. geeft aan dat de naastliggende punt moet worden geïnterpreteerd als een punt of decimaal in plaats van als een jokerteken.

216\.239\.32\.34 komt overeen met
216.239.32.34

Waar worden de reguliere expressies gebruikt in GA?

In Google Analytics zijn verschillende plaatsen terug te vinden waar gebruik wordt gemaakt van een zogeheten regex. Dit is onder anderen bij een geavanceerde filter, filters in dashboard widgets, bij het instellen van geavanceerde segmenten én bij aangepaste profielfilters.

Tips bij het gebruiken van reguliere expressies in Google Analytics

Ons advies is om een reguliere expressie eenvoudig te houden. Ook voor andere gebruikers is het zo makkelijker om deze te interpreteren en (waar nodig) aan te passen. Een backslash (\) kan worden gebruikt om metatekens voor reguliere expressies uit te schakalen. Dit kan je doen als je wilt dat de tekens letterlijk geïnterpreteerd worden. Heb je een punt (.) gebruikt als decimaal scheidingsteken in een IP-adres? Schakel deze dan uit door met een backslash (\.) om te voorkomen dat de punt wordt geïnterpreteerd als jokerteken. Verder hoeven reguliere expressies géén metatekens voor regex te bevatten. Dit kan bijvoorbeeld door een segment te maken voor alle gegeven vanuit Nederland toe te passen. Dus: land komt overeen met regex Nederland.

Een regex is dus veelomvattend. Verbied je ze niet? Dan komen ze overeen met wat je opgeeft. Plus eventueel nog een naasten teken. De site omt dan dus bijvoorbeeld overeen met mijnsite, uwsite, huissite en website. Oftewel: iedere tekenreeks die ‘site’ bevat. Als je een overeenkomst nodig hebt, is het dan ook aan te raden om een regex overeenkomst op te stellen. Als alleen de tekenreeks ‘site’ te vinden is, dan moet de regex zo worden dat ‘site’ zowel aan het begin als eind van de tekenreeks is: ^site$

Hulp nodig bij het instellen van een reguliere expressie? Schakel dan de specialisten van Juist in.

Kom je lunchen?

Wat is juist voor jou? Dat maken we graag behapbaar! Daarom nodigen we je uit voor een lunchsessie. Met een (worsten)broodje in de hand bespreken we jouw doelen. En heb je alleen honger naar resultaat? Dan spreken we ‘gewoon’ af.

Afspraak maken! 🥐