Hashtags voor massaspectra

23/11/2016

Door Ad Spijkers

Databasedeskundigen uit Japan, Amerika en heel Europa hebben gezamenlijk een code ontwikkeld, waarmee het mogelijk is de informatie uit massaspectrometrie uniform te beschrijven.


     

De SPectraL-Hash of Splash genoemde code moet het zoeken naar massaspectra op internet vergemakkelijken. Met de spectra hashtag kan alle beschikbare informatie over een bepaald spectrum doelgericht uit alle databanken worden opgehaald en met elkaar worden vergeleken.

Massaspectra

De massaspectrometrie is een zeer gevoelige analysemethode waarmee het mogelijk is om ook in mengsels van stoffen de geringste hoeveelheden van een stof aan te tonen. De technologie is zo krachtig dat men er een suikerklontje in een zwembad mee kan detecteren. Behalve voor het aantonen van reeds bekende stoffen wordt de massaspectrometrie ook gebruikt voor het ontrafelen van de structuur van nieuw ontdekte verbindingen.

Sinds de ontwikkeling van de eerste commerciële massaspectrometers in de jaren vijftig zijn de analyseapparaten en –methoden continu verbeterd, zodat de massaspectrometrie tot een onmisbaar gereedschap is geworden voor chemisch-biologisch fundamenteel onderzoek, milieu- en klimaatonderzoek en de medische en forensische techniek is geworden.

Wereldwijd genereren en analyseren de deskundigen dagelijks Gigabytes aan massadata. Op dit moment zijn in zo'n twintig grotere databanken miljoen spectra opgeslagen. Dat komt overeen met meerdere Petabytes, ofwel meerdere miljoen Gigabytes ofwel duizenden Terabytes.

Opslaan en terugvinden

Onder deze spectra bevinden zich duizenden referentiespectra van bekende stoffen, waarop men naar behoefte kan teruggrijpen ter vergelijking met eigen meetresultaten. Bovendien worden de databanken dagelijks gevoed met spectra van nog onbekende stoffen die men de laatste tijd in toenemende mate uit planten, schimmels en zeeorganismen wint.

De opslag van de spectra gebeurt daarbij steeds in het voor de databank specifieke formaat, zodat bijvoorbeeld bij een onbekende en nog naamloze stof X niet kan worden vastgesteld op deze niet reeds ergens anders is beschreven en als spectrum opgeslagen. Informatie-uitwisseling onder wetenschappers, bijvoorbeeld over belangrijke eigenschappen van stof X, wordt daardoor bemoeilijkt. Aan deze historisch gegroeide wildgroei aan massadata willen de ontwikkelaars met de Splash-code een eind maken.

Splash-code

De door de wetenschappers van het internationale Splash-consortium ontwikkelde programma's kunnen uit elk bestaand spectrum een code genereren, die tevens als hashtag fungeert. Daardoor worden spectra op het internet niet alleen vindbaar, men kan bovendien alle beschikbare informatie over een bepaalde stof uit verschillende databanken verzamelen en analyseren. Spectra van nog onbekende stoffen krijgen met de Splash-code hun eerste naam, wat de communicatie over deze stoffen aanzienlijk vergemakkelijkt.

Aan de Splash-code is onder meer gewerkt door bio-informatici van het Leibniz-Institut für Pflanzenbiochemie (IPB) in Halle. De afbeelding (bron: Steffen Neumann, IPB) toont een typisch massaspectrum van coffeïne. Mocht u de onbedwingbare behoefte hebben dat te willen opzoeken: de bijbehorende Splash-code is

splash10-000i-3900000000-73043667076aaf483c6e