Data Management: A few of my favourite things

Last year I had the good fortune to help draft a research data management policy for a Dutch research organisation, or rather an umbrella organisation of research institutes. The draft policy is now under discussion among the institutes and the umbrella organisation. That consultancy project has given me a welcome opportunity to read (again) a number of data policies from academic organisations and funders, as well as guides for developing a data management policy by Hodson and Molloy, the Australian National Data Service, and the Digital Curation Centre.

Research data management or RDM is a lively debated and partially uncharted territory, where different organisations place different markers: some universities take two pages to communicate their policy, others more than ten. At the moment about half of the Dutch research universities have published an RDM policy; the others and also most universities of applied sciences are in the process of designing one. The situation at other research and science institutes in The Netherlands is equally mixed, which has also to do with international collaborations with partners which may or may not have (to comply with) data policies. Anyway, a data policy is a crucial element in a researcher’s influence sphere.

This blogpost is a highly subjective set of a few good practices. Firstly, it is subjective because the selection of extant policies that I’ve read or skimmed was strictly mine, and the links at the end of this post cover only part of Dutch research organisations (no foreign examples, no funders). Secondly, the order in which I’ve read them has certainly affected my “Oh, this is great” and “Yeah, I know” reactions, favouring some policies or sections over others for possibly no other reason than “newness” in the eyes of this reader. And thirdly, from the many, many aspects of research data management I’ve chosen just a few that I consider relevant for anyone who is interested in designing or implementing a data policy. So please, don’t be offended when your policy isn’t mentioned.

    1 – Who’s responsible?

A commonality in the RDM policies on my reading list is the two-tiered approach: The policy is released at the highest level of the organisation, typically by the Executive Board (in Dutch “College van Bestuur”), and it delegates responsibility to departments and/or graduate schools for both refining the policy – by means of discipline-specific information on e.g. data types, research methods, appropriate data repositories – and for monitoring and enforcing its implementation. This is a sensible strategy to handle “Sure, we should manage our data well, but in my line of working this is slightly different”.

So much for policy making; let’s look at responsibilities regarding the data themselves. In 2013 the Schuyt Committee concluded in her advisory report that the responsibility for research data lies at three different levels: 1) the individual researcher; 2) the research institution (e.g. by providing facilities and assistance, and by PhD supervisors showing exemplary behaviour); and 3) informal research networks, including journals.

In my policy collection, responsibility is sometimes just mentioned briefly; I guess that by now it is a common principle that the primary responsibility for RDM lies with the (principal) researcher or scientist. At the more explicit end of the spectrum we find for instance the University of Groningen. Not only is “Scientific research is a responsible job” the start of their RDM policy web page, the policy also devotes a good two pages to detailing roles and responsibilities throughout the organisation.

    2 – What to keep for the long term?

Before most of the current policy documents appeared the Netherlands Code of Conduct for Academic Practice already declared a minimum retention time for raw research data. The Code also states that “all steps taken must be properly reported and their execution must be properly monitored (lab journals, progress reports, documentation of arrangements and decisions, etc.)”. In a similar vein the Humboldt-Universität zu Berlin makes clear in its policy and guidelines that already the data management plan should tell how the data will be documented; moreover, this documentation and the metadata should comply with standards in the respective scholarly community.

The Guideline on Data Handling and Methods Reporting from the Tilburg School of Social and Behavioral Sciences refines the university-wide policy. “Staff and PhD students must ensure that there is a data package for each empirical article or book/chapter of which they are author (…)”. The guidelines then describe eight requirements that the data package must comply with: for instance, not only must it contain all the digital research material used in the research project that is needed to replicate the research, but also detailed information on who collected the data, where and at what location, as well as – when appropriate – computer scripts or statistical logbooks. I really like the short discussions/motivations about the requirements.

I’m only looking for a better name for this kind of package: “data package” might, despite the explicit requirements, still suggest that the mere data would be enough. Elsewhere I’ve proposed the name “replication package”, as shorthand for “everything that a fellow-researcher would need to replicate the particular study”, but that name unfortunately ignores the potential of reuse. And I’m afraid that “archival package” would only confirm the misunderstanding that archives exist for the sake of keeping your stuff from disappearing…

    3 – The visibility advantage

… whereas in reality research data archives contribute to data reuse, repurposing (answering other questions than the original one), efficiency, thrift (spending research funds well), and of course to increased visibility of researchers, data scientists, scientific programmers and their research organisations. From the latter point of view it certainly makes sense that Radboud University has decided to include a list of stored data sets in its self-evaluation of the Dutch Standard Evaluation Protocol. In this Protocol datasets as well as e.g. software tools explicitly qualify as research products achieved in the domains of research and society.

I’d like to see more examples of research institutes that register data and in particular the use of data as an indicator in their self-assessment. For one thing, more information about data availability and use can shed more light, in more disciplines, on the relation between Open Access to data and the number of citations. Keeping track of open data use is hard – if “they” don’t cite your data properly, how would you know about reuse, unless you live in a smallish research domain? – but joining forces might get us somewhere.

All Dutch universities and the Royal Netherlands Academy of Arts and Sciences offer public information about managing research data (and so do other research organisations not mentioned here). The following links point to a data (management) policy when available; otherwise the link refers to other RDM information. All links were retrieved in September 2017.

 

Disclaimer: I’ve carried out the consultancy project as a DANS employee, but the views presented here are my own, not necessarily my employer’s.

Posted in Uncategorized | Tagged , | Leave a comment

Kappersgrappen

Natuurlijk kan het toeval zijn als een kapperszaak in de Hoofdstraat zit, zoals in Terheijden, Schijndel, Gaanderen, Hillegom, Hoogeloon, Posterholt, Zuidwolde en Meppel. Maar als-ie dan Upstairs heet, ga je twijfelen.

Kappers zijn woordspelerig, overal ter wereld. “Zonder woordspeling kun je je niet eens meer een gangbare kapper noemen”, schrijft Marjolein over kappers in Berlijn. In Nederland kunnen we er ook wat van:

Haarfijn
Haarscherp
Haarzuiver (milieuvriendelijk)
Haarchitect
Voor Haar
Haar ook voor hem
Hem & Haar kappers
Haar Zaakje

Hairforce 1
Hairport
Hairpoint
Flhair
Hair hunter
Hairmitage
Whair
Hair & der
Hairlem Kappers (in Haarlem)

Haar/Steil
Mijn stijl
ZijnStijl HaarStijl
Your Style
StijlAchterover
Style Achterover
Steilloos
FreeStyle

De Hoofdzaak
Headmatters
Zeven Hoofdzonden
Brainwash
Koppie koppie
Koppig
Sissers
Schorem Haarsnijder & Barbier
Scheer’em Grand Barbier
BarberElla
Lucky Look
Piekobello
Piekasso
‘t Knappertje
De Knappe Knip
Knappe Koppen
Kapsones
Kapsoones
KamKam Kappers
Kapperazzi
De Kapperie
Knipz
Cut the crap

En dan zijn er ook nog beauty adviseur WieWatHaar en de Barbier van Haren, maar die kan er weinig aan doen.

Posted in Uncategorized | Tagged | Leave a comment

Herderlijk handelen

Waarde gelovigen!
Op encycliekjesdag*
uit paus Franciscus zijn
zorg om ‘t milieu.

Opgewarmd nieuws? Nee, de
klimatologentop
neemt deze opwekking
au serieux.

© Bliklog

* Op 18 juni 2015 werd de encycliek “Laudato si” gepubliceerd.

Posted in Uncategorized | Tagged | Leave a comment

Iedereen duwt wel eens zacht

In de zomer gaat de eerste
er vóór zessen vaak al uit
en al doet ze nog zo zachtjes,
klittenband maakt ook geluid.

Slaapzak, tentdoek, slippers zoeken;
in het midden staat de paal,
en omzeil je die behendig,
ritsen zijn niet ideaal.

In de luifel hangt tien liter
regenwater van vannacht.
Stoelen, speelgoed, wandelschoenen;
Iedereen duwt wel ‘ns zacht.

Van hiernaast gaan samen douchen.
Nee, ik heb de shampoo niet,
kijk eens goed in je toilettas.
Ach, als zij hem eens verliet.

Tegen elven wordt het rustig:
speeltuin, rafting, belvedère.
Ik blijf lekker op de camping.
Afgesloten sanitair.

Badminton en barbecueën.
‘t Kousje van de lamp is stuk;
laten we dan maar gaan slapen.
Onverdeeld kampeergeluk.

© Bliklog

Posted in Uncategorized | Tagged | Leave a comment

Pantoum voor drie personen

Ik was het hele voorjaar al verkouden.
Liefst zou ik onderduiken in mijn bed.
Het regenen schijnt niet meer op te houden;
Daarom heb ik mijn kraag maar opgezet.

Liefst zou ik onderduiken in mijn bed,
De buurt bespiedend door een periscoop.
Daarom heb ik mijn kraag maar opgezet.
Geen mens zal me herkennen, naar ik hoop.

De buurt bespiedend door een periscoop;
Zo leeft de regenmaker in z’n kelder.
“Geen mens zal me herkennen, naar ik hoop.”
Zijn raam beslaat; één stukje is nog helder.

Zo leeft de regenmaker in z’n kelder.
Snel haal ik brood, terwijl hij regen trommelt.
Zijn raam beslaat. Eén stukje is nog helder:
Daar is een periscoop doorheen gefrommeld.

Snel haal ik brood. Terwijl híj regent, rommelt
De buurtgek met z’n tassen, onbemerkt.
Daar is een periscoop doorheen gefrommeld
En… Rain Man’s uitlaatklep is uitgewerkt.

De buurtgek met z’n tassen, onbemerkt!
Het regenen schijnt niet meer op te houden
En Rain Man’s uitlaatklep is uitgewerkt.
Ik was het hele voorjaar al verkouden…

© Bliklog

Er bestaan verschillende definities van het pantoum. Ik heb die van Quirien van Haelen gebruikt.

Posted in Uncategorized | Tagged , | Leave a comment

De muze Mathilde

Wagner had zijn Mathilde (Wesendonck) en ook Jacques Perk had er een (Thomas). Wat zijn dat voor vrouwen, die Mathildes?

In Nederland leven zo’n vijfentwintigduizend Mathildes en (Ma)tilda’s, blijkt uit de Gemeentelijke Basisadministratie. Er zijn ook een kleine tweeduizend Mathildussen, vooral in zuidelijker streken. De Voornamenbank, die deze gegevens op de landkaart toont, laat zien dat Mathildus als eerste naam erg weinig voorkomt (38 keer), maar dan wel vaak in buurgemeenten, zoals in Maasdriel, ‘s-Hertogenbosch en Sint-Michielsgestel.

Maar Mathildes, in welke spelling dan ook, zijn er al veel langer dan de Basisadministratie en haar voorgangers. Matilda is een oude Teutoonse vrouwennaam, aldus de exegeten van de walsende Matilda, en betekent zoiets als “machtige strijdster”. De middeleeuwen hebben machtige Mathildes gekend, zoals de elfde-eeuwse Mathilde van Vlaanderen. Zij was getrouwd met Willem die de Veroveraar zou worden, nadat hij Engeland was binnengevallen met een invasievloot die Mathilde had gefinancierd. Ook al schijnt ze er zelf niet aan geborduurd te hebben, het is verleidelijk om in haar de muze te zien voor het wandkleed van Bayeux, dat de invasie en de strijd bij Hastings verbeeldt. En van tapisserie naar patisserie Reine Mathilde is natuurlijk maar een stapje, ook in Bayeux. Deze Mathilde was overigens de grootmoeder van Empress Maud – oftewel Matilda – en van Stephen van Blois, die elkaar jarenlang in felle strijd de Engelse kroon hebben betwist. “Matilda’s martial reputation may have contributed to Alfred, Lord Tennyson’s decision to entitle his 1855 battle poem Maud”, aldus de wikipedist.

Nauwelijk twee jaar later schreef Richard Wagner zijn Wesendonck-Lieder, een cyclus op teksten van de schrijfster Mathilde Wesendonck, die op haar beurt beïnvloed was door Wagner’s libretto voor Tristan en Isolde. “De componist onderhield met haar een stormachtige liefdesaffaire. Later ontstonden er orkestversies van het werk.” Later – toen Wagner de relatie op aandringen van zijn vrouw had verbroken. Een van Mathildes werken uit die latere jaren gaat trouwens over de slag bij Hastings…

Stormachtig mag het bij Jacques Perk wellicht zijn geweest, maar tot een affaire met Mathilde Thomas is het zeker niet gekomen. In 1879 is de twintigjarige samen met zijn zusters en ouders in Laroche, in de Ardennen. In hun herberg verblijft niet alleen de jonge Oscar Wilde, maar – wat grotere gevolgen had voor de Nederlandse poëzie – ook de geoloog en mede-wandelaar Xavier de Reul met zijn nichtje Mathilde. “Dat zij al verloofd is, en dus (sic!) onbereikbaar, stuwt de verliefdheid die Jacques meteen voor haar voelt alleen maar naar grotere hoogten”, aldus Bart Slijper in zijn Kloos-biografie. Aan het eind van die zomer heeft Perk al zo’n twintig, dertig sonnetten gereed; in november zijn het er ruim honderd en vóór Kloos’ ingrijpende redactie waren er maar liefst drie versies van Perks Mathilde-cyclus. (Is die gewijd aan de afgebeelde Mathilde Thomas van de dierensculpturen, of komt het geboortejaar toevallig overeen?)

Ook een andere Jacques heeft hartstochtelijk geschreven over Mathilde, al bezong hij Madeleine en Marieke met eenzelfde passie. Terwijl Perk het Schone aanbidt en hier geleidelijk aan in opgaat, is voor Jacques Brel de terugkeer van Mathilde aanvankelijk vooral een bedreiging, die om gebed en de steun van vrienden vraagt. Een dergelijke maudite Mathilde kent het Nederlandse lied natuurlijk ook. Tien jaar vóór Brel vereeuwigde drs. P haar immers in de Gezusters Karamazov. De strijd tussen tante Constance en tante Mathilde om de jurken van wijlen tante Heleen eindigt pas als tante Mathilde, die haar zuster vergiftigen wilde, de gifdrank proeft en als een blok neervalt. Wie het zwaard opneemt…

En wat moeten we in dit verband denken van de immense populariteit van de “Mathilde blouse”? Blijkbaar zijn er duizenden mensen – DIY dressmakers – gecharmeerd van dit naaipatroon, of op z’n minst van de kittige handwerksite van Tilly and the buttons. Net als je denkt dat de blouse is vernoemd naar de ontwerper, blijkt die een andere muze te hebben. Tilly verwijst namelijk naar een Engelse uitvoering van Brels Mathilde.

En zo hangt alles keurig samen. Alleen de zwaargebaarde bok van Daan Zonderland heeft nog altijd geen antwoord, ook al gebruikt deze strofe het font Mathilde.

Posted in Uncategorized | Tagged , , , | Leave a comment

Autologie

cooccurrence

Posted in Uncategorized | Tagged | Leave a comment

Ter voorbereiding en ter navolging

Dankzij een bericht in e-data&research kwam ik terecht bij de database ‘Zieken- en begrafenisfondsen, weduwefondsen en levensverzekeringen in Nederland 1827-1880’ van onderzoeker Loes van der Valk. Daarmee werd opeens mijn lijst begraafplaatsen weer actueel. Laat ik bij het begin beginnen.

Begraafplaatsen
Scheveningen heeft een paar begraafplaatsen en een ervan draagt de naam ‘Ter navolging’. Voor wie ook behept is met een macaber soort humor: neen. De geschiedenis van ‘Ter navolging’ is te lezen op de website Dodenakkers.nl. Hierdoor geprikkeld ging ik op zoek naar meer begraafplaatsen met mooie, onverwachte namen. ‘Moscowa’ zal waarschijnlijk velen bekend zijn, maar ‘Huis Te Vraag’, ‘Onderlangs’ en ‘Stilleweer’?

Dat er treurbeuken staan bij de entrée van het ‘Boomkwekerskerkhof’, schenkt voldoening, en ook ‘Gods Akker’ spreekt tot de verbeelding. Het sluit bovendien aan bij het grote scala aan – historische – verwijzingen naar het landschap: onder de bomen, de hoge wal, de hoge boght, de driesprong, de walakker, overakker, de plantage, oud eik en duinen, den ouden dijck, burchtlaan, de sprakelberg, tiendweg. Opvallend vaak komt daarnaast de hof voor, veelal in natuursamenstellingen zoals dennen-, heide-, iepen-, lariks-, taxus-, wald- en wilgenhof, maar ook in ‘IJsselhof’ en ‘Oude torenhof’. Net als hof laten rust en vrede zich goed combineren, met elkaar en met de natuur: ‘Vredenhof’, ‘Vrederust’, ‘Rustoord’, ‘Rusthof’ en ‘Duinrust’. Met ‘Maria rust’ komen we bij de vele christelijke namen. Nogal wat begraafplaatsen zijn bijvoorbeeld genoemd naar heiligen zoals Andreas, Barbera, Bernulphus, … Plechelmus, Urbanus, Vitus en Willibrordus. Ook heten veel kerkhoven naar de kerk waaraan ze verbonden zijn.

Begrafenis- en uitvaartverenigingen
Heel af en toe is de naam van een begraafplaats een vermaning, zoals ‘Gedenk te sterven’, of wordt er een intentie (‘Onderlinge hulp’) mee uitgedrukt. Bij begrafenis- en uitvaartverenigingen zien we dit echter veel vaker. Hier vinden we onderlinge hulp, nut, bijstand, steun bij ziekte en vriendschap. Andere intenties zijn eendracht – al dan niet samen met liefde – hulp in nood en bij overlijden, evenals de nije naoberschap. De vermaningen liegen er bij de verenigingen niet om: naast ‘Gedenk te sterven’ horen we ook ‘Draagt elkanders lasten’ en ‘Eert uw doden’.

Verzekeringsfondsen
Alle genoemde namen zijn op dit moment in gebruik. Anders wordt het als we de database bekijken, die een overzicht geeft van meer dan duizend onderlinge en commerciële verzekeringsfondsen die tussen 1827 en 1880 in Nederland gefunctioneerd hebben. De oudste fondsen gaan zelfs terug tot de zestiende eeuw. Er zijn prachtige intenties bij, met namen die Heer Bommel en Bob Evers niet zouden misstaan:

  • Wij bedoelen het goede
  • Om zieken te laven en dooden te begraven
  • Liefde en mededeelzaamheid
  • Genot door voorzorg
  • Onderlinge voorzorg is nuttig
  • Eendracht maakt macht
  • Tot nut van ‘t algemeen
  • Rechten na plichten
  • Toeverlaat in tegenspoed
  • Onze leus is in gezonde dagen den zwakke hulpe toe te dragen

De vermaningen zijn wat grimmiger dan de intenties. Naast ‘Gedenk te sterven’ en ‘Draagt elkanders lasten’ vinden we hier:

  • Helpt u zelven (wat op gespannen voet lijkt te staan met alle bezworen eendracht en onderlingheid)
  • Men moet in voorspoed zaayen wil men in onspoed maaijen
  • Beschikt uwe huiszaken, want gij zult sterven (Jesaja 3:1)
  • Zorgt voor den dag, dien Gij niet beleeft
  • (Kortom:) Let op uw einde

Ook bij de fondsen ontbreken heiligen en gemeentenamen niet, maar wat de database vooral boeiend maakt, zijn de vele beroepen en maatschappelijke groeperingen die we niet meer kennen. Omdat het onderlinge fondsen zijn, staan deze vaak in de naam (ook de woorden “bus”, “bos” en “beurs” wijzen op een fonds):

  • Dordrechts Werkliedenverbond ‘Vooruitgang door beschaving’
  • Passementwerkers- en knoopmakersbus ‘Liefde vordert vlijt’
  • Zieken- en doodenbus van de beëdigde zakkendragers benedeneinde (straataanduiding in de plaats Utrecht)
  • Gereformeerd gestreept baaiwerkersbeurs (gestreept baai is een textielsoort)
  • Fonds voor de dek- en onderofficieren en mindere schepelingen bij ‘s Rijk[s] zeemacht
  • Scheepsoptuigersvereniging `Nog tijdig ontwaakt’

De bron van het onderdeel “Verzekeringsfondsen” is: L.A. van der Valk, Zieken- en begrafenisfondsen, weduwefondsen en levensverzekeringen in Nederland 1827-1880, http://resources.huygens.knaw.nl/verzekeringsfondsen. Hier staat onder meer een beschrijving van het onderzoeksproject waaruit deze gegevens voortkomen.

Posted in Uncategorized | Tagged , | Leave a comment

Van zelfcitatie tot zelffelicitatie

  • zelfcitatie: wat de econoom Nijkamp verweten wordt; niet “Zoals mijn goede vader zei…”
  • selfie-citatie: visuele vorm van een zelfcitatie
  • zelflicitatie: zelfbeoordeling; belangrijk voor “het merk Ik”
  • zelfelicitatie: situatie waarin men zichzelf informatie ontlokt
  • zelffelicitatie: gelukwens die men zichzelf doet toekomen: “Zo’n prachtige zelflicitatie is wel een zelffelicitatie waard.”

Observatie: er zijn meer zelfstandig naamwoorden dan werkwoorden die met “zelf” beginnen. Het Groene Boekje kent zelfs geen enkele infinitief met “zelf-”. Online vind je bijvoorbeeld zelfreflecteren, zelfsturen en zelfregelen, maar vaak zelfstandig gebruikt (zelfreflecteren is een kernvaardigheid), als onderdeel van een webadres of ten onrechte zonder spatie, bijvoorbeeld in door Google gescande boeken.

Oefening: maak een vergelijkbare keten op basis van “zelf kamperen” (Gerard van het Reve). Let op de klemtoon.

Posted in Uncategorized | Tagged | Leave a comment

Uitkomsten Groot Nederlands Taalonderzoek roepen vragen op

De resultaten van het Groot Nederlands Taalonderzoek naar de woordenkennis binnen het Nederlandse taalgebied zijn bekend, althans de momentopname van eind oktober 2013. Meedoen kan namelijk nog steeds; ongeveer vierhonderdduizend mensen gingen u voor.

Tegenover de animerende uitzending van het tv-programma Labyrint, met smeuïge zij het redelijk voorspelbare reacties van de mens op de straat, verschijnen blogposts op Onze Taal en Neder-L van enkele taalkundigen die de waarde van de resultaten in twijfel trekken. Onderzoeker Brysbaert onderscheidt in een interview in Open Taal taalkundigen nogal schematisch van psychologen – “als ik dat zo extreem mag stellen”. Nee, blijkbaar niet, en samen met de eerste beschrijving van de resultaten leidt dit tot kritische columns. Aan de vooravond van Kerst eindigt dit, geheel in stijl, met “Maar er is altijd hoop”.

Laat ik me in afwachting van nadere publicaties over de grote hoeveelheid testdata beperken tot een reflectie op mijn eerdere blogpost, geschreven nadat ik zelf de test had gedaan. Van de 70 bestaande woorden die in mijn testlijst voorkwamen, kunnen we nu nagaan hoe bekend (herkend) die zijn bij de deelnemende Nederlanders en Vlamingen. In de meeste gevallen gaan de beide regio’s ongeveer gelijk op. Hieronder staan de uitzonderingen (hoger = vaker als bestaand woord herkend). In het rapport hanteren de Gentse onderzoekers als criteria dat een woord typisch Zuid-Nederlands of Noord-Nederlands is als het door minstens 90% van de deelnemers gekend is in het het land zelf en er een verschil van minstens 10% is tussen de landen. Volgens deze criteria is afkleden (91,4% bekend bij Nederlanders en 60,4% bij Vlamingen) in “mijn” lijstje typisch noordelijk en ijsventer (respectievelijk 81,8% en 92,4%) typisch zuidelijk. (Over ijsventer heb ik destijds ook lang moeten nadenken.) Simpelweg een groot verschil, zoals bij leukweg, geldt niet.

Verder val ik in de groep “ambitieuzen”: de mensen die niet met één testje genoegen nemen. “Hoe hoger de initiële score hoe meer kans dat ze de test meerdere keren herhaalden, wellicht omdat ze een score van minimaal 80% wilden hebben.” Waarmee mijn vraag van vorige keer niet is beantwoord, maar mijn gedrag blijkbaar wel normaal is.

Posted in Uncategorized | Tagged | Leave a comment