Er zijn meer gratis e-books dan je denkt
Sorry voor de schreeuwende illustratie, maar ik wilde graag eens reclame maken. Maar het schreeuwen dekt toch wel de lading, het gaat echt om e-books van nul euro. Kijk maar eens op de digitale bibliotheek voor de Nederlandse letteren. Ik heb geen verstand van copyright, maar in deze stoffige site staan tussen de middeleeuwse boeken ook nog moderne boeken, jawel, in “epub” formaat. Van Carmiggelt bijvoorbeeld, of van Maarten 't Hart. Die vind je bijvoorbeeld niet op Gutenberg.org. Waarom ze wel op deze site mogen staan, weet ik niet. Wellicht hebben de auteurs over hun hart gestreken en de teksten aan de Koninklijke Bibliotheek beschikbaar gesteld. De site is echter moeilijk doorzoekbaar en daarom zul je gauw e-books die er wel zijn, over het hoofd zien. Maar er is een alternatieve weg, om de juweeltjes er uit te halen.
Injectie
Carmiggelt las ik altijd al graag, en het is leuk dat ik er zo een aantal boeken van kan downloaden en lezen op mijn e-reader. Maarten 't Hart heeft ook erg mooie boeken geschreven. Mijn eerste was natuurlijk “Een vlucht regenwulpen”. Ik kan me herinneren dat ik in die tijd ook verbaasd was over het feit dat deze Maarten zich zo irriteerde aan het feminisme. Ook deze discussie kun je in dit archief herbeleven. Wat ik wel vervelend vind aan de site is dat je zo moeilijk kan zoeken. Op “'t Hart” zoeken lukt gewoon niet. Dat komt natuurlijk door die quote (') in de zoekterm.
Pas maar op dat je niet per vergissing als hacker opgepakt wordt wegens illegale sql-injection door dit gedoe met die quotes.
Alleen e-books
Maar ik zou graag bij het zoeken de selectie willen beperken tot boeken waarvan een e-book beschikbaar is. De digitale bibliotheek zal niet bedoeld zijn voor mensen zoals ik, die het leuk vinden om naar gratis e-books te zoeken, maar meer voor mensen die het doen voor de hoofdletter l van literatuur of de c van cultuur of, zeg maar de k van... Als ik dan op boekenjacht ben lijken de gepresenteerde resultaten niet echt consistent te zijn. Als ik bijvoorbeeld van Maarten 't Hart “De droomkoningin” zie, dan staat er dat er geen “epub” van aanwezig is. Maar als ik naar de informatie ga over dit boek door op de link te klikken, zie ik wel ineens dat er een “epub” van dit boek beschikbaar is. Hoe kan dit nou? Ah, je krijgt alleen de eerste druk te zien, en daar is kennelijk geen “epub”-versie van. Wel onhandig. Dit euvel zal vast het zoeken op aanwezigheid van e-books hinderen. Er is nu een optie om alleen e-books te tonen, maar hiermee kun je weer niet verder filteren op jaar of auteur. Wel kun je op bijvoorbeeld jaartal sorteren. Dat werkt wel aardig. Maar echt handig is het allemaal niet. Wellicht is deze site meer bedoeld om teksten te kunnen doorzoeken. Als je dát wil, dan is deze site heel handig.
Gul
Nu ben ik benieuwd wie van onze Nederlandse schrijvers er zo gul is geweest om een paar boeken aan het klootjesvolk beschikbaar te stellen. Wie zullen we eens proberen? Er zullen natuurlijk nog geen supernieuwe boeken staan, maar van oude of overleden auteurs wellicht wel. Reve? Die heeft wijselijk zijn naam veranderd van Gerard van het Reve naar Gerard Reve. Hij moet hebben geweten hoe de database van de koninklijke bibliotheek opgezet zou worden en willen vermijden dat men er Gerard van 't Reve van zou maken. Dat heeft hij jammer genoeg voor niets gedaan, want er staan geen werken van hem in de database die je kunt lezen in je browser of via een e-reader. Van W.F. Hermans zijn een paar boeken te downloaden, maar alleen als pdf. Je kunt ze ook lezen in de browser. Hier kwam ik ook een boek tegen dat beperkt toegankelijk is: je kunt het boek alleen doorzoeken. Voor “koopjesjagers” zoals ik is dat natuurlijk niet echt nuttig. Van Kees van Kooten had ik verwacht dat hij wel een paar boekjes beschikbaar had gesteld, maar ook dat is niet het geval. Wel is er een bloemlezing van alle “bescheurkalenders” te bekijken in het grote bescheurboek van Kees van Kooten en Wim de Bie. Volgens mij heb ik nog een echte bescheurkalender op zolder staan.
Eenentwintigste eeuw
Dan maar anders zoeken. Als je zoekt op beschikbare titels in de eenentwintigste eeuw, dan kom je een stuk verder. Je ziet dan meteen dat de schrijver Willem Oltmans (of zijn erven) graag zijn memoires die gaan over zijn jarenlange journalistieke strijd tegen de staat bekend maakt. Maar daarna al een poëzie-bundel, een prozaboek met foto's. Best leuk om te grasduinen. Je komt van alles tegen. Nico Dijkshoorn, Nienke Laverman, maar wel heel veel poëzieboeken. Wat minder proza, waarschijnlijk omdat de mensen dat nog moeten gaan kopen. Ook oude schrijvers die kennelijk nog “in” zijn vind je niet terug. Elsschot bijvoorbeeld, die had ik graag herlezen, omdat van het boek “Villa des Roses” ik indertijd gewoon niks begreep. Wat bijvoorbeeld “Noblesse oblige” betekende, hm, en misschien was het toen ook nog wel ironisch bedoeld. Dat kan ik helaas niet op deze manier controleren. Maar ik zie bij de meest recente boeken dat een schrijver als Hans Vervoort zijn boeken al gratis beschikbaar stelt, als er geen papieren versie meer in de winkel ligt. Ook op zijn website zijn deze e-books te vinden. Die boeken zijn toch ook niet de minste boeken die je zou kunnen lezen. Bedankt, Hans!
Privé-database
Eerlijk gezegd vind ik het zoeken op deze site erg onhandig. Je kunt niet op alle criteria zoeken, en een combinatie van filters is al helemaal niet mogelijk. Dat is jammer. Omdat ik het zoeken in de dgnl.org site erg vervelend vind, heb ik er voor mezelf een privé-database van gemaakt. Er is namelijk een pagina op de site met “alle titels” of “beschikbare titels”. Hier zie je dat je een titel-lijst van 257 pagina's kunt bekijken. Ik wil graag alle pagina's op mijn computer hebben. Het geautomatiseerd downloaden van verschillende webpagina's kan bijvoorbeeld met de handige tool cURL. Deze staat waarschijnlijk niet standaard op een windows machine. Wel vanaf windows 10 – 1803 heb ik gezien. Ik gebruik Linux en daarop LibreOffice. Dus in deze situatie probeer ik de boeken in een database (Base) van LibreOffice te krijgen. Misschien heb jij er ook wat aan. Het is natuurlijk een moment-opname van de site. Iedere maand komen er nieuwe boeken bij.
cURL
We kunnen alle pagina's van de titelsite op Dbnl.org in een bestand (boeken.txt) zetten met het volgende cURL commando:
curl "https://www.dbnl.org/titels/index.php?s=t&p=[1-257]" > boeken.txt
Daarna kun je uit dit bestand nog van alles filteren, omdat het zo groot is. Bijvoorbeeld haal alle regels met pdf of epub eruit en zet het in een nieuw bestand:
grep "pdf\|epub" boeken.txt > boeken_select.txt
Het commando “grep” is trouwens ook standaard in unix of linux aanwezig. Het is oeroud, maar erg krachtig. In windows moet je het nog installeren. Je kunt ook gewoon kijken of er “Download” in de regel voorkomt. Dat heb ik nu gedaan met:
grep "Download" boeken.txt > boeken_download.txt
Natuurlijk kan dat ook allemaal in een keer (niet getest):
curl "https://www.dbnl.org/titels/index.php?s=t&p=[1-257]" | grep "Download"> boeken.txt
Maar ik wilde graag het totale bestand houden, om er later nog eventueel iets mee te doen. Gebruik daarna een commandline-editor (bijvoorbeeld nano) om het bestand te bewerken. Andere, grafische teksteditors zijn te langzaam, omdat ze alles in een keer in het geheugen laden. Mocht je een dikke computer hebben en veel intern geheugen, dan kan dat geen kwaad. Maar ik heb een zes jaar oud bakje met 4 GB en een niet zo snelle processor. Dus... Voeg dan het volgende met deze editor toe aan het begin en eind van het bestand:
<table><tr><th>titel</th><th>druk</th><th>jaar</th><th>schrijver</th><th>genre</th></tr>
(...)
</table>
.
Dit gewijzigde bestand kun je vervolgens opslaan onder een andere naam met als extensie html. De titels (in th-tags) zijn van belang, omdat we er later een database van willen maken, en we moeten kunnen filteren op genre of titel in plaats van “Kolom E bevat de waarde 'proza' “, zoals je in een rekenvel zoals Calc of Excel gewend bent. Importeer de html in Calc. Deze maakt er een spreadsheet van. Dit duurt heel lang...Ga dus even wandelen met de hond, drink een kan koffie, of speel een beetje met je poes of partner. Als Office het heeft geconverteerd in een rekenvel, bewaar het dan meteen als een “open document” (ods). De links in dit rekenvel kun je aanklikken met <ctrl> click
, maar dat gaat niet werken.
De link die in het rekenvel staat moet je namelijk aanvullen met “https://www.dbnl.org" aan de voorkant. Als je wil dan kun je al deze links zo aanpassen met een zoek en vervang functie, zodat je meteen vanuit het rekenveld een boek kunt downloaden. Dit gaat mij wat te ver. Als ik een boek wil lezen en wil downloaden, dan zoek ik het wel even handmatig op de site. Als je met dit rekenvel goed kunt werken, dan hoef je geen database aan te maken en kun je het stukje tekst daarover overslaan.
Base
Als je gemakkelijk wilt kunnen filteren en zoeken, dan is een database handiger. Daarvoor kun je dan Base van LibreOffice opstarten en connectie maken met een nieuwe database van het type spreadsheet. Je gebruikt dan natuurlijk het spreadsheet dat je net hebt opgeslagen. Deze kun je daarna opslaan onder een nieuwe naam (.odb).
Zo, op deze manier is het zoeken wat gemakkelijker en je kunt meerdere filters opgeven.
Verstoppen
De site dbnl.org is een meester in het verstoppen van gratis e-books. Maar er zijn echt meer gratis boeken dan je denkt. Je moet ze dus weten te vinden met een beter zoekgereedschap. Maar ik ben overweldigd door het grote aantal boeken dat je zo kunt lezen. Wat een leuke site, qua inhoud!