Het Project
Het doel van het project is het ontsluiten en centraal vastleggen van bronmateriaal uit archieven of andere bewaarplaatsen om daarmee identificatie en/of onderzoek naar scheepswrakken te ondersteunen door:
In het najaarsnummer van het Tijdschrift voor Zeegeschiedenis verschenen in 2025 is dit in een artikel nader toegelicht.
Het project is in een fase dat de eerste resultaten uit een drietal archieven gedeeld kunnen worden. Hiermee is het project niet afgerond. Naast deze drie archieven waarvan voor een tweetal de transcripties nog geladen moeten worden als deels ook de brondocumenten, zijn meerdere toegangen in diverse fasen van bewerking en onderzoek. Dit naast de lijst met nog te onderzoeken archieven (toegangen) of het toevoegen van gegevens over o.a. VOC schepen waarover reeds veel bekend is. Het is een goede basis om op voort te bouwen.
Model
Bij een scheepsongeval zal de informatie hierover zich veelal niet beperken tot één melding en bron. Om deze bronnen te kunnen koppelen wordt een masterrecord gecreëerd met een unieke identifier, het shipid. In het model is dit de eerste laag (id 1). Dit shipid wordt toegevoegd aan elk ander record om daarmee de informatie te clusteren. Tijdens de inventarisatie van een toegang naar meldingen over verongelukte en gestrande schepen wordt handmatig een index aangelegd met verwijzing naar het brondocument. Dit is de tweede laag (id 2) in het model. Deze indexen worden met elkaar vergeleken op scheepsnaam en de naam van de schipper om te komen tot de unieke lijst om als masterrecord te kunnen invoeren en het shipid te kunnen toevoegen. In een bron wordt lang niet altijd de scheepsnaam en de schipper vermeld. Door de indexen met elkaar te vergelijken kunnen veel brondocumenten aan elkaar worden gekoppeld maar dit zal niet 'foutloos' zijn. Niet in de laatste plaats doordat schrijfwijzen niet eenduidig zijn doordat namen fonetisch zijn opgeschreven of door het gebruik van verschillende talen. Indien dit voorkomt kan dit later gecorrigeerd worden. Als derde laag (id 3) in het model zijn de transcripties opgenomen met de analyse in entiteiten. Deze zijn in te zien middels de zoekpagina "Verongelukte en gestrande schepen".
Verongelukte en gestrande schepen
Op deze zoekpagina kan de bezoeker zoeken naar gegevens uit brondocumenten over verongelukte en gestrande schepen. Deze gegevens komen uit een drietal bronnen en betreft vooral handelsschepen. De informatie zal periodiek worden uitgebreid met gegevens uit andere bronnen. Dit kan gevolgd worden op de pagina met statistieken. Voor de wijze waarop de data tot stand is gekomen en voor een begrip van de niveau's ,de 'lagen', in dit model, verwijzen we naar hetgeen hierboven is beschreven en het genoemde artikel. Hieronder zijn de stappen in het geautomatiseerde proces schematisch weergegeven "Van archiefstuk naar Informatie". De bezoeker dient erzich veelal rekening mee te houden dat de resultaten van de transcripties (laag id 3) gebaseerd zijn op HTR technieken en analyse met taalmodellen die deze transcripties interpreteren. De gegevens op transcriptie niveau worden weergegeven op basis van hetgeen als HTR tekst ingevoerd is in de taalmodellen en hetgeen als resultaat hieruit is terugontvangen zonder 'correctieslagen'. Er is voor gekozen de analyse naar entiteiten te doen op basis van de oorspronkelijke tekst en niet op basis van de gemoderniseerde interpretatie om zo dicht mogelijk bij de oorsponkelijke tekst te blijven. Verder is het belangrijk te begrijpen dat we in ons model waar nodig en waar dit kan zoals bij o.a. notariele archieven, op basis van patroonherkenning getracht is complete akten te herkennen. Daar waar patroonherkenning minder goed is toe te passen of zeer specifiek zijn, kunnen meerdere akten zijn samengevoegd of is juist midden in een 'akte' afgebroken.
Hieronder wordt een korte toelichting gegeven op de huidige zoekmogelijkheden en opmerkingen gegeven bij diverse velden waar dit nodig is. Op de zoekpagina worden onder diverse inzichten gegeven met een aantal filtermogelijkheden.
De zoekpagina
De resultaten worden weergegeven in een standaardtabel die aangepast kan worden. Zo kunnen velden worden toegevoegd / verwijderd en de volgorde en breedte worden ingesteld. Zoeken in alle velden kan middels de zoekbalk op de hoofdpagina of per individueel veld of combinaties hiervan. Daarnaast kan er ook gefilterd worden in de kolommen van de tabel. Met het shipid kunnen records die behoren bij hetzelfde schip / schipper worden geselecteerd / gefilterd. Het is handig om een 2e tabblad met de zoekpagina te openen waar deze filter kan worden toegepast. Het ID geeft toegang tot een detailoverzicht met de onderliggende velden van het record. Op dit overzicht worden alleen velden getoond met een inhoud. Daar waar de link gevuld is kan het brondocument worden geopend bij de archiefinstelling. Met reset kan teruggegaan worden naar de begin instellingen.
De detailpagina
De detailpagina is ingedeeld in een aantal 'onderdelen'.
Het model geeft de mogelijkheid om verbanden te leggen tussen bv. perioden, schepen, personen, locaties, gebeurtenissen etc.. Voorbeelden zijn "1660 - 1670 + storm" , "peper + texel + margine" of "admiraal + tromp".
Deze data is opgeslagen in een cloudomgeving en toegankelijk gemaakt met elasticsearch. De gegevens zijn daarnaast opgeslagen in onze 'wrakkendatabase' (PHP) waar de mutaties en correcties plaatsvinden. In deze database staan ook nog wat extra velden die nog niet zijn toegevoegd aan deze omgeving. Het ligt in de bedoeling dit in een volgende fase wel te gaan doen en beide omgevingen automatisch te synchroniseren. Momenteel is dit nog niet het geval.