Jan van Bakel.


Nota Computational Linguistics



(Was gericht aan de Faculteit der Letteren der KUN. JvB)

Terug naar hoofdmenu

 

Inhoud

  1. Begripsbepaling
  2. Gebruik van een computer bij taalwetenschappelijk werk
    1. Het praktische belang van de computer voor taalwetenschappelijk werk
    2. Het gebruik van de computer bij tekstanalyse en tekstdocumentatie
  3. Beleidskwesties
  4. Plan tot organisatie van een Vakgroep Computational Linguistics

Begripsbepaling

Onder computational linguistics wordt in deze nota verstaan: taalwetenschappelijk werk waarbij in meerdere of mindere mate gebruik wordt gemaakt van een elektronische rekenautomaat of computer. De computational linguistics kan op verschillende niveaus beoefend worden; van het laagste niveau van het tellen van verschijnselen tot het hoogste niveau van het simuleren van de grammatica van een natuurlijke taal en het met behulp daarvan analyseren of genereren van taalmateriaal.

Gebruik van een computer bij taalwetenschappelijk werk

Het valt buiten het bestek van deze nota een uitgebreid overzicht te geven van de toepassingsmogelijkheden van de computer in de taalwetenschap. Wij zullen volstaan met enkele aanduidingen. Ook zal niet getracht worden enigszins uitvoerig te verwijzen naar literatuur terzake. We verwijzen slechts in het algemeen naar het tijdschrift Computer Studies in the Humanities and Verbal Behaviour (Mouton) en naar de al betrekkelijk oude bibliografie bij Warren Plath, Mathematical Linguistics (in: Trends in European and American Linguistics 1930-1960, Spectrum 1961).

1. Het praktische belang van de computer voor taalwetenschappelijk werk

De expliciete wijze van formuleren die in de TG-grammatica wordt beoogd, nodigt bijna vanzelfsprekend uit tot een toetsing van de fomuleringen door computerale simulering. Het zal duidelijk zijn, dat bedoelde toetsing niet noodzakelijk is voor de theorievorming. Toch wijst de ervaring uit, dat simulatie in de machine vaak gebrekkigheden aan het licht brengt van de aanvankelijke, expliciet geachte formuleringen. Is de toetsing dus niet noodzakelijk, gewenst is ze zeker wel. Gewenst minstens ook hiervoor, dat men een oordeel krijgt over de mate waarin men in staat is zijn theoretische model te formaliseren en te expliciteren. Het werk met de computer is door zijn aard geschikt tot scholing in het expliciet formuleren en het maakt geformaliseerde uitspraken toetsbaar. Daarmee is de praktische betekenis aangeduid van het gebruik van de computer bij taaltheoretisch werk.

2. Het gebruik van de computer bij tekstanalyse en tekstdocumentatie

Veel meer dan voor theoretisch werk is het gebruik van de computer van belang voor analyse en documentatie van taalmateriaal. De mogelijkheden zijn zo groot, dat computerale verwerking van gegevens een noodzakelijkheid genoemd kan worden bij ieder onderzoek dat een enigszins omvangrijke verzameling van gegevens tot object heeft. Een kenmerk van een verzameling gegevens die voor computerale bewerking geschikt gemaakt zijn, is de variable ingang van die gegevens. Een kaartsysteem blijkt meestal onbruikbaar voor een later gerezen vraag; bij computeraal toegankelijk materiaal is dat inconvenient uitgesloten.

Beleidskwesties

De aanduiding van de toepassingsmogelijkheden van de computer in de taalwetenschap impliceert niet de rechtvaardiging van die toepassing. Gerechtvaardigd kan men de toepassing noemen, wanneer ze niet op zichzelf verwerpelijk is, in juiste verhouding staat tot het doel dat men zich gesteld heeft en zich niet ongunstig onderscheidt van eventuele andere wegen die tot het gestelde doel voeren. Alle vragen die in dit verband rijzen zouden beantwoord moeten zijn voor een volledig verantwoorde keuze van de computational linguistics.

Het kan niet de bedoeling zijn in een nota als deze de doelstelling de formuleren van de taalwetenschap of van het werk van de faculteit. Daarvoor zou o.a. een extern-wetenschappelijke motivering gegeven moeten worden, waaraan wel behoefte bestaat maar die in dit verband niet beproefd kan worden. Als we ons beperken tot een intern-wetenschappelijke motivering - waarvoor verwezen mag worden naar paragraaf 2 - en veronderstellen dat het gebruik van de computer niet op zichzelf verwerpelijk is, resten nog de implicaties van de keuze van computational linguistics voor andere bezigheden van de faculteit op het gebied van de taalwetenschap.

De beperktheid van de personele middelen van de faculteit houdt een beperking in van de activiteiten. Als men binnen de beperkte activiteiten de computational linguistics opvoert, doet men een keuze die andere mogelijkheden aantast. In dit opzicht is dus een prioriteitenkwestie aan de orde gesteld. Men moet daarbij evenwel in het oog houden, dat de ontwikkeling van de computational linguistics heel wel op iets langere termijn de voortgang van andere werkzaamheden, waarmee ze ogenschijnlijk in conflict of althans in concurrentie is, zou kunnen versnellen. Die mogelijkheid wordt vergroot, wanneer men de meest geschikte organisatievorm kiest; we komen daarop terug onder 4. Een ander punt van overweging moet zijn, dat voor de faculteit van letteren het moment van een principiële beleidskeuze misschien al voorbij is, doordat in verschillende afdelingen - zij het op beperkte schaal - reeds voor de computational linguistics gekozen is. In dat geval geldt de vraag, of die ontwikkeling moet worden gecoupeerd ofwel tijdig in goede banen geleid.

Plan tot organisatie van een Vakgroep Computational Linguistics

Bij het formuleren van een plan tot organisatie van een vakgroep computational linguistics gaan we uit van
1. de wenselijkheid van het beoefenen van de computational linguistics en
2. de feitelijkheid dat in verschillende afdelingen en secties van de faculteit al gewerkt wordt op het gebied van de computational linguistics.

Wij pleiten voor een organisatie in vakgroepsvorm, waarbij de grenzen tussen de verschillende secties en afdelingen zoals de faculteit die kent wat vervagen.

In verband met de bestaande schaarste aan personeelsplaatsen maar ook afgezien daarvan moet in de faculteit een doublering van werkzaamheden worden voorkomen. De horizontale immobiliteit van de staf heeft tot gevolg, dat bepaalde deskundigheden en kwaliteiten slechts ten nutte komen van studenten van die secties waar de deskundigheden en kwaliteiten toevallig gelocaliseerd zijn. In een discipline waar zulk een situatie kan worden voorkomen - doordat ze nog in haar beginfase verkeert - dient de faculteit daartoe strekkende maatregelen te nemen. Blijven zulke maatregelen achterwege, dan zal het gevolg zijn, niet dat er niet begonnen of verdergegaan wordt op het terrein van de computational linguistics, maar wel dat de onderzoeksresultatem door versnippering niet optimaal zullen zijn en dat aan andere disciplines meer concurrentie wordt aangedaan dan nodig is.

Een vraag die beantwoord moet worden is, of de faculteit de ontwikkeling van de computational linguistics, voor zover die reeds op gang is gekomen, wenst af te breken. Wij stellen voor, dat die ontwikkeling niet wordt gecoupeerd, maar daarentegen wordt bevorderd, evenwel in een organisatievorm die enerzijds de computational linguistics goede kansen biedt maar anderzijds de mogelijke schade voor anders gerichte onderzoekingen zo gering mogelijk doet zijn.

Daarvoor is nodig dat wordt overgegaan tot oprichting van een vakgroep computational linguistics. De vakgroep zou slechts in termen van activiteiten - en dus niet door zijn beheersvorm - een eenheid moeten zijn. De personen in de faculteit aan wie een taak in de vakgroep wordt opgedragen, moeten niet ophouden deel uit te maken van andere vakgroepen of secties. Het lidmaatschap van de vakgroep dient voor een bepaalde, beperkte tijdsduur te worden vastgelegd. Na afloop van die periode moeten de betroffen personen, in overleg met de betrokken instanties binnen de faculteit, hun werk kunnen continueren of afbreken. Over de werkzaamheden van de vakgroep dient naar buiten toe klaarheid te bestaan, wat gerealiseerd kan worden door op nader te bepalen wijze de resultaten van het werk toegankelijk te maken voor niet-leden, ook wanneer het niet komt tot afgeronde publicaties. Wij denken hierbij aan een archief waar referaten en scripties worden verzameld en aan openbare verslaggeving van geëntameerde onderzoekingen.

Voor een goed functioneren van de vakgroep dienen gedetailleerde afspraken gemaakt te worden met de afdelingen waar de leden andere werkzaamheden verrichten. Het dient duidelijk te zijn, voor welk gedeelte van de weektaak de bezigheden van de leden in de vakgroep computational linguistics liggen en in hoeverre zij daarnaast andere taken vervullen.

Een goed functioneren van de vakgroep zal ook eisen, dat er goede en geformaliseerde contacten worden gelegd met het Universitair Rekencentrum en met de mathematisch-statistische afdeling daarvan. O.a. voor programmeer-instructie is dat een noodzakelijkheid.

De faculteit dient uit te spreken dat bepaalde bezigheden van studenten in de vakgroep computational linguistics gewaardeerd worden als geldende voor een bijvak bij hun doctoraal examen.

Wij willen geen suggestie doen voor een bepaalde bemanning van de voorgestelde vakgroep. Het lijkt ons weinig functioneel wensen voor een bemanning te formuleren in termen van hoogleraar of lector of wetenschappelijk medewerker. De instelling van de vakgroep moet uiteraard inhouden dat bepaalde leden examineerbevoegdheid bezitten, waardoor de functionering bij examina gegarandeerd wordt.

Nijmegen, 7 september 1971
Instituut Nederlands
J. van Bakel.

Terug naar boven