Fusió dels diccionaris enciclopèdics

26/09/2018
Publicat el 26/09/2018 per web-ec
Hem començat la refosa de tots els diccionaris enciclopèdics en un sol corpus “virtual”

El portal Enciclopèdia.cat té moltes obres i en tindrà cada vegada més. Allò que és bo a fi de poder disposar de més informació i de major profunditat alhora també pot representar algun problema.

El primer problema que es presenta és el de saber gestionar l’accés als continguts a fi que les consultes del portal siguin fàcils i n’obtinguem respostes el màxim d’acurades i precises. Les eines informàtiques ens ajuden a millorar aquest aspecte i de mica en mica hi anem introduint millores.

El segon problema que se’ns presenta recau en les obres que són semblants conceptualment i estructural. És el cas dels diccionaris enciclopèdics: Gran enciclopèdia catalana, Diccionari enciclopèdic de la literatura catalana, EsportpèdiaCat ― Enciclopèdia de l’esport català, Gran enciclopèdia de la música, Diccionari enciclopèdic del cinema a Catalunya i Diccionari enciclopèdic d’historiografia catalana.

Els articles de tots aquests diccionaris enciclopèdics tenen la mateixa estructura: encapçalament, definició, categoria gramatical, dades de naixement/mort, desenvolupament enciclopèdic, etc. No és estrany trobar-se amb entrades que apareixen en més d’una obra. Això mena a les situacions següents: articles amb una gran part de duplicació de continguts, articles amb informació contradictòria i articles amb nivells d’actualització diferent. Com a usuaris, patim el problema de no saber quin dels articles ens interessa més i com a editors veiem que és absurd haver de mantenir actualitzades dues o tres versions diferents d’una mateixa entrada, sobretot quan moltes vegades pot ser la mateixa informació.

Per tant, des que hem tornat de vacances hem començat la refosa de tots els diccionaris enciclopèdics en un sol corpus “virtual”. El criteri general que seguim és el següent: si una entrada (personatge, terme, institució, etc.) apareix en més d’una obra, les fusionem en una sola entrada i l’article resultant l’incloem a la Gran enciclopèdia catalana (GEC). Alhora, esborrem l’entrada a les altres obres.

El resultat final d’aquesta fase de treball, que s’allargarà uns mesos, serà que només tindrem una versió de cada entrada, que podrà estar a la GEC o bé a qualsevol de les altres obres més especialitzades. En paral·lel a aquest treball, farem que el cercador pugui cercar alhora en els diferents diccionaris enciclopèdics (talment com si fos una sola obra) i millorarem la gestió de les etiquetes de matèria. El pas lògic següent consistirà en fusionar físicament totes les obres sota una sola rúbrica: la Gran enciclopèdia catalana.