Models dinàmics i aprenentatge automàtic per a la sociologia del llenguatge

  1. Ernest Querol
  2. Mnauel Perucho
  3. Francisco Grimaldo
  4. Emilia Lòpez Iñesta
  5. Clara Miralles
Llibre:
VII Congrés Català de Sociologia i V Congrés Català de Joves Sociòlegs / Sociòlogues: llibre de resums de les sessions dels Grups de Treball

Editorial: Universitat Rovira i Virgili ; Associació Catalana de Sociologia ; Institut d'Estudis Catalans

ISBN: 978-84-8424-611-4

Any de publicació: 2017

Pàgines: 8

Congrés: Congrés Català de Joves sociòlegs /sociòlogues (5. 2017. Tarragona)

Tipus: Aportació congrés

Resum

Preguntes de recerca: A) És aplicable el model dinàmic de la desaparició de les llengües proposat el 2003 per Abrams i Strogatz a les dades demolingüístiques del País Valencià i de Catalunya de què disposem? B) Algun mètode d’aprenentatge automàtic (Machine Learning) ─que estudia la implementació de mètodes computacionals que permeten induir models de coneixement a partir d’informació que prové de dades d'exemple disponible‒millora la predicció del grau d'utilització de la llengua catalana aconseguida fins ara? MARC TEÒRIC: Les dues recerques s’inscriuen en l’anàlisi dels processos de substitució i de reversió lingüística. Les equacions diferencials ens permeten modelitzar els canvis produïts en una variable determinada pels canvis en algun paràmetre social rellevant i/o d’altres que hi estiguin lligats. Són una eina fonamental de la modelització de sistemes socials, com ja ho havien estat en la física a les darreries del segle XX. METODOLOGIA: A) Recerca inicial de la dinàmica de l’evolució del contacte de llengües al País Valencià i a Catalunya a partir de models matemàtics d’equacions diferencials. B) Tres mètodes de classificació supervisada: Naive Bayes, arbres de decisió i màquines de vector suport. RESULTATS: A) La tendència decreixent del nombre de parlants és confirmada al País Valencià, per contra, no es pot aplicar el model a Catalunya. B) La classificació supervisada pot servir per a construir models de predicció del grau d'ús del català amb un percentatge d'encert que supera els aconseguits en les investigacions precedents estudiades.