Note: This thread is related to #COVID19.

Follow the World Health Organization's instructions to reduce your risk of infection. Avoid the three Cs: Crowded places, Close Contact Settings & Confined spaces. Airborne aerosols play an important role in transmitting COVID-19.

- Avoid crowded places and limit time in enclosed spaces

- Apply social distance

- Air rooms by opening windows & doors

- Keep hands and surfaces clean, cover coughs & sneezes

- Wear a mask when you are not at home or when physical distancing is not possible

Miguel Papineau ن
+ Your AuthorsArchive @parasynthetic 🐞🌾 • Lingüista, profesor universitario y traductor • También en @MariCorners • Me chiflan los idiomas y las morcillas en todas sus variantes. Él/He/Lui/αυτός Apr. 04, 2020 7 min read

Llevamos ya un mes escuchando a Pedro Sánchez hablar sobre el coronavirus, pero… ¿somos conscientes de las palabras que utiliza... y de si emplea las mismas cuando habla a la ciudadanía desde la Moncloa o a los diputados en el Congreso? (Macro)hilo de palabritas va:

Para este (limitado, tentativo, básico y a todas luces incompleto) análisis me he basado en los discursos que ha dado en las últimas semanas, relativos a la crisis del coronavirus.

En concreto, a sus comparecencias en Moncloa de los pasados 13, 14, 21, 22 y 28 de marzo (sin contar con las respuestas a la prensa) y a sus intervenciones en el Congreso de los Diputados del 18 y 25 del mismo mes.

¿Qué palabras aparecen más en los discursos de Pedro Sánchez? ¿En qué medida varían, dependiendo de si se dirige al conjunto del país o a sus compañeros y compañeras de hemiciclo? ¿Cómo las combina?

Para empezar, he buscado los sustantivos, adjetivos y verbos con mayor frecuencia absoluta en los discursos, y en todas las tablas he marcado en verde las unidades que coinciden en ambas listas:

Estos son los sustantivos más frecuentes de sus discursos:

Aquí tenéis los adjetivos:

Y, por último, los verbos (he eliminado del cómputo ser, estar, haber, tener, poder, hacer, poner, dar, ver e ir porque sus frecuencias eran tan aplastantes que distorsionaban los datos):

Solo con estas tres listas ya se puede empezar a apreciar diferencias significativas: el hincapié en lo europeo de los discursos desde Moncloa, que se esfuma en sede parlamentaria, el peso del calendario en las explicaciones para los ciudadanos...

... la manera en que lo “importante” en Moncloa se torna en “necesario” en el Congreso, que mientras para la gente “sufrir” es relevante, lo que importa en sede parlamentaria es “aprobar” y “dictar”…

Sin embargo, si nos centramos en las palabras clave, en la terminología más relevante, podremos sacar en limpio muchas más conclusiones, pero… ¿cómo saber qué palabras son las más “relevantes” de los discursos del presidente, independientemente de las veces que las utilice?

Muy sencillo: contrastando los discursos de Pdro con un corpus en español muchísimo más grande y muy representativo de la lengua, de tal manera que podamos apreciar qué palabras, en proporción, aparecen mucho más en los discursos presidenciales que en el conjunto de la lengua.

El corpus con el que he contrastado tanto los discursos dados en Moncloa (29.562 palabras) como los del Congreso (14.012 palabras) es el Spanish Web Corpus 2018 ( https://www.sketchengine.eu/estenten-spanish-corpus/ ) que supera los 17 billones de palabras. Vamos, que un poco representativo del español sí es.

Para contrastarlos de forma rápida e indolora he usado @SketchEngine , que es una maravilla de la vida. La fórmula matemática que se aplica para determinar el factor de relevancia con este programa la podéis ver aquí:  https://www.sketchengine.eu/documentation/simple-maths/ 

Estas son las palabras clave más relevantes de los discursos del presidente, según el contraste. En el caso de las de los discursos del Congreso he obviado “señoría” porque Pdro lo dice tooooodo el rato y chica, no aporta gran cosa:

Por otra parte, he combinado la búsqueda de esas palabras clave con la de sintagmas nominales de hasta cuatro elementos que también fueran relevantes:

Al introducir la variable “relevancia”, los resultados obtenidos se afinan, y observamos, por ejemplo, cómo los ertes que tan relevantes son en sede parlamentaria, apenas se mencionan en las comparecencias frente a la ciudadanía.

De hecho, no encontramos a los “ertes” hasta el puesto 74 de la lista de palabras clave de los discursos dados en Moncloa. ¿Qué otras diferencias entre discursos os resultan llamativas?

Por último, me he centrado en los tres términos clave con mayor relevancia en el conjunto de discursos, sin tener en cuenta el lugar en el que Pdro los pronunció: coronavirus, pandemia y confinamiento.

Nos consta, por desgracia, lo que estas palabras implican, pero la manera en que el presidente las inserta en el discurso, las palabras de las que las rodea... hacen que algunos matices de sus respectivos significados nos lleguen con mayor fuerza que otros. ¿Cuáles, en concreto?

Para responder a esta pregunta, he analizado qué palabras aparecen con más frecuencia cerca de coronavirus, pandemia y confinamiento en los discursos del presidente…

... y las he comparado con las que rondan a esas mismas palabras, pero en el Spanish Web Corpus 2018 (recordemos, 17 billones de palabras).

¿Queréis saber lo que me he encontrado?

Bueno pues... en vista de que os apetece que os siga contando qué me he encontrado en los discursos de Pdro… ¡continuamos!

Nos habíamos quedado en las cuestiones semánticas y contextuales ¿con qué palabras arropa el presidente a los térmiinos clave de sus discursos? ¿Qué conclusiones podemos sacar de su uso del léxico?

Para averiguarlo, he vuelto a contrastar el conjunto de discursos de Pedro con el Spanish Web Corpus. He empezado por "coronavirus", "pandemia" y "confinamiento", que ya sabemos que son las unidades más relevantes de sus discursos.

La variación en la combinatoria de "coronavirus" es clara: el presidente la arranca de los contextos médicos en los que se ha utilizado hasta el inicio de la crisis y la sumerge en un discurso mucho menos especializado. En terminología, ese proceso se conoce como banalización.

Ojito con el adjetivo "enemigo", que aparece bien pegadito a "coronavirus"... y no será la primera vez que nos topemos con él hoy

En el caso de "pandemia" también se aprecia una cierta banalización, pero sobre todo destaca la importancia del concepto para el presidente desde el punto de vista temporal (dia, semana...) y estadístico (curva no está ahí por casualidad).

Y si hablamos de "confinamiento", pues también vemos cómo el presidente a acotado su significado y, en cierto modo, lo ha "gubernamentalizado", al asociarlo con términos como "medida", "ministro", "presidente" o incluso "España"

Aparte de estos tres términos objetivamente relevantes, me he tomado la licencia de analizar algunos más porque mira, me apetecía.

"Crisis" es una palabra que todavía levanta ampollas en nuestro país, y quizá por eso Pdro se cuida muy mucho de pronunciarla, y cuando lo hace, la arropa de unidades con connotaciones bastante neutras... excepto nuestro querido "enemigo", claro.

El caso de "mascarilla" es un ejemplo perfecto de prevalencia de una acepción que, sin ser extraña, sí que es específica (la sanitaria) sobre la predominante en el uso diario (la cosmética).

Será interesante comprobar, dentro de un tiempo, la medida en que el sector de la belleza sigue utilizando esta palabra... ¿quedará "mascarilla" connotada negativamente tras esta crisis?

Ya hemos visto lo poco que le gusta a Pdro nombrar los ertes al dirigirse a la nación... pero es que además, cuando lo hace, digamos que se centra en que hay que agilizarlos y aprobarlos... y se olvida del malestar y la maraña burocrática que generan.

Por último, y aunque el bajo número de veces que aparece impide analizarla en profundidad, incluyo "teletrabajo" como ejemplo de palabra usada por Pedro Sánchez con variaciones mínimas en su matices con respecto a la tendencia general.

Tras analizar cómo entreteje Pdro las palabras que utiliza, os planteo una nueva variable: la diacrónica. Dicho de otro modo... ¿ha variado Pdro Sánchez las palabras que ha usado en sus discursos desde que empezó la crisis?

Pues sí: las palabras clave de sus discursos han ido variando, y es sorprendente ver cuáles van ganando en relevancia, cuáles la van perdiendo, cuáles ha tenido fogonazos de gloria para desaparecer después...

En esta tabla podéis ver las diez palabras clave de cada discurso del presidente. (Cuánto más roja esté una palabra, más relevante es en el conjunto de discursos en general).

Por cierto, para este análisis he añadido una intervención más: la que Pdro hizo tras el Consejo Europeo Extraordinario sobre el coronavirus del 10 de marzo. Porque esta crisis es española, sí, pero también europea, no lo olvidemos.

Se trata de una tabla que nos aporta muchas claves interesantes y claves curiosas: el aumento progresivo de terminología sanitaria a medida que avanzan los días, lo importante que era hacerlo todo "a rajatabla" las primeras semanas, los ministros que han ido teniendo peso...

Pero... ¿en qué medida ha ido variando la frecuencia con la que el presidente ha utilizado los términos más relevantes de sus discursos a lo largo de las últimas semanas?

He comprobado la proporción de veces que "coronavirus", "pandemia" y "confinamiento" aparecen en cada discurso dado por el presidente y...

... las trayectorias de cada uno de los términos nos dan dos claves principales:
1- Pdro dice cada vez menos "coronavirus" y cada vez más "pandemia"
2- Pdro no incluyó "confinamiento/confinar" en sus discursos hasta el 18 de marzo... y no parece gustarle demasiado.

Hasta aquí mi (breve, parcial, básico) análisis léxico de los discursos coronavíricos presidenciales. Los he descargado de la web de @desdelamoncloa, y los he analizado con @SketchEngine.

¿Qué datos os han llamado más la atención? 😉

Ahora que tengo tiempo (risas enlatadas) y me ha picado el gusanillo... ¿os apetecería que elaborara más hilos de este tipo?

Fe de erratas: el Spanish Web Corpus 2018 tiene diecisietemil millones de palabras, y no diecisiete billones. Que yo también, parezco nuevo confundiendo billion con billón 🤦‍♂️
Gracias por el apunte, @mathigaELE !


You can follow @parasynthetic.



Bookmark

____
Tip: mention @threader_app on a Twitter thread with the keyword “compile” to get a link to it.

Threader is an independent, ad-free project created by two developers. Our iOS Twitter client was featured as an App of the Day by Apple. Sign up today to compile, bookmark and archive your favorite threads.

Follow Threader