de Maia Güell y Sevi Rodríguez-Mora

Se habla recurrentemente de una vertiente étnica del conflicto político catalán, normalmente evaluando etnicidad mediante la fonética de los apellidos. Dada la envenenada situación política parece útil mirar atentamente a los datos y discernir cuánto de verdad hay en ello. A tal fin creemos conveniente referirnos a un reciente artículo de investigación[1] en el que desarrollamos una metodología de uso de apellidos para medir la evolución de la movilidad social intergeneracional (la probabilidad que un hijo de pobres acabe rico y viceversa), teniendo en cuenta aspectos étnicos y socioeconómicos. Todo ello con datos catalanes.


Movilidad Social
Medir la evolución de la movilidad intergeneracional es difícil, pues raramente existen datos que relacionen a los miembros de varias generaciones para un conjunto estadísticamente representativo de familias. Nuestro trabajo supera este problema usando los apellidos como marcador del historial de cada familia.
Nuestro método mide la movilidad social, que es un fenómeno intrínsecamente dinámico, observando únicamente una foto estática de la sociedad. Lo podemos hacer porque los efectos dinámicos imprimen trazas reconocibles en la foto, igual que cuanto más rápido va el coche, más movida sale la foto.
Se basa en que cuanto mayor sea la incidencia de las cosas heredadas sobre el bienestar de los individuos (cuanto menor sea la movilidad social), más importante es lo que los miembros de una familia tienen en común (su herencia) frente a las vicisitudes e imponderables de la vida. Consecuentemente, a menor movilidad, más se parecen entre sí la renta y educación de los miembros de una familia con respecto a un conjunto de individuos escogidos al azar. Si supiéramos los grados de parentesco entre los miembros de una población sería fácil determinar el nivel de movilidad. Desconocemos esos parentescos, pero conocemos sus apellidos.
No es que tener un apellido en concreto te haga rico o pobre, pero el apellido se hereda junto con otras características familiares que sí son realmente importantes para el futuro bienestar de los hijos, como puedan ser los genes, la riqueza, el nivel educativo, la etnicidad o el patrimonio cultural de los padres. En el artículo demostramos que la distribución de apellidos de una población establece una partición que es informativa sobre el grado de parentesco, estableciendo una relación directa entre el contenido informativo de los apellidos (cuánto más parecida es la educación y/o renta de las personas que comparten apellido versus el de gente escogida al azar) con el nivel de movilidad intergeneracional: a menos movilidad, más informa un apellido de las características de quien lo posee.
Algunos apellidos son muy frecuentes, y por lo tanto las personas que los comparten tienen poca probabilidad de ser familia, de ellos no podemos obtener información. Sin embargo, muchísimos apellidos son muy poco frecuentes. Dos personas que comparten uno de esos apellidos tienen una alta probabilidad de ser familia. Cuanto mayor sea la incidencia de las variables heredadas (más baja la movilidad social) más parecido será el nivel de educación de los que comparten ese apellido poco frecuente con respecto a cuán parecidos son el nivel de educación de dos personas escogidas al azar: la cantidad de información que tiene el apellido es alta.
Definimos el contenido informativo de lo apellidos (Informational content of surnames, ICS) como[2] el R^2 de una regresión del nivel de educación de cada individuo sobre una dummy para cada apellido. Es una medida de cuánto más sabemos acerca de una persona por el hecho de conocer su apellido.
Desarrollamos entonces un modelo cuya variable endógena de interés es la distribución conjunta de rentas y apellidos y donde las variables exógenas son dos: (1) un proceso de generación de outcomes (renta, educación o lo que sea), que viene en parte determinado por la importancia de la herencia. Y (2) un proceso[3] de generación y destrucción de apellidos (la destrucción sucede cuando muere el último varón con el apellido sin descendencia masculina, y la creación por mutaciones aleatorias).
El principal resultado metodológico del paper es demostrar que invariablemente cuanto mayor sea la importancia de la herencia en el proceso de generación de “rentas”, mayor será el ICS que observaremos en la economía. Así, mirar la evolución del ICS a través del tiempo en una sociedad nos dice si la importancia de las cosas heredadas ha decrecido o aumentado en el tiempo.

Etnicidad
Tu apellido no sólo tiene información sobre el nivel de educación de tu familia, también de su etnicidad. Si, por el motivo que fuere, la etnicidad afectase directamente el nivel de educación de las personas (independientemente de la educación de sus padres) nos gustaría distinguir entre los dos efectos. Afortunadamente es fácil usando los apellidos incluso si no tenemos información directa sobre la etnicidad de las personas.
Definimos la "catalanidad" de un apellido como el porcentaje de españoles con ese apellido que habitan en Cataluña.
SR1
Un apellido que es tan común en Cataluña como en el resto de España tiene un valor de 0.16 (el porcentaje de la población catalana en el total de España). Uno que es relativamente poco común en Cataluña tiene un valor más pequeño, y uno que es mucho más común en Cataluña (relativamente al resto de España) tiene un valor mayor. Si todos los españoles con ese apellido viven en Cataluña, su valor es 1.
El censo indica la provincia de nacimiento y el nivel de conocimiento del idioma catalán. En el artículo demostramos que la catalanidad del apellido es un excelente predictor de ambas variables, lo que sugiere que es una buena proxy de etnicidad.
Por ejemplo, en el siguiente gráfico, el panel (a) muestra cómo la “catalanidad” del apellido se correlaciona con la probabilidad de contestar que se conoce bien el idioma catalán para la cohorte de individuos que nacidos en la comarca de Barcelona entre 1945 y 1950, y (b) a la probabilidad de haber nacido en Cataluña para la cohorte nacida entre 1935 y 1940.
sr2
La etnicidad, como la renta, es algo que se hereda parcialmente (de hecho cuánto se hereda depende del nivel de emparejamiento selectivo, más sobre eso en un rato), y que por lo tanto afecta a la herencia y al nivel de movilidad social.
Nuestro objetivo es primero medir la evolución de la movilidad social en Cataluña en total (sin diferenciar en cuánto se debe a la educación de los padres y cuánto a la etnicidad de los padres) y a continuación medir la evolución de los efectos de la educación paterna y de la “etnia” separadamente
Evolución de la movilidad social y sus componentes en Cataluña
Primero medimos la evolución del ICS total sin condicionar entre efectos familiares y étnicos. De hecho esto es lo que es en realidad movilidad social, dado que tanto la etnicidad como las condiciones familiares son heredables. Encontramos que en Cataluña ha habido un aumento de la cantidad de información que contienen los apellidos en las últimas generaciones, altamente sugerente de una caída secular de la movilidad intergeneracional.
El siguiente gráfico muestra cuánta información sobre la educación de una persona contiene su primer apellido (ICS) para una “moving average” de todas las cohortes de población el año 2000. El punto de la izquierda es el ICS de los que tenían entre 75 y 100 años, el siguiente el de los de 70 y 95, y así sucesivamente.[4]
sr3
Saber el apellido de una persona informa más (mucho más) de la educación de un joven que de la educación de un viejo (relativamente a sus respectivas cohortes). Esto es porque las cosas heredables son más importantes para la determinación de la renta de los jóvenes que de los viejos. La movilidad social ha caído de forma secular en Cataluña.
Ahora bien, no sabemos si es porque importa más la educación de tu padre o el idioma que hablabais en casa, porque lo que está claro es que el grupo etnolingüístico importa. Las familias catalano-parlantes están en términos medios sustancialmente más educadas. Un aumento de una desviación estándar del grado de catalanidad implica en términos medios seis meses más de educación si no controlamos por la renta familiar y cuatro meses más si controlamos por ella.
Podemos entonces medir por separando la evolución del componente étnico (origen familiar catalán medido a través de la catalanidad del apellido) del componente familiar (dos familias con igual etnicidad pero distintos niveles de renta o educación)[5].
Observamos que la incidencia de ambos ha aumentado en el tiempo. Es decir, no sólo importa más el tipo de familia de la que provienes (independientemente de tu etnicidad), sino que el valor de tener una etnicidad “más catalana” es hoy en día mayor que hace una o dos generaciones.
El panel (a) dibuja el valor del ICS del primer apellido condicionando por el índice de catalanidad del segundo para todas las cohortes. Nos indica que el nivel de educación de tu familia es más y más importante en la determinación de la tuya a medida que avanza el tiempo independientemente del idioma que hablas en casa.
Por ejemplo, comparamos por un lado dos jóvenes con el mismo grado de catalanidad, y por el otro dos viejos (otra vez con el mismo grado de catalanidad). La posición relativa de los dos jóvenes estará mucho más afectada por la educación de sus padres que la de los viejos.
El panel (b) dibuja el valor del parámetro que determina la incidencia del grado de “catalanidad” condicionando por la educación familiar. Tener un apellido más catalán le “regala” más años de educación a un joven de lo que le “regalaba” a un viejo. Consideremos dos familias con el mismo nivel educativo, pero una “más catalana” que la otra. Si son jóvenes la diferencia esperada en el nivel de educación de los hijos es mayor que si son viejos.
sr4
Emparejamiento selectivo
Hasta ahora no hemos dicho porqué la movilidad ha bajado, sólo hemos dicho que lo ha hecho, y en general es algo muy difícil de dilucidar. Sin embargo, la convención española de apellidos (esa idea maravillosa de mantener el de papá y el de mamá para toda la vida) nos permite observar un evento capaz de explicar todo lo anterior.
Primero tenemos que notar que una de las cosas que pueden hacer disminuir la movilidad intergeneracional es un aumento del emparejamiento selectivo. Para que sea así basta que tanto mamá como papá influencien al niño. Si hay emparejamiento muy selectivo las parejas de arriba tienen tanto a la mamá como al papá influyendo uy positivamente, y las de abajo mucho menos. Pero si hay poca selección las dos parejas se parecen más. Además, en el aspecto étnico si hay poco emparejamiento selectivo, la propia etnicidad se diluye rápidamente. Sólo con emparejamiento selectivo se puede mantener una variable étnica identificable, y por lo tanto sus efectos sobre renta o educación.
Lo que podemos hacer es analizar cuán parecidos eran el padre (primer apellido) y madre (segundo apellido) de cada persona en términos tanto de la educación como de su etnicidad que tales apellidos indican. Encontramos que a lo largo del siglo XX en Cataluña los individuos se casan cada vez más selectivamente tanto en términos educativos (las universitarias se casan más con los universitarios), como en términos de origen regional (las de origen catalán se casan más con los de origen catalán). Por lo tanto, el descenso de la movilidad intergeneracional que encontramos se debe muy posiblemente al susodicho aumento en el emparejamiento selectivo: hay más que heredar.
En el gráfico la línea roja dibuja la correlación del grado de catalanidad de primer y segundo apellido de los nacidos en cada una de las cohortes, y la línea azul la correlación de la educación media de cada apellido. Nótese que esto es información del grado de emparejamiento selectivo de los padres de esas personas. Es decir que este aumento del emparejamiento selectivo sucedió una generación antes de la caída de la movilidad que documentamos... causándola.
sr5
Manifestación Política de las asimetrías socio-culturales
Muy bien, ahora nos re-enfocamos en el aspecto étnico, que es del que se habla mucho, pero entre susurros. A la luz de lo visto parece concluyente que en Cataluña hay una sustancial heterogeneidad etnolingüística que se traduce en diferencias estadísticas en educación (y probablemente renta) que han aumentado a través del tiempo. Muy probablemente al menos en parte esto sea consecuencia de un aumento secular en el emparejamiento selectivo tanto en la dimensión socioeconómica (los ricos con los ricos), como en la dimensión étnica (los más catalanes con las más catalanas). Al menos hasta donde nos llegan los datos.
De hecho si hay algo que caracteriza la morfología social catalana es precisamente esta heterogeneidad.
Dado cómo está el patio, y aunque nuestra investigación publicada no lo estudie directamente, parece interesante preguntarse si esta asimetría cultural y económica tiene una manifestación política en Cataluña.
Obviamente, es un tema desagradable del que nadie quiere hablar... y sin embargo un repaso superficial tanto a la distribución de apellidos de los miembros destacados de las distintas corrientes políticas como a la geografía de la distribución del voto parecen enormemente sugerente de que tal puede ser el caso. Nosotros no podemos entrar en detalle en el tema (para eso deberíamos ver cómo la componente étnica afecta diferencialmente de la de educación al comportamiento electoral), pero podemos mirar a un aspecto sorprendente de la estructura política catalana que probablemente no es independiente del devenir político.
En un extraordinario libro[6], imprescindible para entender siquiera un poquito la aparentemente surreal política catalana, el politólogo de Cambridge Thomas Jeffrey Miley comparaba hace unos diez años los parámetros socio-económicos y culturales de las élites catalanas con los de la población en general, encontrando un aterrador abismo. Las élites son muy parecidas a lo que él llama la “comunidad etnolingüística” catalano-parlante y en absoluto se parecen a la castellano-parlante.
Usando nuestra metodología atestiguamos que esto no ha cambiado. El índice de catalanidad medio de los apellidos de todos los catalanes es 0.37. Si lo comparamos con el de los miembros del Govern (0.59), los altos cargos de la Generalitat (0.59), los miembros del CATN[7] o todos los miembros del parlamento (0.55), resulta evidente que en un sentido estadístico las élites son mucho más “catalanas” que la población de Cataluña. Ni de lejos la representan. Es el mismo resultado que Miley: en términos políticos sólo existe un grupo cultural en Cataluña.
sr6

Así, la evidencia indica que en Cataluña coexisten (i) profundas y crecientes divisiones socioeconómicas asociadas a la diversidad etnolingüística, y (ii) estructuras políticas que, por el motivo que fuere, resultan en una masiva sobre-representación del grupo social dominante.
Food for thought.

[1] Maia Güell, José V. Rodríguez Mora y Christopher I. Telmer “The Informational Content of Surnames, the Evolution of Intergenerational Mobility, and Assortative Mating” Review of Economic Studies (2015) 82 (2): 693-735, 2014doi:10.1093/restud/rdu041
[2] En realidad es un poco más complicado pero esto captura a esencia. Por favor, id al peper para los detalles.
[3] El modelo es equivalente a un modelo de herencia genético sin selección natural (de ADN que no codifica proteínas).
[4] Nuestro universo son todos los varones mayores de 25 años nacidos en España con residencia en Cataluña el año 2001.
[5] Usamos el primer apellido como proxi de la educación familiar y el segundo como proxi de catalanidad, pero los resultados son los mismos si lo hacemos al revés o con otras combinaciones.
[6]“Nacionalismo y política lingüística: El caso de Cataluña”. Madrid, Centro de Estudios Políticos y Constitucionales, 2006
[7] Consell Assessor per a la “Transició” Nacional

http://nadaesgratis.es/admin/de-los-apellidos-catalanes

Recomiendo un vistazo a la bibliografía reciente:
"Footprints of Middle Ages Kingdoms Are Still Visible in the Contemporary Surname Structure of Spain"
http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0121472