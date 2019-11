La compra de datos móviles por parte del Instituto Nacional de Estadística a las tres grandes operadoras de España para elaborar sus próximas estadísticas es una muy buena noticia sí o sí. Los expertos coinciden en destacar que se trata de una muy buena práctica de una institución pública que está poniendo en valor la era del big data para minimizar costes.

¿Qué datos usará realmente el INE? ¿Por qué esto no debe preocuparnos? ¿Qué utilidades tendrán las nuevas estadísticas que salgan derivadas de estas informaciones? ¿Por qué esto supone un ahorro enorme de dinero y de tiempo? Y sobre todo... ¿por qué al pensar en la privacidad de nuestros datos de repente la gente se alarma porque el INE pague por datos agregados (nunca personalizados) en vez de enfocar el tema hacia la operadora que los vende que sería el verdadero debate en tal caso?

Con ayuda del subdirector general de Estadísticas Sociodemográficas del INE, Antonio Argüeso, que lidera este proyecto y las opiniones de varios expertos especializados en protección de datos y big data intentaremos responder a todas estas cuestiones. Puedes leer aquí el documento explicativo del propio INE.

¿Qué va a hacer exactamente el INE?

El Instituto Nacional de Estadística está realizando un estudio a partir de datos de nuestros teléfonos móviles (sólo datos nacionales) para incorporarlos a la información sobre movilidad que se ofrecía tradicionalmente en los Censos de Población y Viviendas. Así pues, el INE no pretende recabar información nueva (ya que estos mismos datos los conseguía vía cuestionario en los censos con preguntas concretas) sino utilizar una nueva herramienta más acorde con los tiempos para conseguir esos datos, que sería la información que le facilitarán las operadoras (Telefónica, Vodafone y Orange) de nuestros móviles. Reduciendo además los costes económicos y la carga de los hogares que dejarán de cumplimentar este tipo de cuestionarios.

¿Por qué no debemos preocuparnos? ¿Qué datos tendrá el INE?

Le preguntamos directamente al subdirector general de Estadísticas Sociodemográficas del INE, Antonio Argüeso, que lidera este proyecto. El estudio divide el territorio nacional en 3.220 celdas, cada una de ellas con al menos 5.000 residentes. Para cada celda, el INE recibirá información de los tres operadores de telefonía móvil de España sobre cuántos terminales se encuentran en dicha celda en varios momentos del día y cuántos se desplazan de una celda a otra.

Importante: los operadores no facilitarán nunca datos individuales sobre números de teléfono, ni sobre los titulares de las líneas, por lo que el INE en ningún caso podrá rastrear la posición de ningún terminal. "No es posible determinar comportamientos individuales de ningún tipo, ni anonimizados, ni no, porque solo se darán grandes cifras", dice Argüeso que destaca que ni siquiera se van a desvelar datos por operadoras, ya que siempre se van a tener cifras sumadas de todas ellas.

La información se limitará a tablas agregadas de resultados con un recuento de terminales por celda. De tal manera que, además de que el INE no pretende nada de esto, es materialmente imposible llegar a identificar personas y mucho menos determinar sus recorridos o sus comportamientos. Lo único que busca el INE es elaborar estadísticas sobre movilidad cotidiana o estacional de cierta entidad por el interés social que esto tiene.

El objetivo del INE es publicar los resultados del estudio, que obtendrá información de alrededor de 43 millones de dispositivos (el 80% del total que existen en España), antes de agosto de 2020, con los datos obtenidos los días 18, 19, 20 y 21 noviembre (todos laborables); 24 de noviembre (domingo); 25 de diciembre (festivo); 20 de julio, y 15 de agosto.

El INE lleva cuatro años trabajando en este proyecto con los operadores de telecomunicaciones y la Agencia de Protección de Datos les confirmó desde el principio que el proyecto cumple con toda la legislación en materia de privacidad. La misma Oficina Estadística de la Unión Europea (Eurostat) asegura que respeta plenamente la legalidad y esta cesión de datos es una práctica más común de lo que nos imaginamos que utilizan ciertos ayuntamientos y el mismo Ministerio de Fomento para mejorar sus servicios.

¿Qué utilidades tendrá esta estadística?

Definitivamente sí se pueden sacar datos útiles. Pero ojo que hay confusión con esto. "Hay gente que ha dicho, pues esto va a servir para poder poner una rotonda en tal sitio y no, no va de eso la cosa", explica Argüeso.

En este proyecto el INE analiza la movilidad de los españoles pero no se refiere a qué medio de transporte utiliza la gente, por qué carretera va o cuánto tiempo tarda en llegar. Nada más lejos. "Lo que mide esta estadística es lo que los ingleses denominan commuting o lo que es lo mismo, los desplazamientos cotidianos para ir de casa al trabajo o de casa al centro de estudios, pero no desde la perspectiva del recorrido que la gente realiza sino desde la perspectiva de dónde estudia o dónde trabaja y dónde vive. Simplemente. Para poder determinar hasta qué punto unas ciudades y otras están conectadas", puntualiza Argüeso.

¿Y esta información para qué sirve? Permite definir los mercados locales de trabajo a nivel de toda España y detectar cuáles son los focos a donde va la población a diario para trabajar/estudiar o cuáles son los focos de donde sale población a diario, desde el punto de vista del mercado de trabajo.

Y no, "el INE no va a ver puntitos de ningún tipo en un mapa", explica Argüeso. Lo que pretende es observar geográficamente la carga poblacional de cada zona. Un ejemplo: la información de las operadoras será que si en una provincia de Burgos suman 5.000 habitantes, pues en esta zona aunque por las noches haya 5.000 por la mañana solo hay 3.000, porque los otros 2.000 se han ido a trabajar a otro sitio.

"Con esto lo que se puede ver es qué zonas son ciudades dormitorio, a qué zonas va la gente a trabajar o a estudiar y con qué intensidad", dice Argüeso. ¿Y qué ocurre en zonas rurales? se pregunta. Todo esto puede ayudar a analizar las características de la España vacía.

¿Cuánto dinero se ahorrará?

El coste global del servicio contratado a los operadores se sitúa en torno a 500.000 euros frente a los más de 10 millones de euros que podría costar esta estadística con el método de elaboración tradicional (entre contratación de personal y planificación). En concreto el INE abonará 163.615,86 euros a Telefónica, 150.000 euros a Vodafone y 185.000 a Orange.

De hecho a las operadoras no se les paga por los datos, sino por un servicio que consiste en dar una información agregada concreta que les solicita el INE y que tienen que preparar específicamente para la institución, ya que no se incluye en sus servicios comerciales habituales en el campo de los datos.

Se trata de "un estudio pionero que va en la línea de lo que es el futuro de la estadística pública en España y en el mundo" en palabras de Argüeso. A los organismos de estadística se les demanda que no molesten a los ciudadanos mandándoles encuestas que cuesta mucho trabajo responder y por eso se está recurriendo a otros medios como los registros administrativos y otros medios privados.

El buen hacer del INE y el debate de la privacidad

¿Entonces por qué al pensar en la privacidad de nuestros datos de repente la gente se alarma porque el INE utilice datos agregados (nunca personalizados) en vez de enfocar el tema hacia la operadora que los vende que sería el verdadero debate? En este punto no habría ni siquiera que salvaguardar la privacidad de los usuarios porque lo único que se utilizan son datos generales. Sea como sea, Vodafone y Orange sí han permitido a sus usuarios negarse a que se usen sus datos para informaciones de terceros (consulte aquí cómo hacerlo). No así Telefónica, cuyos usuarios sólo podrían apagar el móvil, ponerlo en modo avión o no usar la red móvil sino el wifi.

"Si hay una institución que lleve manejando datos personales y sensibles desde hace años con calidad impoluta esta es el INE", comenta Daniel Ruiz Nodar

En opinión de Daniel Ruiz Nodar, profesor de Estadística de la Universitat Oberta de Catalunya (UOC) y CDO en Equifax Ibérica "la compra de datos del INE a las compañías telefónicas es, en realidad, una buena noticia" y recuerda que "el organismo ya está trabajando, para diferentes fines, en la explotación de otras fuentes de datos, como los procedentes de las principales cadenas de distribución, o datos generados a través de técnicas de web scrapping".

"Yo no acabo de entender la polémica. Es una muy buena práctica de una institución pública que está poniendo en valor la era del big data y todos los datos que hay en el mercado para minimizar costes y por ello nos tenemos que congratular todos", recuerda el experto. "Es muy buena señal que nos preocupemos todos por la privacidad de nuestros datos personales y yo creo que hay que defenderla. Dicho esto si hay una institución que lleve manejando datos personales y sensibles desde hace años con calidad impoluta esta es el INE. Se trata de la institución por antonomasia que con información confidencial elabora información pública y es un ejemplo de buenas prácticas históricamente", añade Ruiz Nodar.

"Cada usuario debería revisar su móvil. Entonces se daría cuenta de cuántas aplicaciones ya le están rastreando (cosa que el INE no hará)", dice de Juan-Creix

"Lo raro sería que el INE no trabajase con este tipo de datos porque eso sería prehistórico", afirma Sergio de Juan-Creix abogado experto en derecho digital y profesor colaborador de la Universitat Oberta de Catalunya (UOC). Nuestra sociedad es digital, vive del dato y el INE lo único que ha hecho ha sido evolucionar del mismo modo y utilizar los recursos de este tiempo en pro de sus objetivos estadísticos".

"En general vivimos en la economía del dato, y ahora estamos muy preocupados porque el INE va a obtener información nuestra, que es anónima, pero me gustaría que cada usuario revisase su teléfono móvil y entonces se daría cuenta de cuántas aplicaciones ya le están rastreando (cosa que el INE en ningún caso hará)", ha valorado.

El experto se pregunta ¿sería bueno que la operadora necesitase mi consentimiento para usar mis datos con terceros? "¿Entonces... nos vamos a oponer todos a que utilicen nuestros datos? Pues apaga y vámonos: se acabó la revolución digital", dice contundente de Juan-Creix. "Aunque este tipo de cosas también sirve de barómetro para ver que la población cada vez es más consciente con el tema de la privacidad y que de alguna forma, como sabemos que somos materia prima también queremos que se nos empodere de alguna forma, incluso se nos llegue a retribuir por ello, que ese es otro debate", añade.

"La gente no ha entendido el proyecto real del INE y se ha llegado a especular sobre si había acceso al dato de geolocalización de los terminales (cosa que no es cierta)", comenta Eduard Blasi

Eduard Blasi es profesor del postgrado de protección de datos de la UOC. En su opinión "el problema viene de que la gente no ha entendido el proyecto real del INE". "Se ha llegado a especular sobre si había acceso al dato de geolocalización de los terminales, (cosa que el INE ha negado varias veces con rotundidad con comunicados) y si mezclas esto con la cantidad de información que tienen las teleoperadoras de sus clientes puede desembocar en alarma social".

Sea como sea, esto viene de leer informaciones sesgadas y no haber entendido en qué consiste la operación real del INE. Blasi recuerda que efectivamente este estudio no es nuevo y la gente no se alarmaba, lo único que ha cambiado es el canal, la herramienta con la que se accede a los datos.