Lado B
Twitter, área emergente para la investigación científica
Exploran qué tanto se tuitea en México y el mundo respecto a ciencia a través de minería de datos o minería textual
Por Lado B @ladobemx
27 de julio, 2016
Comparte
Yureli Cacho Carranza | Conacyt Prensa

@conacytprensa

Si bien el origen de la red social Twitter obedece a la informalidad, como en su momento expresó Jack Dorsey, uno de sus fundadores, el objetivo consistió en que fuera una ráfaga de información intrascendente que, a través de mensajes breves, permitiera comunicar a otros lo que se estaba haciendo y de esta manera «sentirse menos solo”, como afirmaría Noah Glass, otro de los creadores, al periodista Nick Bilton para su libro La verdadera historia de Twitter. En la actualidad, la enorme cantidad de tuits que circulan por la red constituye un campo de investigación que abarca diferentes tópicos, comportamientos y formas de pensar.

HEAD twitter2616

“Actualmente se transmiten alrededor de 500 millones de mensajes digitales diarios por medio de Twitter, red que alberga a 200 millones de usuarios regulares, lo que representa un flujo de información interminable, útil para interpretar el devenir de comunidades nacionales e internacionales”, afirmó el doctor en ciencias de la computación por la universidad británica de Essex, Carlos Adolfo Piña García, quien realiza una estancia posdoctoral en el Departamento de Ciencias de la Computación del Instituto de Investigaciones en Matemáticas Aplicadas y de Sistemas de la Universidad Nacional Autónoma de México (IIMAS-UNAM).

El especialista se dio a la tarea de explorar qué tanto se tuitea en México y el mundo respecto a ciencia, junto con el doctor en filosofía de la biología, Jesús Mario Siqueiros García, investigador del Laboratorio de Redes en el Departamento de Modelación Matemática de Sistemas Sociales del IIMAS, y el líder del Laboratorio de Sistemas Auto-organizantes en el IIMAS, investigador del Centro de Ciencias de la Complejidad (C3) y miembro nivel I del Sistema Nacional de Investigadores (SNI), Carlos Gershenson García.

“Todos los días se almacenan en Twitter datos en abundancia que se relacionan con ciencias sociales, los cuales vale mucho la pena analizar y aunque no toda la información es provechosa, hay otra con un interesante potencial capaz de proporcionar resultados sorprendentes en temas de salud, medio ambiente, cambio climático, ecología, agua, violencia, etcétera. Además de que la cantidad de conclusiones que pueden obtenerse a raíz de encuestas de muestreo por ejemplo, es ínfima en comparación con las que puede arrojar la recopilación de enunciados cortos a partir de esta red social”, refirió el etnólogo Mario Siqueiros García.

Procedimiento de la investigación

Conferencia en Aldea Digital 2016

Para conocer más acerca del tema, este 28 de julio en punto de las 12:00 horas, el doctor Carlos Piña García estará en el auditorio principal de la Aldea Digital.

Asimismo, puede escuchar o visualizar la entrevista que Mario Siqueiros y Carlos Piña concedieron a Radio con Ciencia y Tele con Ciencia.

Logo TELEconciencia

De acuerdo con Carlos Piña, cuya principal área de estudio es la recolección y análisis de lo que se difunde en redes sociales, así como el uso de datos abiertos y respectiva visualización, Twitter es una herramienta muy significativa en el momento de querer identificar patrones de movilidad y actividad a nivel mundial, “sobre todo cuando los tuits que se estudian son geolocalizables, es decir, emanan de dispositivos que cuentan con sistema de localización o posicionamiento global (GPS, por sus siglas en inglés), lo que permite rastrear la ubicación y obtener las coordenadas del lugar donde se genera el tuit”.

Mediante exploraciones de prueba y error, se mina la información para delimitar el flujo tan masivo que se genera diariamente y hacer así un “barrido o curación” de los datos, mencionó el investigador Carlos Piña.

La minería de datos o minería textual son ramas de la estadística con las que es posible extraer grandes volúmenes de información y por medio del razonamiento matemático o la lingüística computacional, interpretarla para que sea identificable, comprensible y pueda utilizarse, define el presidente de la Asociación Mexicana de Estadística (AME), Gabriel Arcángel Rodríguez Yam.

Sin embargo, para la limpieza de datos en Twitter, aún no hay un algoritmo o metodología que ayude a depurar la información. “Al igual que nosotros, grupos y laboratorios de investigación en el mundo lo hacen como mejor pueden. El solo acendramiento de los datos conlleva cerca de 80 por ciento del periodo que requiere cualquier investigación que utiliza Twitter como fuente principal, porque la mayoría de los textos son basura o escritos por bots”, informó Carlos Piña.

Los bots son programas informáticos que hacen las veces del comportamiento humano; son autónomos, perpetuos, algunos tienen inteligencia artificial y son capaces de tuitear diaria, mensual o anualmente. “Los cíborgs en cambio, son mitad bot y la otra mitad la manejan instituciones o empresas, lo que hace más difícil todavía su identificación porque lo que buscamos es únicamente gente que tuitee en tiempo real”, explicó Carlos Piña.

Dada su capacidad de tuitear, retuitear, obtener seguidores y seguir a otros; los bots representan un tema de investigación aparte. Identificarlos ha sido todo un reto y demasiado trabajo para los tres investigadores porque existen los que retuitean hasta mil veces al día y los que realmente fungen como seres humanos. “Nuestra metodología ha sido básicamente desarrollar un script —programa sencillo que ejecuta órdenes o tareas muy específicas—, el cual monitorea la información diaria que fluye a través de Twitter y en el momento que capta tuits con la palabra o palabras clave que elegimos, los almacena en un archivo que después revisamos y depuramos manualmente”, añadió el también experto en inteligencia artificial, Carlos Piña.

Mario Siqueiros García considera que estudiar el flujo de información que emerge de comportamientos individuales y analizar la dinámica de ciertos tuits, como por qué unos son tan retuiteados, por qué otros menos, la postura que dejan ver los usuarios ante determinados aspectos y demás, permite determinar metodologías o aproximaciones para investigar fenómenos y enfoques de la web desde el punto de vista sociológico.

“Monitorear y medir la empatía de las interacciones que se dan entre usuarios de Twitter, las tendencias que se originan, así como el impacto de algunos líderes de opinión, o no, en el resto de los tuiteros, además de la formación de comunidades virtuales, nos permite estudiar patrones que emanan de Twitter para saber qué tantos tuits genera México, cuánto retuiteamos, hasta dónde nos involucramos y producimos contenido de calidad o si, tal como se definió desde su origen, constituye un mecanismo de paso”, aludió Carlos Piña García.

Los doctores Piña, Siqueiros y Gershenson buscan orientar su trabajo hacia diversas temáticas de interés enmarcadas dentro de áreas como psicología, sociología, filosofía, ciencias de la computación, etcétera. No obstante y pese a rastrear cerca de 500 tuits diarios, el tema de la geolocalización es en sumo complicado porque solo uno por ciento de los tuiteros comparte sus coordenadas geográficas, lo que ha dificultado arrojar resultados contundentes acerca del sentir de la gente en temas como la contingencia ambiental por ejemplo.

“Empero, la información que hemos recopilado es susceptible de interpretarse y proporcionar una opinión generalizada, en virtud de que Twitter funciona como una especie de sensor social de las grandes urbes que favorece el registro de la opinión pública; por decir malos o buenos hábitos en materia de salud. Adicionalmente, queremos que la UNAM sea punta de lanza en este tipo de investigaciones ya realizadas por otros países y tanto México como la UNAM no se pueden quedar atrás”, manifestó Carlos Piña.

Divulgación de la ciencia a través de Twitter

Como se mencionó, el primer estudio llevado a cabo por los investigadores del IIMAS se refiere a la exploración y recopilación de tuits relacionados con ciencia. Durante 92 días obtuvieron más de 300 mil tuits que al limpiar derivaron en 200 mil y cuya muestra depurada comprendió cerca de 130 mil tuits geolocalizados en 192 territorios. Sin embargo, solamente mil tuits tuvieron una estricta vinculación con la ciencia, cifra no tan representativa para que pueda catalogarse como un estudio formal, aunque los entrevistados consideran que se trata de un primer vistazo hacia el comportamiento mundial o local del tema.

Imagen cortesía de los investigadores, publicada enKomputer SapiensEl número de tuits que se generan es tan grande que afecta significativamente la toma de la muestra, porque para estudiar correctamente el enlace entre tuits y ciencia son necesarios muchos filtros y depuraciones, aclararon.

Numero de tuits realizados mediante los dispositivos moviles mas utilizados conforme a la muestra 2616Numero de tuits realizados mediante los dispositivos moviles mas utilizados conforme a la muestra. Imagen cortesía de los investigadores, publicada en Komputer Sapiens.“120 términos fueron nuestras palabras clave; además de ciencia, neurociencia, biotecnología, nanotecnología, sistemas complejos, ciencias de la computación, inteligencia y vida artificial, biomedicina, matemáticas, física, Conacyt, nombres de publicaciones y editoriales científicas reconocidas internacionalmente, salud, astronomía, etcétera, mediante las cuales clasificamos quién tuiteaba más, los dispositivos que utilizaron (móvil, tableta o computadora resaltando que a través de Android y iPhone se generaron 400 y 350 tuits, respectivamente), distintivos o hashtags mayormente usados y desde luego revisamos, manualmente, que cada uno de los tuits recopilados refiriera a artículos o información científica seria”, especificó Carlos Piña.

En tanto, Mario Siqueiros aseveró que el análisis estadístico definió la tendencia y proporcionó un panorama alusivo a los países y regiones que más tuitean de ciencia. “Observamos que en Twitter, la ciencia no está limitada a los científicos y su conocimiento, porque una buena parte de la sociedad denota interés en ciencia y tecnología. Tan es así que las 10 cuentas más influyentes de la muestra fueron las de usuarios con 30 mil y hasta 100 mil seguidores, quienes no necesariamente son científicos o académicos”.

En los mapas o resultados gráficos que se realizaron a raíz de esta investigación, la delegación Miguel Hidalgo de la Ciudad de México resultó ser una región semiactiva en cuanto al registro frecuente (mapeo de calor) sobre tuits referentes a ciencia. “En Cancún, donde hacen muchos congresos científicos, también se retuitea bastante”, agregó el etnólogo Mario Siqueiros.

De las 10 naciones con mayor actividad en la muestra de los investigadores, Estados Unidos ocupó el primer lugar, seguido de Inglaterra y España. Mientras que México ostentó la séptima posición por debajo de Brasil, Canadá y Australia, superando a Francia, Alemania y Chile.

“Aunque la actividad científica a través de Twitter es muy baja en comparación con el resto de la información que se propaga por esta red social, en términos de tuits científicos consideramos que México no está mal posicionado”, expuso Carlos Piña.

Por qué Twitter, y qué hay de Facebook

Actualmente Twitter es una de las redes sociales más estudiadas por investigadores alrededor del mundo porque es de las más abiertas. “Hicimos experimentos previos con Facebook pero dado que su negocio es vender la información, sus recursos están más limitados”, dijo Carlos Piña.

Mario Siqueiros señaló a Twitter como un área nueva y emergente en el campo de la investigación. “Conocer el papel de esta web social en términos de divulgación del conocimiento científico y su apropiación por comunidades que la conforman, es destacable dada la participación que está demostrando la gente en cuanto a compartir o intercambiar conocimiento científico”.

Aunque Twitter es un buen canal de comunicación, aún tiene muchas limitaciones con relación a su alcance. “Estimo que menos de 15 por ciento de la población a nivel mundial está registrada o lo usa frecuentemente”, alertó Carlos Piña.

[quote_box_left]Publicado originalmente por Conacyt Prensa[/quote_box_left]

Comparte
Autor Lado B
Lado B
Información, noticias, investigación y profundidad, acá no somos columnistas, somos periodistas. Contamos la otra parte de la historia. Contáctanos : info@ladobe.com.mx
Suscripcion