Psicología y Big Data

Grandes conjuntos de datos generados por las redes sociales, dispositivos “wearables” y demás fuentes, estás ofreciendo nuevas vías para que los investigadores exploren más a fondo el comportamiento humano en el mundo real.

Hace dos décadas, un experimento de psicología con millones de participantes era casi imposible de imaginar. La recopilación de datos era costosa y lenta, y requería que decenas o incluso cientos de personas (a menudo estudiantes universitarios) se presentaran en un laboratorio para poder participar.

En la actualidad, los investigadores son capaces de crear una encuesta online y reunir cientos de miles de respuestas de diversos participantes en todo el mundo, pueden acceder a millones de tweets con unas pocas líneas de código, y pueden usar técnicas de análisis informático muy potentes para obtener información sobre el comportamiento humano a partir de estos conjuntos de datos.

psicologia y big data

Impulsado por estas herramientas, la investigación del Big Data está despegando en campos tan diversos como la psicología cognitiva, de la personalidad, social e industrial / organizacional.

«Hace cinco años muchas personas hablaban de psicología de Big Data, pero me preguntaba si realmente lo harían», dice Samuel Gosling, PhD, investigador de la personalidad de la Universidad de Texas, Austin, que ha estado recopilando datos online desde finales de los noventa. «Pero para mi feliz sorpresa, lo hicieron. A día de hoy está en marcha».

Big Data: un fértil campo de investigación para la psicología

Big data se ha convertido en una frase de moda, pero ¿qué significa? ¿Cómo de “grande” es? Los investigadores dicen que no hay una respuesta para esa pregunta. Cuando los informáticos hablan de grandes conjuntos de datos, generalmente están hablando de terabytes, petabytes, etc., es decir, cantidades que requieren sistemas informáticos distribuidos para llevar a cabo su análisis, dice el psicólogo Sean Wojcik, PhD, científico de datos de la compañía de medios digitales Upworthy y coautor (con Eric Chen, PhD) de «Una guía práctica para la investigación de Big Data en psicología» (Psychological Methods, Vol. 21, No. 4, 2016).

Sin embargo, los psicólogos rara vez trabajan con conjuntos de datos tan grandes. «A menudo lo usamos para referirmos a datos que son mucho más grandes de lo que estamos acostumbrados«, afirma Wojcik. «No hay umbral».

psicologia y big data

Esto es debido a que incluso grandes conjuntos de datos que no impresionarían a un informático, sí que pueden suponer un terreno fértil para la investigación psicológica. En qué consisten esos conjuntos de datos varía según el subcampo en psicología.

A menudo incluyen encuestas online o publicaciones en redes sociales. Por ejemplo, en su investigación sobre la personalidad, Gosling y sus colegas combinaron datos meteorológicos de cada código postal en los Estados Unidos con datos de más de 1.6 millones de participantes que realizaron una prueba de personalidad online. Descubrieron que las personas que habían crecido en climas más templados tenían mayor probabilidad de tener un carácter agradable, abierto y emocionalmente estable, que las personas que habían crecido en zonas más frías (Nature Human Behavior, Vol.1, 2017).

En la Universidad de Pensilvania, un consorcio de psicólogos e informáticos está trabajando en el Proyecto de Bienestar Mundial, fundado por el pionero de la psicología positiva Martin EP Seligman, PhD, un intento de medir el bienestar mundial mediante el análisis de las publicaciones en las redes sociales. En un estudio reciente, descubrieron que al analizar el texto en millones de tuits podían predecir qué estados de EEUU consumen más alcohol (PLOS ONE, publicación online, abril de 2018).

El psicólogo cognitivo Brendan Johns, PhD, está analizando textos en lugar de tuits. Johns, profesor asistente en los departamentos de desórdenes comunicativos, ciencias y lingüística computacional de la Universidad de Buffalo, utiliza métodos de análisis de grandes datos para analizar Wikipedia, libros electrónicos y otros tesoros digitales del lenguaje escrito. Su objetivo es comprender cómo las personas aprenden el significado de las palabras a partir de la estructura del lenguaje, y cómo ese aprendizaje afecta la memoria y otras formas de cognición.

«Podemos probar nuestros modelos en un conjunto de 2 mil millones de palabras, y eso ha sido un gran cambio», dice.

Promesas y desafíos del Big Data

Entonces, ¿qué tienen en común estas aplicaciones remotas de Big Data? En términos generales, los grandes conjuntos de datos cambian los tipos de preguntas que la psicología trata de responder, afirman los investigadores.

psicologia y big data

Para Lyle Ungar, PhD, profesor de ciencias de la computación y psicología en la Universidad de Pensilvania que codirige el Proyecto de Bienestar Mundial, ese cambio se materializa en un cambio de «prueba de hipótesis» a «generación de hipótesis». La mayor parte de la investigación en psicología, señala, implica realizar un experimento para probar una hipótesis. «Pero eso es solo la mitad de la ciencia», dice. «Y eso no es Big Data. Big Data se basa principalmente en datos y no en hipótesis». En un estudio típico, por ejemplo, Ungar podría recopilar millones de tuits de personas con trastorno por déficit de atención con hiperactividad (TDAH), luego explorar esos datos para encontrar formas en que los tuits de las personas con el trastorno difieren de los tuits del resto de personas, todo ello sin tener una hipótesis particular en mente (Journal of Attention Disorders, 2017). Ese tipo de información sobre las experiencias diarias de las personas con TDAH podría ayudar a lograr mejores tratamientos.

Kevin Grimm, PhD, psicólogo de métodos de investigación en la Universidad Estatal de Arizona, está de acuerdo en que buscar lo inesperado es un aspecto importante de la investigación de Big Data, pero agrega que la clave es que los métodos de análisis de Big Data proporcionan una forma sistemática de hacerlo. «Es importante que analicemos nuestras hipótesis con métodos confirmatorios, pero también que analicemos otras tendencias que no se encontrarían a menos que exploraras».

Otra ventaja de los grandes datos, dice Gosling, es que los estudios más potentes permiten a los investigadores acercarse a la complejidad del comportamiento humano en el mundo real.

«La mayor parte del comportamiento humano es extremadamente complicado y simplemente no puedes examinar las interacciones de tantas factores a menos que tengas el poder suficiente para hacerlo», dice. En la investigación psicológica tradicional los investigadores podrían examinar solo unos pocos factores o hacer estudios en entornos extremadamente controlados que pueden no aproximarse al mundo real. «Hasta la llegada de la era de los grandes datos, no contábamos con herramientas que estuvieran bien adaptadas a la complejidad de los fenómenos que queríamos estudiar».

Las recompensas potenciales de explorar grandes conjuntos de datos son excelentes, sin embargo para muchos psicólogos las barreras de entrada pueden resultar elevadas. «La cuestión de por dónde empezar es un gran obstáculo para las personas», dice Wojcik. «Gran parte de la formación de psicólogos se realiza en SPSS, y esa no es una herramienta ideal para analizar conjuntos de datos muy grandes».

Aprender un nuevo lenguaje de programación que se ajuste mejor, como R o Python, puede resultar desalentador. No obstante Wojcik sugiere pensar que la inversión de tiempo es similar a la etapa de recolección de datos de la investigación psicológica tradicional. Una vez que se aprende R o Python, «la recopilación de datos puede ser increíblemente rápida», dice. «En un laboratorio tradicional, podría dedicar varios meses a la recopilación de datos. En su lugar, puede dedicar ese tiempo a aprender R».

Un apartado a tener en cuenta es que la recopilación de grandes datos, particularmente de publicaciones en redes sociales, plantea una serie de desafíos éticos y de privacidad para la psicología y otros campos. «Pienso mucho en eso, en lo que significa dar el consentimiento», afirma Ungar. «Por ejemplo, cuando los participantes me dan acceso a sus publicaciones (de Facebook), no utilizo lo que sus amigos publican en su página ya que esas personas no han dado su consentimiento».

En general, afirma Gosling, los psicólogos pueden contribuir al debate sobre la privacidad de los datos siendo buenos administradores de los mismos y utilizando su experiencia para ayudar a comprender los factores que influyen en las decisiones de las personas sobre la privacidad y la seguridad de la información.

«¿Cómo deciden las personas cuándo se sienten seguras y cuándo no se sienten seguras compartiendo datos? Esa es una pregunta que la psicología puede ayudar a responder».

psicologia y big data

Fuente:

Lea Winerman, Noviembre de 2018.

American Psychological Association.

https://www.apa.org/monitor/2018/11/cover-data

Deja un comentario