DataSOC: Ciencia de Datos Sociales

Fecha de publicación

29 de diciembre de 2025

1 Introducción

En los últimos años, la disponibilidad masiva de grandes volúmenes de “big data”, la irrupción de la inteligencia artificial, y el aprendizaje automático (machine learning), han transformado radicalmente las posibilidades del análisis de datos. Las metodologías han debido actualizarse e incorporar ciencia de datos, procesamiento de lenguaje natural, practicas de reproducibilidad y apertura, habilitando nuevos tipos de evidencia y herramientas analíticas para el diseño de políticas y la evaluación de impactos. Tal contexto introduce desafíos significativos para las ciencias sociales: problemas de representatividad y sesgo en fuentes no previstas para investigación, riesgos sobre privacidad y protección de datos, dificultades de interpretabilidad de modelos complejos, y la necesidad de adaptar marcos teóricos y metodológicos para integrar resultados algorítmicos con explicaciones sociales robustas.

Los datos sociales pueden definirse como toda aquella información que permite comprender fenómenos sociales, económicos, culturales o políticos. Incluyen desde encuestas de opinión pública y censos demográficos, hasta registros administrativos, datos geoespaciales, interacciones en redes sociales y grandes volúmenes de datos digitales generados por plataformas en línea. Además, abarcan datos cualitativos como entrevistas, grupos focales, observaciones etnográficas y archivos históricos, así como también datos visuales y audiovisuales. Estos datos sociales no son meros insumos técnicos, sino representaciones de procesos sociales que demandan posicionamiento epistemológico, interpretaciones teóricas, precisión metodológica y marcos éticos robustos. No se trata de seguir reproduciendo una oposición radical entre lo “técnico” y lo “social” (Edwards et al., 2023; Barjak et al., 2009), sino de reconocer los caminos que abren los avances computacionales y hacerlos dialogar con los marcos interpretativos de nuestras disciplinas, y con ello dar respuesta a las preguntas y a las necesidades del país. En este espacio es que la Factuldad de Ciencias Sociales de la Universidad de Chile posee una fortaleza distintiva, al contar con una amplia diversidad de disciplinas, enfoques teóricos y metodologías que permiten dar sentido a los datos sociales desde múltiples perspectivas.

Actualmente, en Chile no existe una plataforma articulada y sostenible dedicada específicamente al desarrollo, gobernanza y proyección estratégica de los datos sociales. Si bien hay iniciativas y proyectos relacionadas con datos sociales (como el Consorcio IDI, el Instituto Milenio Fundamentos de los Datos IMFD, o el Centro de Microdatos), hasta ahora los datos sociales se producen y circulan de manera altamente fragmentada, con escasos estándares comunes y mecanismos débiles de coordinación. Tal dispersión limita la calidad, comparabilidad y trazabilidad de los datos, y dificulta su preservación en el tiempo. Esto reduce su potencial para generar evidencia robusta que fortalezca la investigación, la formulación de políticas públicas y la innovación social. La Universidad de Chile y la Facultad de Ciencias Sociales no son ajenas a estos desafíos, observándose múltiples problemas en la gobernanza de datos, en la incorporación de nuevas tecnologías en la investigación, formación y gestión, y en la transferencia de conocimientos hacia la sociedad.

La necesidad de contar con una infraestructura robusta de datos sociales se vuelve aún más urgente en el contexto actual, dadas las transformaciones tecnológicas, sociales y políticas que enfrentan las sociedades contemporáneas. El conocimiento científico se ve amenazado por la crisis de confianza pública, la proliferación de desinformación y la creciente complejidad de los fenómenos sociales. Además los populismos y las crisis democráticas en la región subrayan la importancia de contar con datos sociales rigurosos y transparentes que permitan fundamentar decisiones públicas y fortalecer la participación ciudadana. En este escenario, las universidades tienen un rol crucial como productores y guardianes del conocimiento social, siendo responsables de garantizar que los datos generados sean de alta calidad, éticamente gestionados y accesibles para la sociedad.

Frente a este escenario, la Facultad de Ciencias Sociales de la Universidad de Chile propone la creación de DataSOC, una plataforma institucional orientada a posicionarse como un referente nacional en el procesamiento, gestión y transferencia de datos sociales, guiados por altos estándares conceptuales, metodológicos y éticos. DataSOC busca articular y potenciar las capacidades existentes en la Facultad, integrando investigación, formación, gobernanza de datos, innovación y certificación de calidad. A diferencia de otras iniciativas como Microdatos de la FEN, DataSOC no se orienta al levantamiento de datos, sino a transformar la manera en que se producen, gestionan y utilizan los datos sociales, asegurando que el conocimiento generado sea riguroso, transparente y socialmente relevante. Su diseño se organiza en torno a cinco lineas de trabajos estratégicos: investigación, formación (en pregrado, postgrado y educación continua), gobernanza y gestión responsable de datos, innovación y transferencia, y certificación de la calidad de los datos sociales. Cada uno de estos lineas de trabajos aporta elementos esenciales para utilizar los datos sociales: generación de evidencia y de metodologías, formación de capacidades humanas especializadas, desarrollo de estándares éticos y técnicos, incubación de soluciones innovadoras, y mecanismos de aseguramiento de la calidad que garanticen la confiabilidad y la trazabilidad.

La relevancia de DataSOC radica precisamente en su capacidad de ordenar, conectar y potenciar los datos sociales, lo que permite que el conocimiento social circule de forma más abierta, transparente y rigurosa. Al establecer protocolos de gobernanza, estándares de documentación, herramientas de preservación, programas de formación especializada y mecanismos de certificación, DataSOC ofrece una estructura estable que reduce la fragmentación, facilita la interoperabilidad entre proyectos y equipos, y fortalece la función pública de la Universidad en la producción de conocimiento socialmente significativo. A mediano y largo plazo, DataSOC aspira a convertirse en un referente nacional en ciencia de datos sociales, articulando redes al interior de la Universidad de Chile y generando alianzas estratégicas con instituciones públicas, organismos internacionales y organizaciones sociales. De este modo, DataSOC busca situar a la Universidad de Chile en la vanguardia regional en el desarrollo de ciencia de datos sociales al servicio de la sociedad. Para ello, toma como referente iniciativas internacionales como el German Data Forum (RatSWD) y el Institute for Social Research (ISR) de la Universidad de Michigan, adaptando sus aprendizajes al contexto chileno y latinoamericano.

En la presente propuesta se describen los principales desafíos que enfrenta la Facultad de Ciencias Sociales en relación con los datos sociales, y se detalla la estructura y los objetivos de DataSOC como una respuesta integral a estos desafíos.

2 Diagnóstico del problema

El problema a abordar con DataSOC se manifiesta en cinco ámbitos interrelacionados: formación, apoyo, impacto y transferencia, certificación de calidad de datos, investigación y gobernanza de datos. A continuación, se describen los principales desafíos identificados en cada uno de estos ámbitos.

2.1 Formación

El ámbito formativo constituye uno de los nudos críticos para el desarrollo de capacidades en datos sociales dentro de la Universidad de Chile y, particularmente, en la Facultad de Ciencias Sociales. Tanto en Chile como en el mundo, se observa una creciente demanda, por parte de instituciones públicas y el sector privado, de profesionales capaces de trabajar con técnicas avanzadas de análisis de datos, integrar metodologías computacionales y aplicar estándares de ciencia abierta. Esta demanda se inserta en un ecosistema global donde las plataformas masivas de educación en línea (MOOCs) han ampliado y diversificado la oferta, desplazando la expectativa de formación continua hacia experiencias más flexibles, modulares y tecnológicamente mediadas.

En respuesta a estas transformaciones, la Universidad de Chile ha fortalecido progresivamente su infraestructura formativa digital. La creación y consolidación de la Oficina de Educación Online (EOL) de la Universidad ha permitido una expansión de cursos en línea en diversas áreas, incluyendo ciencia abierta, inteligencia artificial y herramientas basadas en modelos de lenguaje. Unidades Académicas como la Facultad de Economía y Negocios, Ciencias Químicas y Farmacéuticas y Ciencias Físicas y Matemáticas han desarrollado programas de extensión y diplomados que integran estas temáticas, contribuyendo a la difusión de capacidades tecnológicas avanzadas dentro y fuera de la comunidad universitaria. Sin embargo, estos avances no se han traducido todavía en un ecosistema articulado para el campo de los datos sociales.

En FACSO, los desafíos son aún más pronunciados. En primer lugar, existe una baja articulación de la oferta de cursos metodológicos y de análisis de datos, tanto dentro de las carreras como entre los distintos programas de pregrado y postgrado. La separación tradicional entre métodos cualitativos y cuantitativos se reproduce en los planes de estudio, generando trayectorias formativas fragmentadas y dejando un vacío respecto de enfoques mixtos y metodologías semi-cuantitativas, como análisis de redes o análisis espaciales. Esta fragmentación se observa incluso dentro de una misma línea curricular, donde se identifican inconsistencias en el énfasis conceptual y en las herramientas utilizadas. A ello se suma que, pese a avances aislados, la formación en ciencia abierta, ciencias sociales computacionales e inteligencia artificial es aún incipiente en la Facultad. La oferta de cursos electivos o complementarios en estas áreas es limitada y, en la mayoría de los programas, inexistente. Adicionalmente, varios de estos cursos son dictados por profesionales y académicos externos a la Facultad, lo que juega en contra de la sostenibilidad financiera y dificulta su continuidad en el tiempo.

Este panorama genera un desajuste entre las exigencias contemporáneas del trabajo en datos sociales y las capacidades actualmente desarrolladas en la formación disciplinar. La ausencia de una estrategia formativa articulada tiene efectos directos en la preparación de nuestros estudiantes para el mundo laboral y en la capacidad institucional de responder a las transformaciones del ecosistema digital. No obstante, la Facultad cuenta desde 2023 con una Unidad de Educación Continua, que ha permitido institucionalizar la oferta formativa de diplomas y cursos de actualización. Esta unidad dispone de una política de educación continua, un equipo especializado con experiencia en la creación, gestión y evaluación de cursos, y procedimientos administrativos estandarizados que facilitan la implementación de programas formativos. Su consolidación abre una oportunidad decisiva para articular una oferta robusta y sostenible, conectando los programas de pregrado, postgrado y educación continua dentro de una estrategia unificada de capacidades.

2.2 Apoyo, Impacto y Transferencia

La demanda por decisiones públicas basadas en evidencia se ha convertido en un estándar indispensable de legitimidad. Organizaciones internaciones como la OCDE (2019) y las Naciones Unidas (IEAG, 2014) han declarado que la capacidad de gestionar y analizar datos en un prerrequisito para la gobernanza efectiva y el desarrollo sostenible de las sociedades. Sin embargo, la disponibilidad de datos no se traduce en su calidad (Edwards et al., 2013) ni en su mayor uso efecto para influir en las políticas públicas (OCDE, 2019), en particular en contexto donde pueden existir brecha en las capacidades analíticas de instituciones del sector público (Wu et al., 2015). Por otro lado, también se han detectado brechas en el uso de datos por parte de organizaciones no gubernamentales. Si bien estas son actores claves en la democracia debido a su conocimiento profundo de los territorios y la sociedad civil, muchas veces carecen de la infraestructura técnica y el capital humano especializado para el análisis de datos robustos, reduciendo la capacidad de evaluar el impacto de sus acciones (Desouza & Smith, 2014).

En este contexto, las instituciones universitarias juegan un rol fundamental en transferir activamente el conocimiento producido por sus académicos para resolver problemas sociales concretos (Compagnucci & Spigarelli, 2020). La Universidad de Chile reconoce esta misión en su Política de Desarrollo Institucional (2017). Asimismo, en su Plataforma para la Política de Investigación, Creación Artística e Innovación (ICAI) se reconoce la necesidad de agilizar los procesos de transferencia, y se proponen como objetivo el “consolidar el liderazgo de la U. de Chile en la Investigación orientada a desafíos país”, “desarrollar capacidades avanzadas para la transferencia de conocimiento e innovación” e “informar políticas públicas y estrategias del sector privado con evidencia universitaria”.

Actualmente, la Facultad de Ciencias Sociales no cuenta con un catalizador institucional que permita poner a disposición de la sociedad los conocimientos metodológicos y de análisis de datos sociales. Según datos del diagnóstico realizado en el marco de Conocimientos 2030, entre 2021 y 2023 la Facultad de Ciencias Sociales realizó 16 actividades de transferencia de conocimiento, lo que significaron ingresos por 970 millones de pesos a la Facultad. Como comparación, en el mismo período, la Facultad de Gobierno realizó 99 actividades de transferencia, representando ingresos por $2.4 millones de pesos. La brecha entre ambas facultades muestra el espacio de crecimiento y la oportunidad para FACSO de seguir aumentando la incidencia en la sociedad del conocimiento generado en la Facultad. De tal modo, iniciativas como la Unidad de Proyectos Externos y el Centro de Estudios en Seguridad Ciudadana de FAGOB, el Centro de Microdatos de FEN y el Centro de Sistemas Públicos de FCFM pueden servir como referentes cercanos en la creación de una infraestructura de conocimientos basada en datos sociales.

2.3 Certificación de Calidad de Datos

Debido a la intensificación en la producción de datos, nunca antes se había contado con tantos “conjuntos de datos como productos completos y sustituibles, en formatos de fácil transferencia” (Edwards et al., 2013, p. 8). Sin embargo, la mayor disponibilidad de datos no garantiza su calidad. Para las disciplinas científicas, el valor de un dato depende estrechamente de comprender con precisión los procedimientos mediante los cuales fue producido. Este proceso de comodificación de los datos, que multiplica las fuentes de información y oscurece su contexto de producción, altera radicalmente la relación entre conocimiento y no-conocimiento, desafiando la capacidad de la ciencia para arbitrar la calidad y legitimidad del conocimiento (Edwards et al., 2013).

En este contexto, se ha intensificado a nivel global una crisis de confianza política y ciudadana en el rol público de la ciencia, particularmente en las ciencias sociales (Breznau, 2021). Esta desconfianza se expresa en recortes presupuestarios, cierre o reducciones de programas académicos, así como un creciente escepticismo general respecto de los hallazgos, métodos y motivaciones de la comunidad científica. Asimismo, en Chile, durante los últimos años han estallado de manera periódica polémicas derivadas de imprecisiones en encuestas de opinión pública y sus supuestos efectos sobre resultados electorales.

Ante esta situación de cuestionamiento y escepticismo sobre los datos, han surgido iniciativas internacionales para intentar arbitrar la calidad de datos, centros de datos y encuestadoras. Destaca la experiencia del German Data Forum (RatSWD) que, desde 2008, acreditan la calidad de Centros de Datos e Investigación a partir de estándares y criterios que incluye originalidad, valor añadido, protección de datos sensibles, documentación de calidad y sustentabilidad institucional. En Estados Unidos, también se observan iniciativas similares, aunque más orientadas a las encuestadoras de opinión pública. Por ejemplo, la American Asociation for Public Opinion Research (AAPOR) cuenta con la Transparency Iniciative, que promueve entre sus miembros la transparencia en el diseño muestral y metodológico de sus estudios.

En Chile, diversas instituciones participan activamente en la producción de datos sociales – como el INE, MIDESOC, CEP –, con iniciativas dirigidas desde universidades como la Encuesta Bicentenario de la Universidad Católica o los servicios ofrecidos por el Centro de Microdatos de la Universidad de Chile. Sin embargo, y a diferencia de otros países, hasta ahora, no existe un sistema formal de certificación de la calidad de los datos sociales, ni de los centros que los producen. En este contexto, la Universidad de Chile posee el potencial de articular un sistema de certificación de calidad de datos sociales, aprovechando su prestigio institucional y su rol público como universidad estatal. La Universidad cuenta con una experiencia relevante en materia de certificación institucional que puede servir como referente normativo y operativo, como lo son las certificaciones alimentarias que el Instituto de Nutrición y Tecnología de los Alimentos (INTA) otorga mediante su Dirección de Asistencia Técnica. Aunque alejada del ámbito de las ciencias sociales, constituye un precedente importante sobre cómo desarrollar procesos institucionalizados, sostenibles y reconocibles de certificación de calidad, y abre la puerta a pensar una iniciativa similar para datos sociales desde la Facultad de Ciencias Sociales.

2.4 Investigación

El panorama contemporáneo de la investigación social enfrenta desafíos importantes derivados de nuevas tecnologías digitales, y de la demanda por mayor transparencia y apertura de datos sociales. Nuevas tecnologías como el Big Data y la Inteligencia Artificial implican un cambio en las formas tradicionales de investigación social, acelerando la producción y el análisis de datos (Edwards et al., 2013). Dado que estas innovaciones vienen principalmente de disciplinas STEM, se ha cuestionado el rol de las ciencias sociales en su desarrollo y utilización, llegando a proclamar el “fin de la teoría social” y la emergencia de una ciencia computacional puramente inductiva (Sato, 2024).

Por otro lado, en los años recientes, la academia ha enfrentado desafíos importantes derivados de la crisis de replicabilidad (Baker, 2016; Nosek et al., 2015; Peng, 2015) y las restricciones de acceso a publicaciones financiadas por fondos públicos. En este contexto, el movimiento Ciencia Abierta ha ganado relevancia impulsando iniciativas que promueven la transparencia y el acceso a la investigación. En esta línea, la Agencia Nacional de Investigación y Desarrollo (ANID) ha recogido parte de estas inquietudes, publicando una Política de Acceso Abierto a la Información Científica y a Datos de Investigación (ANID, 2022).

La Universidad de Chile ha recogido en parte estos desafíos. Por un lado, en la Vicerrectoría de Tecnología e Información se ha creado una oficina de IA que busca contribuir y desarrollar proyectos potenciados por inteligencia artificial a través de programas educativos de alta calidad. También, tras la adjudicación del Proyecto InES Ciencia Abierta, la Universidad ha buscado realizar un cambio cultural que integre los principios de la Ciencia Abierta en la gobernanza de datos y publicaciones, creando una infraestructura de acceso abierto que incluye revistas, planes de gestión de datos y repositorios. Además, la VID, en el marco del proyecto INES Ciencia Abierta, ha creado un reglamento de gestión de datos de investigación que establece lineamientos para la administración, almacenamiento y apertura de datos generados en proyectos financiados por la Universidad.

Ahora bien, ninguna de estas experiencias ha incluido de manera determinante la perspectiva de las ciencias sociales, y aún existe un alto nivel de desconocimiento y de reticencia hacia iniciativas de ciencia abierta en estas disciplinas (Castillo et al., 2024). En ese sentido, es necesario reconocer la diversidad del conocimiento producido en FACSO, el cual se construye sobre distintos tipos de datos (cuantitativos, cualitativos, visual, arqueológico, etc.) con sus respectivas particularidades. En este contexto, actualmente la Facultad de Ciencias Sociales, más allá de iniciativas particulares, no cuenta con un espacio institucional que permita la reflexión y ni la investigación que releve el rol de la teoría social en el desarrollo de las ciencias de datos computacionales o en la ciencia social abierta.

2.5 Gobernanza de Datos

El funcionamiento de una infraestructura de conocimiento depende de la capacidad institucional para organizar, articular y sostener el ciclo de vida de los datos mediante reglas, prácticas, estándares y responsabilidades compartidas. Sin embargo, en el campo de los datos sociales, la expansión acelerada de fuentes de información, desde registros administrativos hasta grandes volúmenes de datos digitales generados de manera continua y no reactiva, ha tensionado profundamente los marcos tradicionales de gobernanza. Esta multiplicidad de datos, actores y tecnologías ha dado lugar a flujos de información altamente dinámicos, donde la disponibilidad masiva no siempre se traduce en calidad, trazabilidad o legitimidad. A lo anterior se suman exigencias crecientes derivadas del nuevo marco regulatorio sobre protección de datos personales, (Ley 21.719), de la demanda por procesos de toma de decisiones basados en evidencia, de los requisitos de contar con plan de gestión de datos para proyectos de investigación, y de los principios de transparencia y apertura que orientan la ciencia contemporánea. En este escenario, la gobernanza de datos se vuelve un eje estructural, pues articula las condiciones que permiten que los datos circulen de manera segura, documentada y responsable.

En la Universidad de Chile, estos desafíos se expresan de manera particularmente compleja. La Universidad genera y gestiona un volumen considerable de información sobre estudiantes, académicos, funcionarios y unidades, además de datos asociados a investigación, docencia, extensión y gestión. Si bien la reciente creación de la Unidad de Datos en la Vicerrectoría de Tecnologías de Información constituye un avance relevante, la gobernanza universitaria continúa distribuida en múltiples reparticiones con escasa coordinación transversal. Los sistemas de información han emergido históricamente como soluciones locales, respondiendo a necesidades administrativas específicas, lo que ha dificultado la consolidación de estándares comunes, la interoperabilidad entre plataformas y la definición de responsabilidades institucionales claras. El resultado es un ecosistema de datos operativo, pero altamente dependiente de conocimiento tácito, esfuerzos individuales y lógicas particulares a cada unidad académica, dirección o equipo, que no siempre garantizan sostenibilidad.

En la Facultad de Ciencias Sociales, este panorama adquiere características propias. Los procesos de autoevaluación institucional han permitido constatar brechas significativas en la gobernanza de datos, principalmente en la débil definición de los roles institucionales en materia de datos, lo que dificulta asignar responsabilidades, resguardar la continuidad y establecer procedimientos compartidos. Asimismo, la fragmentación y la heterogeneidad de los sistemas de información, con bases de datos y plataformas de trabajo que operan de manera aislada y según criterios particulares. Esta situación se ve atada a la ausencia de estándares de calidad y de documentación, lo que impide reconstruir los procesos de producción y limita la reutilización de información.

Desde la perspectiva de las infraestructuras de conocimiento, estas tensiones son expresiones de un ecosistema que ha crecido sin un marco articulador que permita la interoperación de sistemas, prácticas y tecnologías. El desafío no es reemplazar la diversidad existente, sino integrarla, establecer criterios comunes, promover buenas prácticas y asegurar que el conocimiento producido sea trazable, confiable y socialmente responsable.

3 Propuesta

En respuesta a los desafíos antes descritos, nuestra propuesta es la creación de DataSOC, una plataforma institucional orientada a posicionarse como un referente nacional en el procesamiento, gestión y transferencia de datos sociales, guiados por altos estándares conceptuales, metodológicos y éticos. Para ello se propone articular y potenciar las capacidades existentes en la Facultad, integrando investigación, formación, gobernanza de datos, transferencia y certificación de calidad.

3.1 Formación

Este lineas de trabajo busca responder a los desafíos formativos identificados en el diagnóstico previo. Para ello, DataSOC propone articular una estrategia formativa integral que conecte los programas de pregrado, postgrado y educación continua en torno a una oferta coherente y actualizada en datos sociales. Contar con esta oferta es crucial, dado que se requieren capacidades humanas especializadas en el análisis de datos sociales para nutrir a las otras lineas de trabajo de DataSOC.

Los componentes de esta línea son los siguientes:

  • Coordinación académica metodológica: en un primer momento se realizará un diagnóstico exhaustivo de la oferta formativa en métodos y análisis de datos en pregrado y postgrado, identificando vacíos, solapamientos y oportunidades de articulación. A partir de este diagnóstico, se establecerá una instancia permanente de coordinación académica metodológica, reuniendo a los equipos docentes responsables de cursos metodológicos y de análisis de datos en pregrado y postgrado, con el objetivo de avanzar hacia lineamientos comunes que aseguren coherencia curricular, actualización metodológica y estándares compartidos en la enseñanza de métodos, capaces de responder a las transformaciones del ecosistema digital.

  • Certificación en pregrado: a partir de la oferta existente y de la coordinación académica metodológica, se diseñará un programa de certificación (tipo minor) en ciencia de datos sociales para estudiantes de pregrado. Este programa, estructurado como un conjunto de cursos electivos y talleres prácticos, permitirá a los estudiantes adquirir competencias avanzadas en análisis de datos sociales, integrando enfoques cuantitativos, cualitativos y computacionales. La certificación estará abierta a estudiantes de todas las carreras de la Facultad, promoviendo una formación interdisciplinaria y adaptada a las demandas contemporáneas del mercado laboral.

  • Programas de postgrado: DataSOC tendrá un rol estratégico en el diseño e implementación de los tres nuevos programas doctorales de la Facultad, aportando criterios, herramientas y estándares para la formación avanzada en datos sociales. Del mismo modo, contribuirá al desarrollo de un Colegio Doctoral, concebido como un espacio de diálogo, articulación y colaboración entre los programas de doctorado existentes y los nuevos, fortaleciendo así la interdisciplina y la circulación de conocimientos en el proceso formativo de los estudiantes de doctorado.

  • Educación continua: DataSOC impulsará una oferta sistemática de cursos modulares y diplomados, orientada a capitalizar el conocimiento metodológico acumulado en la Facultad. Esta oferta, articulada desde la Unidad de Educación Continua de FACSO, permitirá otorgar certificaciones y crear programas que dialoguen con las necesidades del sector público, organizaciones sociales y actores privados. Se generarán cursos para la plataforma EOL y se explorarán formatos híbridos y presenciales, adaptados a las demandas de formación continua en el contexto actual.

  • Conferencias y seminarios internacionales: DataSOC organizará una serie de conferencias, seminarios y talleres internacionales enfocados en ciencia de datos sociales, invitando a expertos reconocidos para compartir sus conocimientos y experiencias. Estas actividades no solo enriquecerán la formación de estudiantes y académicos, sino que también posicionarán a DataSOC como un referente en el campo de los datos sociales a nivel nacional e internacional.

3.2 Innovación y Transferencia

Nuestro diagnóstico evidencia que, a pesar de contar con capacidades técnicas y humanas avanzadas, la Facultad carece de un espacio institucional capaz de articular, proyectar y poner en circulación el conocimiento que produce hacia actores externos de manera sistemática y sostenible. En este contexto, DataSOC se propone como un catalizador institucional que facilite la transferencia de conocimientos metodológicos y técnicos en datos sociales hacia instituciones públicas, organizaciones no gubernamentales y el sector privado. Esta lína considera:

  • Diseño de estudios: asesoría en la formulación de preguntas de investigación, hipótesis, estrategias de muestreo, elaboración de cuestionarios y construcción de escalas, bajo criterios de rigurosidad metodológica, transparencia y reproducibilidad.

  • Acceso y uso de datos secundarios: Dar recomendaciones de bases de datos secundarios disponibles acordes a los objetivos del estudio.

  • Procesamiento y análisis reproducible de datos sociales: Elaboración de reportes estadísticos reproducibles y desarrollo de visualizaciones interactivas sobre problemas de investigación, utilizando herramientas computacionales para el análisis de bases de datos nacionales (CASEN, INE, ELSOC, entre otras).

  • Gestión, archivo y apertura de datos: Dar orientación en el almacenamiento documentación y apertura responsable de datos, siguiendo estándares éticos y los principios FAIR.

3.3 Certificación de Calidad de Datos Sociales

Esta línea de trabajo busca responder a los desafíos relacionados con la calidad, transparencia y reproducibilidad de los datos sociales producidos en Chile. El objetivo es establecer un sistema formal de aseguramiento y certificación de calidad de datos científicos-sociales, basado en estándares internacionales adaptados al contexto nacional. Esto incluye los siguientes componentes:

  • Sistematización de estándares internacionales: Se realizará una revisión exhaustiva de las experiencias internacionales en certificación de calidad de datos sociales, como el German Data Forum (RatSWD) y la American Association for Public Opinion Research (AAPOR). A partir de este análisis, se identificarán los estándares y criterios más relevantes que puedan ser adaptados al contexto chileno.

  • Sistematización de estándares nacionales: Se llevará a cabo un mapeo de las prácticas actuales de producción de datos sociales en Chile, identificando las fortalezas y debilidades en términos de calidad, transparencia y reproducibilidad. Este diagnóstico permitirá adaptar los estándares internacionales a las particularidades del contexto nacional.

  • Generación de protocolos de calidad de los datos: Se desarrollarán protocolos detallados que establezcan los criterios y procedimientos para la certificación de calidad de datos sociales. Estos protocolos incluirán aspectos como el diseño muestral, la documentación de procesos, la protección de datos sensibles y la reproducibilidad de los análisis.

  • Creación del “Sello DataSoc”: Se desarrollará un sistema de certificación que evalúe y garantice la calidad de los datos sociales producidos por instituciones, encuestadoras y centros de datos. Este sello certificará aspectos clave como la transparencia en el diseño muestral, la documentación detallada de los procesos de recolección y análisis, la protección de datos sensibles y la reproducibilidad de los resultados.

3.4 Investigación

DataSOC se propone como un nodo para el desarrollo de investigación metodológica y metacientífica avanzada, integrando datos tanto cuantitativos como cualitativos. La investigación es el componente que permite transformar los datos en conocimiento, contribuyendo a cerrar la brecha entre lo técnico y lo social. De tal manera, este componente opera en el núcleo de DataSOC, proporcionando las bases conceptuales, técnicas y empíricas que habilitan el desarrollo del resto de sus líneas de acción. Además, el desarrollo de líneas de investigación permitirá a DataSOC presentarse ante fondos concursables externos, lo que constituirá una potencial fuente de financiamiento y, por lo tanto, contribuirá a la sustentabilidad del Centro.

Algunas líneas de investigación que DataSOC podría albergar incluyen:

  • Investigación metodológica en el área de las ciencias sociales computacionales, con especial énfasis en el desarrollo de nuevas técnicas y tecnologías tales como la Inteligencia Artificial, el Machine Learning, el Agent-Based Modelling, la Big Data, el Procesamiento de Lenguaje Natural, entre otras.

  • Investigación vinculada a las áreas de la ciencia abierta, la metaciencia y cientometría: particularmente, se propone utilizar los datos sobre proyectos de investigación postulados, adjudicados y no-adjudicados por académicos de la Facultad como un potencial objeto de estudio. En esta línea, la Dirección de Investigación y Publicaciones ha venido desarrollando la Unidad de Ciencia de Datos en Investigación – CINDAI que busca desarrollar un sistema local e integrado de gestión, producción y visualización de información científica en la Facultad.

  • Generar espacios para la reflexión metodológica, ética y epistemológica de los datos sociales, incluyendo la diversidad de tipo de datos que producen las disciplinas de la Facultad y avanzando en crear estándares para su tratamiento y análisis.

3.5 Gobernanza de datos

DataSOC asumirá un rol activo en el desarrollo y transferencia de modelos de gobernanza de datos a la gestión universitaria, siguiendo los estándares FAIR. Funcionar bajo estos estándares implica gestionar los datos de modo que sean encontrables, accesibles, interoperables y reutilizables, tanto para personas como para máquinas. Adoptar principios FAIR es útil porque aumenta el valor científico y social de la información que se produce, mejora la eficiencia del trabajo, facilita la colaboración y el análisis automatizado, y fortalece la transparencia y la reproducibilidad (European Commission, 2018). De tal modo, desarrollar modelos de gobernanza de datos con estas características contribuirá al cierre de las brechas detectadas en el diagnóstico institucional, promoviendo un entorno de gobernanza de datos que incorpore documentación técnica, metadatos estandarizados y flujos de trabajo definidos (Jacobsen et al., 2020).

Este esfuerzo no parte desde cero. La Dirección de Investigación ha avanzado en la creación de la plataforma Ciencia de Datos en Investigación (CINDAI), orientada a integrar y documentar los datos asociados a postulaciones y proyectos del cuerpo académico. Esta iniciativa ha permitido avanzar hacia una gestión más oportuna y confiable de la información, demostrando la importancia de contar con sistemas de datos diseñados desde principios de calidad, trazabilidad y actualización continua. En esta línea, la plataforma se desarrolló bajo el principio de no duplicar esfuerzos ni demandar a las unidades administrativas que migren desde sus sistemas consolidados hacia nuevas herramientas. Por el contrario, su diseño se orientó a integrar y articular datos provenientes de múltiples fuentes existentes, operando como una capa superior que trabaja “por encima” de los sistemas centrales (como SEPA-VID), de las plataformas gubernamentales de datos abiertos de ANID, y de los sistemas internos utilizados por equipos de gestión, incluyendo fichas de postulación, registros académicos y bases de la Unidad de Personal. Este enfoque ha permitido armonizar definiciones, establecer estándares comunes y generar herramientas que facilitan el uso de datos por parte de profesionales y autoridades, demostrando que la gobernanza de datos puede avanzar sin interrumpir procesos existentes y fortaleciendo, en cambio, la interoperabilidad entre sistemas dispersos.

En este contexto, DataSOC se proyecta como un catalizador institucional, capaz de ampliar y transferir estos modelos de gobernanza hacia otras unidades de la Facultad. Su propósito no es sustituir los sistemas existentes, sino articularlos bajo criterios comunes, promoviendo prácticas sostenibles y fortaleciendo capacidades técnicas y metodológicas. Al hacerlo, DataSOC contribuirá a consolidar una infraestructura de conocimiento que permita superar la fragmentación actual y habilite procesos de investigación, docencia, gestión y toma de decisiones basadas en evidencia más consistentes.