Hub de Alianzas de Contenido/Metabase/Metabase para el movimiento global
Content Partnerships Hub
Improving the Wikimedia movement’s work with content partners
Metabase para el movimiento global
Contexto
En este estudio de caso, informamos sobre nuestro esfuerzo por llenar Metabase con datos de muestra sobre los recursos publicados y las actividades realizadas por el movimiento Wikimedia, con un enfoque particular en las alianzas de contenido. El objetivo principal es evaluar si el formato de datos estructurados es una herramienta adecuada para almacenar este tipo de información.
Además, queríamos examinar y evaluar las estructuras de modelado que habíamos desarrollado al trabajar con los datos propios de Wikimedia Sverige. Si bien trabajar con datos producidos por otras entidades es difícil sin aportes externos, esperábamos al menos tener una idea de los desafíos que esto implica.
Para obtener información general sobre cómo está estructurada Wikibase y por qué se creó, consulte los estudios de caso Configurar una Wikibase desde cero y Metabase para datos de capítulos.
Como se indica en la solicitud de Subvención para la Implementación de la Estrategia del Movimiento de Wikimedia Sverige, uno de los objetivos de Metabase es facilitar la identificación y localización del material disponible sobre alianzas de contenido a todo el mundo. Durante años, tanto afiliados como particulares han compartido sus experiencias y aprendizajes de diferentes formas y en distintas plataformas, tanto dentro como fuera del ecosistema Wikimedia. Hay mucho material interesante disponible: informes, publicaciones de blogs, boletines, presentaciones de diapositivas, carteles y grabaciones de vídeo. El punto fuerte del movimiento GLAM-Wiki es que abarca una amplia variedad de experiencias, habilidades y voces. No existen obstáculos a la hora de compartir tu trabajo en la forma que consideres más adecuada.
Por otro lado, puede resultar difícil para otros encontrar sus recursos y aprender de ellos, razón por la cual el desarrollo de capacidades es un punto central del Hub de Alianzas de Contenidos que Wikimedia Sverige está tratando de establecer. Para que los afiliados y voluntarios de todo el mundo puedan construir alianzas de contenido más sólidas, deben poder aprender unos de otros; un capítulo pequeño recién creado no debería verse obligado a reinventar la rueda si existe una gran cantidad de recursos creados por capítulos más establecidos que pueden aprovecharse. Nuestra visión para el Hub de Alianzas de Contenido es que debería facilitar el flujo de conocimiento entre afiliados y voluntarios, haciendo que sea fácil para todos compartir y beneficiarse de esos recursos. Y para lograr esto, necesitamos una infraestructura técnica que sea flexible y fácil de usar.
Parte de la contribución de Wikimedia Sverige al desarrollo de capacidades a escala global es la Mesa de Ayuda del Hub de Alianzas de Contenido, una infraestructura que brinda apoyo práctico a los Wikimedistas que planifican y ejecutan alianzas de contenido, especialmente para comunidades locales que actualmente están desatendidas y poco representadas en el Movimiento. Los Wikimedistas pueden enviar preguntas y solicitudes a la Mesa de Ayuda, y el personal del Hub brindará la ayuda necesaria o pondrá al solicitante en contacto con alguien que pueda ayudarle. El trabajo de la Mesa de Ayuda está dirigido por un Comité de Expertos, que consta de miembros experimentados del Movimiento con una variedad de formaciones. Vemos a Metabase como una extensión natural de la Mesa de Ayuda al agregar material que se ha identificado al responder a una solicitud específica, evaluar y analizar qué material de desarrollo de capacidades existe y qué falta o necesita actualizarse, etc. Queremos que Metabase se convierta en un lugar donde todos puedan buscar —y contribuir— a la biblioteca global de recursos de Wikimedia por su cuenta.
Con los datos almacenados en una base de conocimientos enlazada y estructurada, es posible buscarlos de acuerdo a las necesidades de cada uno. Por ejemplo, se pueden buscar enlaces a tutoriales de Youtube sobre Wikimedia Commons en sueco o diapositivas de presentaciones sobre colaboraciones con bibliotecas. Las solicitudes que ingresan a la Mesa de Ayuda también podrían almacenarse en la Metabase, permitiendo a la comunidad en general y al Comité de Expertos obtener una visión general de lo que se ha hecho y del material que ha producido la Mesa de Ayuda específicamente para satisfacer las solicitudes.
Alcance
El material del Movimiento dentro del alcance de Metabase abarca:
- Conferencias y otros eventos (seminarios, editatones, campañas, etc.) sobre temas relacionados con Wikimedia;
- Presentaciones y otras contribuciones, como la participación en paneles, por parte de wikimedistas y/o sobre temas de Wikimedia, en eventos no organizados por el movimiento Wikimedia;
- Material producido como resultado o en conexión con lo anterior, como presentaciones de diapositivas, carteles, informes, grabaciones de video;
- Publicaciones, como artículos, publicaciones de blogs, tutoriales (tanto en formato de texto como de video) sobre temas de Wikimedia.
Limitaciones
Cabe recordar que nuestro objetivo con el desarrollo inicial del contenido de Metabase no era cubrir por completo ningún área temática en particular. Los recursos y el tiempo de nuestro personal son limitados, por lo que tuvimos que elegir una dirección de trabajo que pudiera aportar el mayor beneficio al proyecto. Una alternativa podría haber sido intentar centrarnos en un área en particular, investigarla en profundidad y ofrecer una cobertura completa. Era sin duda una alternativa tentadora —¿a quién no le gusta explorar un tema específico?— pero esto implicaría que no podríamos presentar una visión matizada del potencial de Metabase. Nuestro objetivo con el proyecto es explorar las posibilidades de la plataforma y experimentar con diferentes temas antes de invitar a todos los integrantes del movimiento a construir sobre los cimientos y ampliarlos.
Por esta razón, priorizamos cubrir un conjunto más amplio de ejemplos de una forma más superficial, que cubrir unos pocos en profundidad. Esperamos que esto nos permita mostrar mejor el espacio de oportunidades. Además, no habríamos podido investigar los detalles del trabajo realizado por los Wikimedistas a nivel mundial, ya que somos sólo un par de individuos con habilidades lingüísticas extremadamente limitadas, lo que nos impide familiarizarnos con las grandes cantidades de trabajo realizado más allá de la Anglosfera. Debido a esto, habrá espacios sin llenar incluso dentro de las áreas en las que elegimos centrarnos específicamente. Nuestra ambición ha sido proporcionar un punto de partida para el Movimiento con muchos ejemplos para que sea lo más fácil posible para cualquiera retomarlo donde lo dejamos y continuar desarrollando el contenido.
También esperamos que nuestro trabajo sea objeto de debate y crítica, de modo que la forma final de Metabase sea un esfuerzo colaborativo de la comunidad global. Hemos construido los cimientos pero, al final, una base de conocimiento integral requerirá un trabajo continuo de la comunidad.
Método
Probamos dos enfoques para llenar Metabase con datos.
El primer enfoque se centró en los eventos. Seleccionamos dos conferencias de GLAM Wiki (GLAM Wiki 2023 en Uruguay y GLAM Wiki 2018 en Israel) e ingresamos la información sobre los eventos y actividades que tuvieron lugar durante las mísmas. La razón para trabajar en estos eventos en particular es que combinan un alcance internacional con un enfoque en la colaboración con instituciones de patrimonio cultural, lo que coincide con nuestra visión de Metabase como un recurso para alianzas de contenido. Supusimos que allí podríamos encontrar muchas presentaciones y documentos relevantes.
El segundo enfoque se centró en temas concretos. Elegimos OpenRefine como tema de interés. Este software de código abierto es utilizado ampliamente en la comunidad Wikimedia para subir y editar contenido tanto en Wikidata como en Wikimedia Commons. La Mesa de Ayuda del Hub de Alianzas de Contenido, la infraestructura de apoyo de Wikimedia Sverige para el Movimiento, recibe periódicamente solicitudes de voluntarios y afiliados que pueden administrarse mediante OpenRefine, por lo que somos conscientes de que existe una gran necesidad entre los wikipedistas de aprender a utilizar el software en diferentes contextos.
Además de los wikipedistas, OpenRefine es utilizado por periodistas de datos, científicos y profesionales de la información, entre otros. Dado que el software tiene una amplia gama de aplicaciones en varias comunidades, se han creado muchos recursos de información y creemos que vale la pena el esfuerzo de recopilarlos en un solo lugar para facilitar el intercambio de conocimientos entre comunidades. Los recursos adoptan una amplia gama de formatos, desde páginas de ayuda en las plataformas Wikimedia hasta publicaciones de blogs, videos de YouTube, diapositivas de presentaciones y artículos académicos.
Otro aspecto de OpenRefine que lo convierte en un tema interesante para este estudio de caso es que las funciones de Wikimedia Commons son relativamente nuevas, lo que genera un gran interés entre los Wikimedistas que desean comenzar a usarlo para la carga de archivos y el trabajo de SDC. Para ello, necesitan poder localizar y acceder a los recursos disponibles, lo cual es exactamente lo que Metabase pretende facilitar.
Entrada de datos de eventos
El flujo de trabajo para ingresar datos de un evento de varias partes, como una conferencia, es el siguiente:
- Localice el programa de la conferencia.
- Cree un elemento para la conferencia.
- Cree elementos para cada sesión.
- Cree los elementos necesarios para describir los detalles de la sesión, como la(s) persona(s) y la(s) organización(es) involucradas, el idioma de la sesión o el tema principal.
- Vincule los elementos de la sesión con el elemento de la conferencia utilizando parte de / tiene parte(s).
- Cree un elemento para la presentación de diapositivas utilizada (si la hay), y vincúlelo con el elemento de la sesión utilizando utiliza / utilizado por.
Véase, por ejemplo, la sesión Una pieza faltante del rompecabezas: proporcionando apoyo directo para las alianzas de contenido a través de la Mesa de Ayuda en el Hub de Alianzas de Contenidos en la conferencia de GLAM Wiki 2023.
El formato de la sesión
¿Qué es una sesión de conferencia? Intuitivamente, al principio supusimos que cada sesión descrita en el programa de la conferencia sería una presentación discreta. Sin embargo, resultó que no era así. Varias presentaciones independientes de diferentes oradores se pueden agrupar en una sesión temática bajo un título común. Esta sesión tendrá una entrada en el programa de la conferencia. Se trata de un formato típico de las charlas relámpago (lightning talk), pero no se limita a ellas. Debido a esto, decidimos utilizar un modelo de sesión:
- Una conferencia consta de varias sesiones.
- Estas esta enlazadas mediante el uso de parte(s) / parte de.
- Una sesión puede ser un evento híbrido, presencial o en línea. Esto significa que cada sesión tiene dos declaraciones instancia de.
- Una sesión consta de una o varias actividades específicas. Por ejemplo, puede contener tres presentaciones separadas de diferentes oradores sobre el mismo tema. Lo que las une es que están agrupadas como una sesión en el programa. Esto se modela utilizando tiene parte(s) de la clase y el calificativo cantidad.
- Ejemplo: Wikidata para el patrimonio cultural, el cual contiene tres presentaciones. Compare la descripción en el programa de la conferencia.
- Una sesión puede tener uno o varios oradores (personas que presentan) o líderes (personas que facilitan una actividad práctica, como un taller).
Entrada de datos por temas
Para introducir datos sobre los recursos relacionados con un tema particular, se deben identificar los recursos. Se utilizaron las siguientes fuentes:
- Categorías de Wikimedia Commons Presentaciones de diapositivas de OpenRefine y Presentaciones de video de OpenRefine.
- OpenRefine/Presentaciones en Meta.
- Programas de las principales conferencias de Wikimedia, como Wikimania y Wikidatacon.
- Búsquedas en Google.
Debido a nuestras propias limitaciones y sesgos, la mayoría de los recursos identificados estaban en inglés.
Resultados
Eventos
Las conferencias GLAM Wiki 2023 y 2018 se introdujeron en Metabase. Las dos conferencias cubren 146 sesiones. Se utilizaron 100 términos de índice únicos (palabras clave) para describir los temas de las sesiones.
Mostrar consultas SPARQL
- Todas las sesiones de la conferencia GLAM Wiki 2023.
- Temas de la conferencia GLAM Wiki 2023.
- Grabaciones de video de la conferencia GLAM Wiki 2023 en Wikimedia Commons.
Temas
Actualmente, en junio de 2024, hay 74 elementos con una declaración tema principal = OpenRefine. Una gran cantidad de ellos son eventos, como sesiones de conferencias. 46 de ellos son diferentes tipos de documentos publicados, que incluyen principalmente diapositivas de diferentes presentaciones, pero también una serie de grabaciones de video, tutoriales y publicaciones de blogs. La mayoría de ellos están en inglés, con una pequeña cantidad de recursos en sueco y otros idiomas de Europa occidental, lo que refleja nuestras limitaciones a la hora de localizar los recursos —y deja en claro lo importante que es que contribuyan más participantes de diferentes procedencias— ya que creemos que existen otros recursos en otros idiomas. Otra ventaja de usar Metabase para examinar los recursos disponibles es que hará mas fácil la detección de patrones —¿qué idiomas están sobrerrepresentados y cuáles subrepresentados, en relación con la cantidad de wikipedistas que podrían necesitarlos?— y proporcionará una base para priorizar la creación y traducción de recursos en los idiomas más necesarios.
Podemos utilizar el hecho de que muchos de los recursos tienen múltiples declaraciones de "tema principal" para examinar qué temas aparecen con más frecuencia junto con "OpenRefine". Entre ellos se incluyen, como era de esperar, "Wikidata", "Wikimedia Commons" y "upload". Imaginamos que, a medida que aumenten nuestros datos, podremos obtener información interesante sobre diferentes temas que aparezcan simultaneamente.
Dado que los documentos publicados tienen una "fecha de publicación", es posible también representarlos gráficamente a lo largo del tiempo. Esto nos permite ver rápidamente qué recursos son los más antiguos y, por lo tanto, probablemente obsoletos; de esta manera evitamos su uso a la hora de asesorar a alguien sobre el material de aprendizaje más relevante. Poder ver los recursos más recientes es conveniente para aquellos que deseen ponerse al día con las ultimas funcionalidades de OpenRefine, como la integración con Wikimedia Commons.
Desafios y consideraciones
En general, ampliar nuestro alcance desde los propios datos de Wikimedia Sverige a recursos del movimiento Wikimedia global fue una experiencia desafiante pero también interesante. Nos dio la oportunidad de reflexionar sobre las prácticas actuales de gestión del conocimiento dentro del movimiento Wikimedia; lo cual sería necesario si quisiéramos mejorarlo.
Durante el trabajo se hicieron evidentes los siguientes problemas:
Calidad de los datos
La degradación de los datos resultó ser un problema, sobre todo al investigar conferencias y otros eventos. Esto fue relevante a la hora de recopilar el material en OpenRefine: para describir una presentación de diapositivas de una conferencia, necesitamos introducir al menos información básica sobre el evento.
Cuanto más retrocedamos en el tiempo, mayor será la probabilidad de que el programa original de la conferencia haya sido movido de su sitio web original, o incluso borrado por completo; no siempre se da el caso de que una copia instantánea de volumen (snapshot) hecha en el momento adecuado esté disponible en Internet Archive. Si bien los eventos organizados por el movimiento Wikimedia, y documentados en uno de los wikis, son relativamente fáciles de investigar, aquellos organizados por otros actores pueden requerir una búsqueda más profunda, especialmente si el programa se publicó en un formato no estándar o si solo está disponible para participantes registrados.
Dicho esto, no significa que los eventos organizados por el Movimiento sean siempre fáciles de modelar. Diferentes conferencias presentan sus programas en diferentes formatos; las diferentes ediciones anuales de una conferencia no son necesariamente consistentes. Es posible que información crucial, como el idioma de la sesión (en eventos multilingües) o la afiliación de los oradores, no sea visible de inmediato. Además, la documentación posterior a la conferencia, como presentaciones de diapositivas y grabaciones de vídeo, no siempre es fácil de encontrar y vincular a las sesiones específicas.
Alcance
Al trabajar con el material de OpenRefine, el tema del alcance se hizo evidente.
El hecho de que múltiples comunidades discretas estén usando y compartiendo información sobre la herramienta lo convierte en un caso interesante, y fue una de las razones por las que se seleccionó como tema central. Es posible que algunos wikimedistas no conozcan los recursos que ofrece la comunidad bibliotecaria y viceversa, pero los manuales sobre, por ejemplo, la edición de datos con GREL y Jython pueden ser útiles para todos los usuarios, independientemente del alcance de su trabajo.
Al mismo tiempo, cabe señalar que esta variedad de recursos disponibles, producidos tanto por wikimedistas como por no wikimedistas, nos obligó a reflexionar sobre el alcance exacto de Metabase. Sí, algunos materiales educativos que fueron creados pensando en quienes no son wikimedistas son de gran valor para la comunidad; un artículo sobre GREL puede ser valioso para cualquiera de nosotros incluso si no menciona Wikidata en absoluto. Pero, ¿dónde trazamos la línea? También está la cuestión de cómo abordar elementos como libros y artículos académicos, los cuales están dentro del alcance de Wikidata. Podría ser suficiente almacenar información básica sobre ellos en Metabase, para indicar que existen y que tratan sobre un tema relevante, pero la información bibliográfica detallada debería descargarse a Wikidata. Como mencionamos en Configurar una Wikibase desde cero, para los elementos que están dentro del alcance tanto de Metabase como de Wikidata, queremos que quede claro cuál de los proyectos debería ser el "responsable".
Amplitud vs profundidad
Al realizar el trabajo, tuvimos que encontrar un equilibrio entre describir las cosas de una manera tal que permita proporcionar toda la información que consideramos relevante, y utilizar nuestros recursos de personal limitados de manera eficiente. Si bien es normal tratar de investigar a fondo cada elemento, el objetivo, como se mencionó anteriormente, no era cubrir completamente el material disponible, sino ofrecer una amplia gama de ejemplos del tipo de información disponibles en Metabase.
Temas
Si analizamos el propósito de Metabase —facilitar la localización de los recursos relevantes del Movimiento— podemos observar que los temas ocupan una parte central. Sin un etiquetado preciso de los temas, los usuarios serían incapaces de clasificar el material e identificar lo que están buscando. Aún así, muchas veces tenemos problemas al intentar agregar palabras clave a presentaciones y demás, especialmente aquellas que no pertenecen a nuestras áreas de especialización. Si bien muchos programas de conferencias tienen temas asignados a las sesiones, estos suelen ser amplios, como "colaboración" o "GLAM". Para identificar palabras clave más informativas, como licencias de Creative Commons o museos de arte, hay que leer la descripción de la sesión, lo cual —obviamente— sólo podemos hacer si la sesión en cuestión está dentro de nuestra área de experiencia y podemos entender la descripción.
Falta de contribuciones externas
Cabe señalar que muchos de los desafíos enumerados aquí surgen del hecho de que estábamos trabajando en una prueba de concepto. Como se mencionó anteriormente, no esperamos que Wikimedia Sverige llene Metabase de datos por si mismo. Hemos preparado una plataforma, una base sobre la cual la comunidad puede construir. Esperamos que, con la ayuda de usuarios externos a nuestra organización, estos problemas se resuelvan orgánicamente.
Al mismo tiempo, somos conscientes de que desarrollar la estructura inicial de Metabase completamente por nuestra cuenta crea ciertos límites. Hemos tenido un pequeño número de personas trabajando en ello de forma intermitente durante un corto período de tiempo, lo que conlleva el riesgo de que las soluciones de modelado que hemos desarrollado no resulten utilizables para otros miembros del Movimiento. Hasta que no hayan usado y contribuido a Metabase, así también como recibido observaciones y sugerencias sobre su estructura y visión, no podremos saber si realmente es un proyecto útil.
Conclusiones e ideas para futuros trabajos
La idea de recopilar los recursos creados por la comunidad no es nueva. Por ejemplo, la Fundación Wikimedia intentó agregar la información sobre eventos e iniciativas contenidas en This Month in GLAM Newsletter. Somos conscientes y estamos impresionados por esta iniciativa de recopilación de información, y hemos comenzado a investigar formas de colaborar y hacer uso de los datos, para que sean accesibles a más personas a través de Metabase.
Ha habido también una iniciativa para recopilar información sobre las diferentes herramientas utilizadas en diferentes etapas de los proyectos de alianzas de contenido GLAM, llevada a cabo como parte del trabajo preparatorio para establecer el Hub de Alianzas de Contenido. También ha habido intentos de catalogar las numerosas herramientas que utiliza el Movimiento, como Toolhub y Hay's Tools Directory. Los afiliados de todo el mundo tienen sus herramientas y repositorios de conocimientos, como boletines, wikis y blogs. Todas las conferencias y otros eventos que organizamos, desde Wikimania hasta reuniones locales, se describen en diferentes lugares.
En otras palabras, hay suficiente espacio para facilitar el trabajo de los recolectores de conocimientos y para preparar a los buscadores de conocimientos para que tengan éxito. Creemos que Metabase puede convertirse en un hub donde se puedan recopilar todos estos tipos de información en una plataforma compartida, accesible para todos. Los recolectores de información de nuestro Movimiento hacen un trabajo increíble en condiciones que no son perfectas, con una gran cantidad de plataformas y herramientas disponibles. Y recopilar la información es sólo el comienzo; en realidad, no es conveniente a menos que todos los interesados puedan encontrar rápida y fácilmente lo que buscan.
Sin embargo, para que la plataforma tenga éxito, es necesario que contribuya a ella el mayor número posible de personas. Nuestro trabajo con el ingreso de datos hasta la fecha ha sido experimental y exploratorio: queríamos probar varios enfoques para la recopilación de datos, tanto desde un punto de vista de los eventos como temático. Wikimedia Suecia —o cualquier afiliado— no tiene las habilidades o recursos necesarios para realizar un seguimiento de todas las actividades de los afiliados y voluntarios en todo el mundo. Esperamos haber demostrado que Metabase es una plataforma en la que vale la pena invertir tiempo y esfuerzo, y esperamos poder ayudar a quienes quieran hacerlo.