Wikimedia Enterprise/FAQ
Wikimedia Enterprise | |
---|---|
enterprise.wikimedia.com | |
Descripción | |
Técnica | |
Lo que sigue son algunas respuestas intencionadamente breves a preguntas comunes. Para obtener más detalles y contexto sobre cualquiera de estos temas, lea el ensayo, los principios o la documentación técnica. Este proyecto se conocía anteriormente como “Okapi”.
General
¿Qué es?
Wikimedia Enterprise es principalmente una API de contenido de Wikimedia diseñada para los requisitos de gran volumen, alta velocidad y alta fiabilidad de organizaciones de tamaño muy grande que utilizan contenido de Wikimedia en sus servicios comerciales. Este servicio vendrá con una garantía contractual (un “Acuerdo de nivel de servicio” o SLA) para los clientes de pago.
The service include the content of all language editions of all Wikimedia sister projects except Wikimedia Commons and Wikidata. Including Wikidata information is high a priority on the development roadmap. You can learn more about the development progress via the monthly technical updates on the project's MediaWiki.org homepage.
Specifically, the API service is provided in three products:
- Snapshot: Retrieve an entire Wikimedia project, updated daily
- On-Demand: Retrieve any article from any Wikimedia project at anytime
- Realtime: Stream real-time updates from any Wikimedia project
¿Me afectará como editor o propietario de un bot?
No. Esto no cambiará la experiencia de edición como editor (humano o bot). Todas las APIs preexistentes seguirán estando disponibles.
¿Afectará la API empresarial a los volcados y APIs actuales?
The system of freely-provided database dumps and APIs remains in place and continues to be supported. They are not being removed or restricted and will continue to receive support and development. Part of the reason the Enterprise API is being built separately is in order not to disrupt the existing ecosystems.
In fact, the existing API ecosystem is currently being revamped under the "API Gateway" initiative. Until now, the APIs and services provided for re-use of Wikimedia content had to be able to support the needs of individuals and also extremely large companies such as search engines.
This resulted in a practical example of The tragedy of the commons – where making a single service equally available to all, allowed the largest to dominate, which reduced the quality of the service for everyone else. The existence of the Enterprise API, designed for the needs of the larger users, will allow the new API Gateway to be built for individuals and with restrictions against the larger commercial users (e.g. rate limits).
¿Por qué se llama “Enterprise”?
La API, el proyecto, y el equipo se llamaban anteriormente "Okapi"; se trataba de un nombre temporal a utilizar hasta que se determinara un nombre oficial definitivo. Un okapi es un lindo mamífero de África que convenientemente incluía las letras a-p-i en su nombre. El nombre "Wikimedia Enterprise" (y "Enterprise API") está destinado a dejar claro quiénes son los usuarios previstos del servicio: grandes empresas. Los criterios importantes para seleccionar este nombre fueron que no implica que el contenido de la API sea comercial o exclusivo, o que las API existentes estuvieran cambiando. La frase "Enterprise API" también aparece en la estrategia del movimiento y, por lo tanto, es coherente con su uso anterior en el movimiento. Finalmente, era importante encontrar un nombre que no interfiriera con los nombres existentes de los sitios web, afiliados, proyectos y equipos de Wikimedia.
El proyecto, y la API, no deben confundirse con el MediaWiki Stakeholders' Group o la Enterprise MediaWiki Conference - respectivamente, una organización independiente afiliada a Wikimedia que defiende las necesidades de los usuarios de MediaWiki fuera de la Fundación Wikimedia, incluyendo las empresas comerciales, y una serie de conferencias para esa comunidad.
¿Afectará directamente al contenido de Wikimedia?
No. La API permite el acceso en grandes volúmenes y a alta velocidad, y la reutilización del contenido de Wikimedia. No tiene control técnico o editorial sobre el contenido de los proyectos de Wikimedia. Por supuesto, de acuerdo con los derechos otorgados en el marco de licencias de cultura libre de Wikimedia, los reutilizadores de Wikimedia pueden crear trabajos derivados del contenido.
Al acceder al contenido de Wikimedia a través de este nuevo método de consumo único y al firmar un contrato de SLA, podremos asegurarnos de que los reutilizadores a gran escala sean más consistentes y precisos al mostrar los derechos de autor y las licencias para el contenido de Wikimedia. Cualquier reducción en la redifusión inadvertida de contenido vandalizado por parte de reutilizadores a gran escala beneficia a la comunidad: fortalece la reputación de nuestra comunidad de seleccionar contenido fiable y reduce la presión para los miembros de la comunidad dedicados a luchar contra el vandalismo. Con el tiempo, el equipo de Wikimedia Enterprise espera crear mecanismos para ayudar a los reutilizadores a reducir la probabilidad de que obtengan contenido vandalizado en sus productos. Si este trabajo da como resultado una mejor detección del vandalismo, las lecciones aprendidas y/o el código desarrollado se compartirán con la comunidad para mejorar las herramientas y los flujos de trabajo y, en consecuencia, para mejorar la integridad del conocimiento.
A largo plazo, el equipo de Wikimedia Enterprise también espera explorar métodos (por ejemplo, “micro-contribuciones”) para que nueva información pueda integrarse en los proyectos de Wikimedia por parte del público general que está utilizando productos fabricados por los clientes de Wikimedia Enterprise. Esto está de acuerdo con la recomendación de la estrategia del movimiento Mejorar la experiencia del usuario, que habla del uso de APIs para "... el potencial para el retorno de datos". En ese momento, se realizará la consulta a la comunidad adecuada para garantizar que dichas contribuciones puedan responder a las necesidades reales de la comunidad, y de una manera que cumpla con la cultura editorial de Wikimedia, la política de privacidad, los términos de uso, etc.
Will this stop errors/vandalism from appearing in search engine results
It will help.
By making a more consistent Wikimedia content-ingestion process for third-party organisations who operate at high scale and high speed, it will reduce the likelihood that they display vandalism and/or reduce the duration that it is displayed. The API feeds will not include exclusive vandalism detection features unavailable to the public, but it will enable existing signals to be more accessible to our reusers (such as ORES scores and the frequency with which an article is currently receiving edits). This will enable Enterprise's customers to have more tools at their disposal in order to make decisions for what to display and when.
Consistent with the principle of free-cultural-works, the Wikimedia Foundation does not control how reusers display Wikimedia projects' content, what context it is displayed, or with what other datasets it is combined. If you find an instance of Wikimedia content being used in an inappropriate context in a search engine result, its operator will have a procedure for providing feedback about it. By way of example, Google has a policy for "how to report a featured snippet".
¿Qué relación tiene esto con la estrategia del movimiento?
En las recomendaciones de la estrategia del movimiento Aumentar la sostenibilidad de nuestro movimiento y Mejorar la experiencia del usuario, hay recomendaciones para, respectivamente: “Explorar nuevas oportunidades tanto para la generación de ingresos como para la difusión del conocimiento libre a través de colaboraciones e ingresos obtenidos - por ejemplo ... Crear APIs a nivel empresarial”, y, "Hacer que el conjunto de APIs de Wikimedia sea más completa, fiable, segura y rápida, en asociación con usuarios a gran escala... y mejorar el conocimiento y la facilidad de atribución y verificabilidad para los reutilizadores de contenido”.
Al mismo tiempo, mejorar nuestra API contribuye significativamente a nuestro progreso en la Dirección Estratégica y en nuestra visión con contribuciones significativas al Conocimiento como Servicio y la Equidad del Conocimiento. En las palabras de la recomendación hacer que “el conjunto de APIs de Wikimedia sea más completa, fiable, segura y rápida, en asociación con usuarios a gran escala cuando esté alineado con nuestra misión y principios”, mejora “la experiencia del usuario tanto de nuestros usuarios directos como indirectos, aumentando el alcance y la visibilidad de nuestro contenido y el potencial de retorno de datos, y mejorar el conocimiento y la facilidad de atribución y verificabilidad para los reutilizadores de contenido”.
On top of the two aforementioned recommendations which Enterprise is explicitly connected to, it also has a role to play in several of the Strategy Initiatives. These include: "3. Increased awareness about the Wikimedia Movement", "36. Identify the impact of Wikimedia projects & content" and "misinformation", and "45. Adaptive policies". Muchas de las recomendaciones estratégicas implican un aumento de los ingresos a lo largo de todo el movimiento: es una estrategia ambiciosa y, en última instancia, costosa de implementar. Por lo tanto, la creación de la API empresarial durante los próximos años nos permite desarrollar esta nueva fuente de ingresos que ayudará a respaldar de manera sostenible el resto de estas recomendaciones.
Reconocemos que en la votación de la comunidad para priorizar el orden en que las recomendaciones deben recibir atención en el movimiento, estas recomendaciones específicas sobre las APIs estaban en la parte baja de la lista. Reconocemos y esperamos totalmente que las recomendaciones no sean de interés popular. Esta es una actividad que no afecta directamente a la comunidad de editores. Sin embargo, esta es una de las pocas recomendaciones cuya respuesta es responsabilidad exclusiva de la WMF. Esto significa que la WMF puede iniciar este proyecto de forma inmediata e independiente de cualquier otra actividad de la estrategia sin interrumpir, desviar la atención, o despriorizar al resto.
¿Dónde se ha discutido esto anteriormente?
La Fundación Wikimedia ha ofrecido servicios de datos de pago desde poco después de su creación, proporcionando canales para permitir que terceros alojen sus propias bases de datos locales. La creación de este servicio fue lo que llevó a la contratación inicial de Brion Vibber, y se utilizó para impulsar la Fundación Wikimedia en sus primeros años. El servicio se cerró a nuevos clientes en 2010 y fue finalmente dado de baja en 2014 principalmente por falta de mantenimiento.
La revisión de los servicios de datos a gran escala para ayudar a garantizar el éxito del movimiento, independientemente de cambios en los métodos de descubrimiento del contenido de Wikimedia, se discutió como una posible vía de exploración en 2015 y nuevamente en [[[mailarchive:wikimedia-l/2016-January/081126.html|Wikimedia-l en 2016]]. La idea fue presentada por dos grupos de trabajo durante la fase 2 del proceso de estrategia del movimiento, y el trabajo para mejorar el uso de APIs de terceros se identificó dos veces en las recomendaciones estratégicas finales (1, 2). El inicio del trabajo en el proyecto Enterprise API se planteó específicamente en Wikimedia-l a mediados de 2020.
Note: This FAQ was published in March 2021. At that time a Wikimedia blogpost was published, notices were placed in various mailinglists and on wiki, and many mainstream media stories covered it–most notably in WIRED. This resulted in significantly more community discussion on this talkpage, on central discussion hubs on many wikis, and in social media. A comprehensive list of independent media which wrote stories about this topic is published at Wikimedia Enterprise#Press. In October 2021 a WMF Press Release announcing the product is commercially available, and a report by the Open Future institute were published. This was followed in June 2022 with another Press Release announcing the project's first customers and the self-signup system. A new "news" page for the project has been created at https://enterprise.wikimedia.com/news/ and all future announcements from the project will be published there.
Aspectos económicos
¿Se trata de “vender” o “obligar a las grandes empresas tecnológicas a pagar” por Wikipedia?
No. Todo el contenido de Wikimedia está disponible bajo licencias gratuitas y puede ser utilizado por cualquier persona para cualquier propósito. Eso no se cambiará ni se puede cambiar. El servicio Enterprise API es un nuevo método para entregar ese contenido a un volumen y velocidad diseñados específicamente para las necesidades de las principales organizaciones comerciales que ya están utilizando el contenido de Wikimedia comercialmente. La API empresarial está vendiendo el servicio de este nuevo método de acceso, pero no impide que nadie (incluidos los clientes potenciales) utilice los métodos de acceso gratuitos existentes.
Muchos gobiernos y sectores profesionales (como el periodismo) de todo el mundo están debatiendo actualmente cómo construir un modelo económicamente sostenible mientras se trabaja con las “grandes tecnológicas”. La construcción de la API de Wikimedia Enterprise crea un mecanismo para que aquellas organizaciones comerciales que han construido modelos de negocios a partir del uso de contenido de Wikimedia disponible gratuitamente también inviertan en el movimiento de Wikimedia de una manera fiable y continua.
¿Podrá la comunidad acceder a la Enterprise API sin pagar?
Si. Para el acceso masivo, se proporcionará una copia de la salida de la API a través del [$WMDumps servicio de volcados de bases de datos públicas], actualizado quincenalmente. Esta es la misma frecuencia que ya están proporcionando otros volcados en XML.
Daily dumps + hourly diffs are provided via the Data Services portal, available to anyone with a Wikimedia cloud services account.
A "trial" version of the live service is also available via the product's website at no cost. This version is primarily designed to allow potential commercial customers to investigate the service and therefore it has a restricted maximum rate/usage. Nonetheless, it is allowed (and indeed encouraged!) for Wikimedians to register and use this service for themselves too. People with a mission-relevant use-case for the paid version of the service that is not addressed by the above, or by other Wikimedia services, can be provided with ongoing free access.
¿Cómo se gastará el dinero?
La dirección estratégica que pretendemos alcanzar en 2030 requiere, entre otros objetivos, una expansión a gran escala en idiomas poco soportados de todo el mundo y esto requerirá un aumento significativo de los ingresos. Más allá de cubrir el coste del proyecto en sí, todos los fondos generados por los clientes de Enterprise se utilizarán para respaldar la misión de Wikimedia. Esto incluye la inversión en los proyectos de Wikimedia, en la comunidad, en nuestras organizaciones del movimiento, y en el Wikimedia Endowment. En estos primeros días, es difícil predecir cuándo Wikimedia Enterprise alcanzará la rentabilidad y aún más difícil predecir con exactitud la cantidad de beneficios que producirá en los próximos años. Una vez que tengamos una imagen más clara de los plazos y la rentabilidad, la Junta Directiva podrá planificar cómo quiere invertir los beneficios para apoyar la misión. Es probable que falte al menos un año para eso.
In these early days, it is difficult to predict when Wikimedia Enterprise will reach profitability and even more difficult to accurately predict how much profit it will produce over the next few years. Once we have a more clear picture of timing and profitability, the Board of Trustees can plan for how they want to invest the profits to support the mission. That is likely to be at least a year away.
¿Cuánto dinero recaudará?
The annual financial reports are collated here, beginning in 2022 - the project's first year of operation. This information is also included within the scope of the overarching Wikimedia Foundation annual financial reports. Though not a legal requirement, the publishing of the LLC's financial information separately, and in greater granularity, from the overarching WMF report allows greater transparency of financial operations for this specific project.
Como era de esperar, esta es una de las preguntas más importantes desde la perspectiva del modelo de negocio, y también es imposible de responder por adelantado. Se ha llevado a cabo una investigación considerable para conocer qué necesitan y quieren los clientes potenciales de la Entreprise API, lo que ha determinado el desarrollo del producto y, en consecuencia, las estimaciones de ingresos potenciales a lo largo del tiempo. Una cosa está clara: esto no reemplazará nuestra necesidad de ser financiados por donaciones de lectores. De hecho, esperamos que la gran mayoría de nuestros fondos provengan siempre de donaciones. De acuerdo con el principio operativo de honestidad y transparencia de Wikimedia Enterprise, publicaremos los ingresos y gastos generales, diferenciados de los de la Fundación Wikimedia en general, al menos una vez al año. También publicaremos un registro actualizado periódicamente de los clientes comerciales actuales cuyo coste de contrato excede el montante por el que un regalo equivalente a la Fundación Wikimedia requeriría notificación a la junta directiva.
In accordance with the Wikimedia Enterprise operating principle of honesty and transparency we will publish overall revenue and expenses, differentiated from those of the Wikimedia Foundation in general, at least annually. Furthermore, as per the Wikimedia Foundation Board's statement, it will be notified in advance of all agreements expected to generate revenue in excess of $250,000 USD annually, allowing time for any concerns to be raised. This is consistent with how the Wikimedia Foundation treats large corporate donations.
As per the project's financial goals that were initially defined during the development-phase, the 2021-22 Annual Plan predicts "$10.2 million in contractual revenue and approximately $3.6 million in expense for Wikimedia Enterprise...".
¿Afectará esto a las donaciones para la recaudación de fondos?
No, la Fundación Wikimedia seguirá recibiendo la gran mayoría de su apoyo de los lectores. Creemos que esto es importante para que Wikipedia siga siendo independiente. El financiamiento derivado de millones de donaciones de lectores con un promedio de 15$ nos alinea con el interés público. Los ingresos de Wikimedia Enterprise complementarán nuestro soporte para lectores, pero no lo eclipsarán. La Enterprise API es un mecanismo para que los usuarios corporativos que ya se benefician de la reutilización del contenido de Wikimedia también contribuyan a los proyectos.
Aspectos técnicos
¿Es de código abierto?
Si. Aquí está: https://github.com/wikimedia/OKAPI
The specific purpose of this API's code, and this service, is to be useful to very large commercial organizations and their unique infrastructural, legal, and metadata requirements. Those organizations are unique not just in the sense of sheer scale but also unique relative to each other: with their own mutually-incompatible way of dealing with similar problems. Given that one of the stated principles of the project is "no exclusivity" of the API – either by contract, or by features – we need to ensure that no user (free or paid) should be unintentionally excluded from being able to use it. Therefore, it was considered preferable to publish stable versions. This ensures that no one builds upon, or has expectations for, code that is not yet fit for everyone's purposes.
Meanwhile, all of the development work itself is tracked as per Wikimedia standard practice publicly and “live” on phabricator.
¿Por qué utiliza infraestructura en la nube operada externamente/AWS?
Una de las principales necesidades de Wikimedia Enterprise es tener la capacidad de crear rápidamente prototipos y crear soluciones que puedan adaptarse a las necesidades de los clientes previstos de la API empresarial. Para hacer esto, hemos optimizado la iteración rápida, la separación de la infraestructura de los proyectos críticos de Wikimedia y la utilización de acuerdos de nivel de servicio (SLA) proporcionados. En el inicio, los servicios en la nube externos nos brindan estas capacidades. Si bien existen muchas ventajas de usar una nube externa para nuestro caso, reconocemos que también existen tensiones fundamentales, dada la cultura y los principios de cómo se construyen las aplicaciones en la Fundación. Las necesidades de los clientes potenciales de Enterprise API son importantes para lograr nuestra misión de hacer que el conocimiento esté disponible para todas las personas. Sin embargo, usar los recursos existentes de la Fundación Wikimedia para desarrollar productos que respondan a esas necesidades subsidiaría los requisitos de hardware de algunas de las organizaciones comerciales más grandes del mundo.
La API de Wikimedia Enterprise está alojada en Amazon Web Services (AWS), un sistema muy utilizado para este tipo de propósito. No obstante, no hay obligación contractual, técnica o financieramente de utilizar la infraestructura de AWS. Estamos almacenando contenido de Wikimedia disponible públicamente, datos de registro generales y datos de uso ligeros en AWS. Buscamos proporcionar acuerdos de nivel de servicio (SLA) a los clientes con garantías similares a las de Amazon. La infraestructura existente de la Fundación Wikimedia no proporciona información equivalente sobre el tiempo de actividad. Sin embargo, esto es algo que estamos explorando con Wikimedia Site Reliability Engineering.
Mientras tanto, estamos investigando alternativas a AWS (y permanecemos abiertos a ideas que puedan ajustarse a nuestro caso de uso) para el momento en el que este proyecto esté más establecido y tengamos la confianza de saber cuáles son las necesidades reales de infraestructura. Mientras tanto, la infraestructura de alojamiento de WMF sigue siendo completamente en propiedad, independiente y no se ve afectada por la Enterprise API.
¿Por qué es un sitio web .com?
La página de inicio del servicio es enterprise.wikimedia.com, en lugar de .org como otros sitios web operados por la Fundación Wikimedia, por las siguientes razones:
- Límites de seguridad y privacidad de los datos. Los dominios DNS actúan como límites técnicos para las políticas de privacidad y seguridad de los datos. Dado que Wikimedia Enterprise opera en una infraestructura separada, con políticas y controles separados, es más seguro no diluir ninguno de estos límites técnicos hospedando Wikimedia Enterprise en un dominio como "wikimedia.org" donde la Fundación Wikimedia opera los sitios actuales. La Fundación Wikimedia no opera ningún otro sitio dentro de "wikimedia.com", por lo que esto proporciona un límite limpio.
- Autenticidad. Está permitido que un proyecto con fines de lucro propiedad de una organización sin fines de lucro utilice un dominio .org. Sin embargo, el equipo de Wikimedia Enterprise consideró que es más preciso y honesto que el sitio web sea .com ya que es un proyecto con fines de lucro.
¿Cómo afectará esto a Wikidata o al servicio de consultas de Wikidata?
La API de Wikimedia Enterprise no afectará directamente a Wikidata ni al Servicio de consultas (WDQS). Si bien WDQS es un servicio importante para los reutilizadores masivos de Wikidata por establecer la base de su red de conocimiento, actualmente los objetivos de la enterprise API se centran en la transmisión de contenido cercano al tiempo real, que es un servicio diferente a WDQS. Eventualmente, parte de la información que los clientes de la Enterprise API obtienen actualmente a través de WDQS podría obtenerse a través de la API, lo que puede disminuir el volumen de uso del servicio WDQS. Por el momento, la API empresarial solo sirve datos de los proyectos “de texto” de Wikimedia.
¿Por qué no lo construyen ellos mismos?
Todos los potenciales clientes iniciales de Enterprise API ya están utilizando contenido de Wikimedia en sus productos en diversos grados. De forma independiente a los demás, invierten en extraer, reestructurar y estandarizar nuestro contenido para sus necesidades. Sin embargo, lo que no pueden hacer internamente es garantizar la velocidad, consistencia y fiabilidad de cómo los servicios de Wikimedia brindan ese contenido. Esto es algo que solo la Fundación Wikimedia puede ofrecer. Además, al proporcionar un producto disponible para cualquier cliente, la API empresarial crea igualdad de condiciones para las empresas más pequeñas que desean utilizar el contenido de Wikimedia en sus servicios, pero que no tienen los recursos internos de sus competidores más grandes para realizar las conversiones de datos necesarias.
What are Credibility Signals
This is the name for a feature of the API dataset. It helps to make the contextual information that Wikimedia editors use to make their editorial decisions more understandable within an API feed. For a full essay documenting the nature and purpose of this, see its dedicated documentation page.
When reviewing edit histories of articles editors will often take note of many factors. These include as whether an article has: suddenly received a lot of new edits; been recently edited by several newly-created accounts or by different ‘anonymous’ editors; had frequent edits being reverted; had its protection status or quality rating changed; or suddenly received more pageviews than normal. Credibility Signals is the turning of this contextual information and into data points in the API which third-party reusers can apply to make their own decisions about how to treat new revisions – in real time. For example: if an article is identified as being related to “breaking news” some reusers may wish to respond to this “signal” by updating their copy as rapidly as possible while others may wish to temporarily pause their updates.
This feature is not filters, rankings, or value judgements of “good vs. bad edits”. Nor is it an AI making decisions about content accuracy, truth or quality. A full list of fields can be drawn from in the creation of any given “signal” is listed at https://www.mediawiki.org/w/api.php In advancing the strategic goal of "Knowledge as a service", we hope that Credibility Signals will both expand the number of third parties which incorporate real-time information from Wikimedia, lower the barrier to entry of doing so, and decrease the instances in which vandalism etc. proliferates and in turn engender trust in Wikimedia content and the movement’s work.
What is Breaking News
Just like "Credibility signals", this is the name for a a feature of the API. It identifies new and likely "newsworthy" events as they are being written about across Wikipedia language editions at any given moment. These events are then marked with a boolean field, allowing API users to easily identify this kind of content within their copy of the dataset. For a full essay documenting the nature and purpose of this, and how you can access it yourself, see its dedicated documentation page.
Consistent with the Wikimedia Enterprise principles (in particular that of "no exclusive content") the information this API feature is built upon is already public information that Wikimedia editors are already commonly using in their content moderation workflows – for example "does this article have a sudden increase in the number of pageviews, or of unique editors?", "was this article recently created/moved and have a 'current event' template?". The feature turns that kind of information into a feed of articles which API users can treat differently, if they wish. For example to re-index these articles more rapidly, or to pause re-indexing entirely until the content becomes more stable. This feature does not imply a change of Wikipedia editorial policy: most particularly regarding notability, reliable sources – summarised in the English Wikipedia policy "NOTNEWS".
What is Structured Contents
Within the Enterprise API suite, Structured Contents refers to the features making Wikimedia data more machine readable: these efforts are both focussed on pre-parsing Wikipedia snippets as well as connecting the different projects closer together. The Structured Contents endpoint (beta) has been released in September 2023 to the On-demand API, as a means to both facilitate more frequent updates as well as improve transparency in the development process. This endpoint includes pre-parsed Wikipedia abstracts, main images, descriptions, infoboxes and sections. To access this structured information in bulk the Structured Contents Snapshot endpoint (beta) in some languages was released to testing partners, and a public version made available on Hugging Face. Features will be continued to be added to this endpoint, see the Mediawiki Updates page.
Aspectos legales
¿Por qué lo administra una subsidiaria?
La Fundación Wikimedia ha creado una sociedad de responsabilidad limitada (LLC) de un solo miembro, y es esta LLC la que firmará contratos con los clientes de Enterprise API. La estructura LLC aislará a la Fundación de las responsabilidades generadas por el servicio. Este es un enfoque estándar cuando una organización sin fines de lucro realiza una actividad con fines de lucro y nos ayudará tanto a administrar el riesgo como a promover la transparencia. Dicho esto, la Fundación todavía está obligada según la ley de EE. UU. a divulgar públicamente los ingresos y gastos de la LLC en nuestras declaraciones de impuestos anuales (consulte los informes financieros auditados aquí). La LLC opera bajo los auspicios de la Fundación Wikimedia, su personal es personal de la Fundación Wikimedia y, en última instancia, está sujeto al gobierno de la junta directiva de la Fundación Wikimedia. El registro legal de la LLC puede encontrarse en el [$SoD Estado de Delaware, División de Sociedades], Nombre de la entidad: Wikimedia, LLC, Número de expediente: 7828447.
You can view the contracts which form the legal relationship between the Wikimedia Foundation and this LLC at the "Wikimedia Enterprise" page on the WMF Governance Wiki. These are:
- "LLC operating agreement" which formally establishes the LLC and the WMF as its sole member
- "Inter-company license agreement" which discusses the right of the LLC to use Wikimedia trademarks etc.
- "Cost-sharing agreement" which discusses how the LLC's revenues and expenses are accounted for with the WMF
The LLC's legal registration can be found at the State of Delaware, Division of Corporations, Entity name: Wikimedia, LLC, File number: 7828447. In the United States, Establishing a legal entity in the State of Delaware is common because the body of corporate law in Delaware is well-developed and easily understood. Using the LLC to operate Wikimedia Enterprise will help insulate the Wikimedia Foundation from exposure. The clarity of Delaware corporate law furthers that objective and also reduces legal costs in both the short and long term. As a non-profit, the LLC being registered in the state of Delaware creates no difference in our United States federal tax liability, or financial transparency in tax reporting requirements, than being registered in any other state.
The assessment of appropriate tax treatment of the LLC activities has been coordinated with the Wikimedia Foundation auditors KPMG.
¿Quiénes serán los “clientes”?
La API empresarial se diseñó inicialmente para las necesidades de un número muy reducido de organizaciones tecnológicas que son algunas de las empresas más grandes y ricas del mundo, comúnmente conocidas como “Big Tech”, aunque cualquier empresa puede convertirse en cliente. Como no habrá contratos exclusivos ni contenido exclusivo, el desarrollo de este producto también ayudará a brindar la capacidad de que las organizaciones comerciales más pequeñas tengan un “terreno de juego más equilibrado” para beneficiarse del uso del contenido de Wikimedia en sus productos.
By interviewing many organisations across many commercial sectors, it became clear that there are many more potential customers than just "big tech". Their needs are different and so the product roadmap will be adjusted over time to meet this demand – focusing on making it easier to integrate and understand Wikimedia's complex ecosystem of information (through things like credibility signals and subsets of information – see roadmap).
As stated in the original press release, Google and the Internet Archive are the first to receive paid and free access (respectively) but we have not publicized the subsequent customers (paid or free) who have signed up to the service. Maintaining a public and comprehensive list of paying and free/trial customers would look like advertising or promotion of those customers. It would also introduce a new privacy (and potentially security) problem: In the same way that it would be inappropriate to make a public list of "all individuals who have used the Wikidata Query Service this month" (for example), making a public list of all organizations who have used this service goes against our privacy culture. Nonetheless, we do intend to be making "use case" blog posts, which will describe how some users (either general categories or individual cases with their permission) are benefiting from the service in the real world. No one is required to publish whether, or how, they read or reuse Wikimedia content. This is consistent with that practice.
Publicaremos y mantendremos una lista de los clientes comerciales actuales cuyo coste de contrato excede el montante por el que un regalo equivalente a la Fundación Wikimedia requeriría notificación a la junta directiva (aunque esta lista solo puede actualizarse periódicamente). Como organización con sede en los EE.UU., no está legalmente permitido hacer negocios con organizaciones con sede en ciertos países, según lo determina la Oficina de Control de Activos Extranjeros.
¿Qué hay en los contratos?
Los contratos con los clientes generalmente incluirán términos que rigen la duración del compromiso, el tipo de atención al cliente y el tiempo de actividad esperado, el coste, los mecanismos para resolver disputas, garantías sobre la atribución apropiada al contexto y la información de licencias, y restricciones sobre la reutilización de la API para crear una negocio que sea competencia (al tiempo que reafirma la licencia de cultura libre subyacente del contenido). Como se describe en el documento de principios, el contrato no otorgará contenido exclusivo, acceso exclusivo, datos privados o de usuario, o influencia editorial; y no incluirá restricciones sobre cómo se puede usar el contenido que sean contrarias a las licencias de copyleft del contenido en sí.