Jump to content

위키미디어 재단 연간 계획/2017-2018년/최종/프로그램/기술

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Wikimedia Foundation Annual Plan/2017-2018/Final/Programs/Technology and the translation is 100% complete.

기술에 대하여

기술 부서는 안정적이고 빠르며 안전한 위키미디어 프로젝트에 대한 글로벌 액세스를 지원합니다. 이 팀은 성능, 가용성, 개발 인프라, 기술 운영, 보안, 아키텍처, 릴리스 관리, 분석 엔지니어링 및 연구를 지원합니다. 대규모 팀 중 하나인 이들은 사용자의 개인정보와 신뢰를 보호하는 방식으로 최대한 많은 사람들이 가능한 한 많은 장치에서 프로젝트, 서비스 및 개발 경로를 사용할 수 있도록 대부분의 핵심 작업을 지원합니다.

우리는 제품 개발자가 소프트웨어의 기능을 향상하고 강화할 수 있는 도구와 인프라를 제공하여 발전을 지원합니다. 우리는 창의적이고 의욕이 넘치는 개인이 자신의 아이디어를 안정적이고 사용하기 쉽고 안전하며 확장 가능한 작동하는 소프트웨어로 변환할 수 있는 경로를 만듭니다.

우리는 제품 팀과 긴밀히 협력하여 지속적인 이니셔티브를 지원하고 개발 종속성을 다룹니다. 우리는 비용 평가, 유용성 분석, 오류 예측, 개인 정보 보호 평가, 보안 검토, 영향 예측 및 대안 제안을 통해 조직 내 제품 팀 및 기타 부서와 기술에 대한 올바른 선택을 위한 움직임을 지원함으로써 조언을 제공합니다.

또한 우리는 새로운 제품이나 기능이 구축되기 전에 연구를 제공하는 제품 대상 고객과 협력합니다. 우리는 연구를 수행, 활성화 및 검토하여 개념을 검증하고 반복하며 유용성을 보장하고 제품이 사용자의 요구 사항에 맞게 제작되었는지 확인합니다. 우리는 기여에 대한 장벽을 해소할 수 있는 최선의 방법을 찾을 수 있도록 연구를 수행하고 서비스를 탐색합니다. 우리는 업계 및 학계와의 공식적인 협력을 통해 조직의 노력을 확장합니다.

2017-18년의 새로운 이니셔티브에는 미디어위키 플랫폼에 대한 새로운 강조와 집중, 위키미디어 클라우드 서비스 팀 출범, ORES의 기계 학습 기능 확장이 포함되어 편집자들이 고품질 콘텐츠를 더 빠르고 쉽게 만들 수 있도록 지속적으로 지원합니다. 또한 올해에도 기술의 모든 작업은 프로그래밍 방식으로 이루어졌습니다. 우리 프로그램의 하이라이트에는 기술 부채를 줄이고 재단 내부 및 외부의 기술 커뮤니티를 강화하기 위한 공동의 노력이 포함됩니다. 우리 연구팀의 주요 이니셔티브는 편집자들이 작업의 우선순위를 정할 수 있도록 추천 기술을 사용하여 다국어 콘텐츠를 늘리려는 노력입니다.

프로그램 1: 가용성, 성능 및 유지 관리

팀: TechOp, 클라우드 서비스, 성능, 분석, 출시 엔지니어링, 서비스

전략적 우선순위: 이는 도달 범위, 커뮤니티, 지식 등 모든 전략적 우선순위에 강력하게 적용됩니다. 이는 모든 위키미디어 사이트가 전 세계 편집자와 독자를 위해 연중무휴 24시간 안정적으로 계속 실행되기 위해 필요한 기본 작업입니다. 이 작업이 없으면 재단(또는 커뮤니티)의 다른 프로그램을 실행할 수 없습니다.

기간: 영구

요약

위키미디어 재단은 세계에서 가장 인기 있는 웹 사이트 중 하나를 운영하고 있으며 프로그래밍 작업의 일환으로 추가 기능과 서비스를 배포하면서 계속해서 확장하고 있습니다. 이러한 리소스는 높은 수준의 가용성, 안정성, 보안 및 성능으로 유지 관리되어야 합니다.

목표

우리는 전 세계 사용자를 위해 위키미디어 사이트와 서비스의 가용성을 유지하고 이들이 안정적이고 안전하게 고성능으로 실행되도록 보장할 것입니다. 우리는 인프라를 현대화하고 소프트웨어 및 하드웨어의 테스트, 배포, 유지 관리와 관련된 현재 서비스 수준을 향상시키면서 이를 수행할 것입니다.

성과, 목표 및 이정표

성과 1: 모든 생산 현장과 서비스는 현재 수준 이상의 가용성을 유지합니다.

  • 목표 1: 프로덕션 서비스(트래픽 인프라, 데이터베이스 및 저장소, 미디어위키 응용 프로그램 서버, (마이크로)서비스, 네트워크, 기타 사이트 및 서비스) 배포, 업데이트, 구성 및 유지 관리
  • 목표 2: 새로운 서비스의 아키텍처 설계 지원 및 대규모 운영 지원
  • 목표 3: 조달부터 고장 수리, 폐기까지 데이터 센터 인프라 및 장비 수명주기를 유지합니다.
  • 목표 4: 사고 대응, 진단, 스택 전체의 시스템 중단 또는 경고에 대한 후속 조치

성과 2: 우리의 모든 사용자는 지속적으로 좋은 성능을 발휘하는 시스템을 경험합니다.

  • 목표 1: 플랫폼 성능을 측정하기 위한 포괄적인 도구 세트를 유지합니다.
  • 목표 2: 자동화를 통해 적시에 성능 저하를 파악하고 해결합니다.
  • 목표 3: 성능 도구 세트를 현대화합니다. 우리는 사용자가 경험하는 것과 더 가까운 성능 지표를 측정할 것입니다.

결과 3: 우리는 데이터 전송을 위한 확장 가능하고 안정적이며 안전한 시스템을 보유하고 있습니다.

  • 목표 1: TLS 암호화를 포함하여 카프카 인프라를 티어-1 요구 사항으로 통합
  • 목표 2: 더 많은 계산 리소스가 필요한 새로운 사용 사례를 지원하기 위해 현재 Hadoop 클러스터의 유지 관리 및 확장
  • 목표 3: 현재 서비스 수준을 유지하기 위한 분석 스택의 소프트웨어, 하드웨어 업그레이드 및 유지 관리

성과 4: 위키미디어 클라우드 서비스 사용자는 VPS 호스팅을 위해 안정적인 공용 인프라 서비스(IaaS) 제품 생태계를 활용할 수 있습니다.

  • 목표 1: 기존 오픈스택 인프라 및 서비스 유지
  • 목표 2: 현재 네트워크 토폴로지 계층을 대부분의 오픈스택 배포의 표준이 된 오픈스택 뉴트론으로 교체하여 기술 부채를 청산하고 핵심 오픈스택 플랫폼을 최신 지원 릴리스로 업그레이드할 수 있습니다.
  • 목표 3: 현재 단일 브로드캐스트 도메인 이상으로 물리적 리소스 배포를 확장하여 IaaS 제품에 대한 컴퓨팅 리소스의 가용성을 높입니다.

결과 5: 우리는 개발자를 위한 효과적이고 사용하기 쉬운 테스트 인프라와 도구를 보유하고 있습니다.

  • 목표 1: 기존 공유 지속적 통합 인프라 유지
  • 이정표 1: 자바스크립트 기반 브라우저 테스트 스택 개발 및 마이그레이션

성과 6: 엔지니어링 팀은 작업을 효과적으로 계획, 추적 및 완료할 수 있습니다.

  • 이정표 1: 기존 공유 코드 검토 플랫폼 유지 및 개선(게릿)
  • 이정표 2: 기존 공유 프로젝트 관리 플랫폼(파브리케이터) 유지 및 개선

프로그램 2: 미디어위키

: 미디어위키, TechOps

전략적 우선순위: 지식, 도달 범위 및 커뮤니티

기간: 24개월

요약

이 프로그램은 새로운 미디어위키 팀의 주요 활동 중 일부를 나타냅니다.

목표

우리는 미디어위키에 새로운 초점을 맞춰 새롭고 성능이 뛰어난 핵심 플랫폼을 위해 노력할 것입니다.

성과, 목표 및 이정표

성과 1: 미디어위키 개발의 이해관계자는 미디어위키의 진행 상황과 방향에 대한 감각을 갖게 됩니다.

  • 목표 1: 미디어위키 로드맵 개발
  • 이정표 1: 2017년 8월 31일까지 미디어위키 제품 관리자를 고용하세요.

성과 2: 미디어위키 코드 품질이 향상됩니다.

  • 목표 1: 측정된 단위 테스트 범위를 늘립니다.
  • 목표 2: 대규모 클래스와 소스 파일 분할

성과 3: 미디어위키 보안과 안정성이 향상될 것입니다.

  • 목표 1: 보안 및 사후 분석으로 인해 발생하는 작업 항목의 백로그를 해결합니다.

프로그램 3: 기술 부채 해결

팀: 릴리스 엔지니어링, 팀 시범 그룹

전략적 우선순위: 지식, 도달 범위, 커뮤니티

기간: 이 프로그램은 지속적인 프로세스를 생성하기 위한 것입니다.

요약

지난 15년 동안 위키미디어 재단은 "기술적 부채"라고 불리는 것을 쌓아왔습니다. 개발 속도를 제한하는 역사적 선택과 기술적 한계. 이 프로그램의 주요 목표는 전체 조직이 기술 부채 해결을 적절하게 식별하고 우선순위를 정하는 데 도움이 되는 관행을 개발하고 구현하는 것입니다. 이 프로그램은 재단이 구현하는 다른 모든 프로그램의 속도와 품질에 긍정적인 영향을 미칠 것입니다.

목표

위키미디어 개발자는 합리적인 시간 내에 나머지 기술 스택과 깔끔하게 통합되는 새로운 기능을 만들고 출시할 수 있습니다.

성과, 목표 및 이정표

성과 1: 위키미디어 "프로덕션" 서비스를 실행하는 고아 코드의 양이 줄어듭니다.

  • 목표 1: 일련의 코드 관리 수준 정의(높은 기대치에서 낮은 기대치까지)
  • 목표 2: 우선순위가 높고 사용률이 높은 코드 세그먼트 고아에 대한 관리인을 식별하고 찾습니다.
  • 목표 3: 제품 및 인프라를 채택하거나 고아화/폐기화하기 위한 경량 프로세스를 정의하고 관리합니다.

결과 2: 조직의 기술 부채가 감소합니다.

  • 목표 1: 기술 부채에 관해 모든 재단 엔지니어링 팀과 정기적으로 소통하는 "기술 부채 프로젝트 관리자" 역할을 정의합니다.
  • 목표 2: 재단 전체의 기술 부채를 정기적으로 처리하기 위한 프로세스를 정의하고 구현합니다.
  • 목표 3: 위키미디어 개발자의 대규모 모임(예: DevSummit 및 해커톤)에서 중요한 기술 부채 주제를 홍보하고 표면화합니다.

프로그램 4: 기술 커뮤니티 구축

: 클라우드 서비스, 연구 및 자료, 디자인 연구, 채점 플랫폼 (ORES), 미디어위키, 커뮤니티 참여, 리소스

전략적 우선순위: 커뮤니티, 도달 범위

기간: 12개월

요약

위키미디어의 소프트웨어 제품 및 플랫폼에는 코드 기여자, 문서 기여자, 버그 보고자, API 소비자, Wiki 작업 흐름 문제에 대한 혁신적인 솔루션을 구축하는 자원봉사자, 위키미디어 프로젝트에서 생성된 데이터를 조사하는 연구원, 가치- 위키미디어 무료 및 오픈 소스 소프트웨어 제품을 기반으로 서비스와 지원을 제공하는 공급업체와 다양한 이유로 위키미디어 운동에 의해 제작된 FLOSS 소프트웨어를 자신의 컴퓨터에 설치하고 사용하는 진정한 '제3자'가 추가되었습니다. 이러한 청중은 지식을 수집하고 전파하려는 운동의 가장 광범위한 목표에 직간접적으로 기여합니다. 그러나 그들이 항상 이러한 기여에 대해 잘 인정받고 업무에 지원을 받은 것은 아닙니다. 기술 커뮤니티 지원 프로젝트는 더 나은 문서를 제공하고, 커뮤니티 구축을 촉진하며, 이러한 커뮤니티와 재단 간의 더 나은 의사소통 경로를 구축함으로써 이러한 단점을 해결하려고 시도할 것입니다.

목표

우리는 기술 커뮤니티를 확장하고 강화하여 그들의 요구 사항을 이해하고 노력의 진행 상황과 결과를 측정하는 데 중점을 둘 것입니다. 특히 우리는 전통적으로 서비스가 부족한 세 가지 커뮤니티, 즉 도구 및 봇 개발자에 중점을 둘 것입니다. API 및 데이터 소비자 당사 소프트웨어의 제3자 사용자.

성과, 목표 및 이정표

성과 1: '도구'(봇, 웹 서비스 등) 및 기타 혁신적인 솔루션을 만들고 유지함으로써 위키미디어 운동에 기술적인 기여자가 되는 것은 역사적으로 그 어느 때보다 쉽습니다. 문서를 찾기가 더 쉽기 때문입니다. 일반적인 문제를 해결하는 데 필요한 시작부터 끝까지 단계를 포괄적이고 설명합니다. 클라우드 서비스 제품 사용자는 문서화 및 상호 지원을 통해 공유하는 문화가 있는 커뮤니티의 일부로서 자신의 지식을 다른 사람들과 편안하게 공유할 수 있습니다.

  • 목표 1: 커뮤니티와 협력하여 기존 클라우드 서비스 제품의 문서를 업데이트하기 위해 문서 특별 관심 그룹를 작성하려는 자원 봉사자를 찾습니다.
  • 목표 2: 초기 계정 생성, 기능적 웹 서비스 배포, 기능적 봇 배포, 변형이 포함된 주기적인 작업 실행 등을 포함하되 이에 국한되지 않는 일반적인 문제에 대한 튜토리얼 콘텐츠를 만듭니다. 해당되는 경우 둘 이상의 구현 언어(예: PHP, 파이썬 등)에 대한 변형을 생성합니다.
    • 이정표 1: 기술 문서 작성 계약자를 고용하세요.
    • 이정표 2: 사용자는 필요한 문서를 찾을 수 있습니다. "문서를 쉽게 찾을 수 있습니다"라는 연례 개발자 설문조사 질문에 대한 동의/비동의 비율이 이전 설문조사에 비해 향상되었습니다.

성과 2: 위키미디어 기술의 채택은 신뢰성 있게 측정될 수 있습니다.

  • 목표 1: 일련의 공식 KPI(핵심 성과 지표)를 설계하여 기술 대상의 성장과 다양성을 측정합니다.

성과 3: 위키미디어 소프트웨어를 기반으로 서비스와 지원을 제공하는 부가가치 공급업체와 위키미디어 운동에 의해 생산된 소프트웨어를 자신의 컴퓨터에 설치하고 사용하는 진정한 '제3자'는 권장, 배포, 그리고 위키미디어 FLOSS 프로젝트를 확장합니다.

  • 목표 1: 제3자 사용자 지원을 통해 소프트웨어 프로젝트를 위한 전담 기술 연락 담당자의 존재를 홍보하여 제3자를 위한 정식 연락 창구를 구축합니다.
  • 목표 2: 제3자 사용자에 대한 재단의 단기 및 장기 약속을 명확히 합니다. 위키미디어 소프트웨어 프로젝트를 위한 다계층 제3자 지원 수준 시스템을 생성, 게시 및 홍보합니다. 기존 FLOSS 프로젝트의 지원 수준을 문서화하고 문서화된 지원 수준이 제공되는지 확인합니다.

성과 4: 업계 및 학계 연구와의 협력이 더욱 확장되고 지원되므로 더 많은 연구 결과와 데이터 세트가 오픈 라이센스에 따라 게시되고 배포됩니다. 이는 전략적으로 중요한 문제를 해결하는 데 도움이 됩니다.

  • 목표 1: 학계의 관심을 운동에 전략적으로 중요한 문제에 맞춰 조정하는 데 도움이 되는 연례 위키 연구 워크숍을 조직하고 주최합니다. 지난 3년간 그래왔듯이 계속해서 주요 학회에서 연구 워크숍을 성공적으로 운영해 보세요.
  • 목표 2: 조직이 연구 프로젝트를 수행하는 데 드는 전체 비용을 줄이기 위해 업계 및 학계와의 공식 연구 협력을 위한 현재 역량을 유지합니다. 2017년 3월 현재 위키미디어 연구 부서는 오픈 액세스 정책에 따라 30명의 협력자와 협력하고 있습니다.

성과 5: 참가 요청 및 장학금 요청이 시작되기 전에 발표된 하나의 전략적 주제에 초점을 맞춘 최대 50명의 수석 기술 기여자가 3일 동안 진행하는 회의로 위키미디어 개발자 서밋을 조직합니다.

  • 목표 1: 행사 4개월 전에 게시된 개발자 서밋 웹 페이지에는 날짜와 장소(최소한 가장 가까운 공항), 주요 주제, 참가 요청, 장학금 요청 요청, 마감일이 포함된 달력이 포함되어 있습니다. 주요 주제와 관련된 WMF가 아닌 이해관계자를 대표하여 이벤트(선호) 또는 온라인에 초대하고 참여합니다.
  • 목표 2: 프로세스를 통해 잠재 참가자는 주요 주제에 대한 진술과 제안을 제출할 수 있으며 프로그램 위원회는 이를 검토하고 결정을 통보할 수 있습니다. 이벤트에서 다뤄져야 할 사항을 파악하기 위해 모든 관련 이해관계자가 참여하는 이벤트 전에 토론이 시작됩니다.
  • 목표 3: 서밋 중 활동은 잘 문서화되어 있으며, 특히 결과와 조치는 더 나은 평가와 후속 조치를 위해 체계적인 방식으로 정리될 것입니다.

프로그램 5. 채점 플랫폼(ORES)

: 채점 플랫폼 (ORES), 연구 및 데이터, 운영, 서비스

전략적 우선 순위:

  • 지식: 우리는 커뮤니티와 협력하여 기계 예측을 사용하여 프로젝트 콘텐츠의 품질과 적용 범위를 높이고 있습니다.
  • 도달 범위: 우리는 신흥 커뮤니티에 대한 지원을 목표로 하기 위해 커뮤니티 참여와 협력하고 있습니다.
  • 커뮤니티: ORES는 부담스러운 큐레이션 프로세스를 쉽고 효율적으로 수행하도록 도움으로써 개발자 커뮤니티와 편집자를 간접적으로 직접 지원합니다.

기간: 6-9년. 그때까지 우리는 플랫폼에서 누락된 구성 요소를 구축하고 다른 사람들이 우리의 뒤를 따를 수 있도록 모범 사례 문서를 게시할 것입니다.

요약

인공 지능(AI)은 편집자가 수행해야 하는 작업을 줄이고 독자에 대한 콘텐츠의 가치를 향상시켜 프로젝트 규모를 확장하는 데 도움이 되는 큰 잠재력을 가지고 있습니다. 그러나 AI는 또한 새롭고 교활한 방식으로 편견을 영속시키고 목소리를 침묵시킬 수 있는 잠재력도 가지고 있습니다. ORES는 이미 위키미디어 재단 내외에서 많이 채택되고 있는 대용량 기계 학습 예측 서비스입니다. 새로운 위키 프로세스를 지원하고 감사 도구를 구현하기 위해 서비스를 확장함으로써 예측 편향의 영향을 식별하고 완화하는 데 도움이 될 것입니다.

목표

다음 회계연도에는 효율성과 정확성, 투명성, 윤리성, 공정성의 균형을 맞추기 위해 ORES 및 관련 기술을 더욱 개발하기 위한 전담 팀을 구성할 것입니다.

성과, 목표 및 이정표

성과 1: 도구 개발자와 제품 팀은 기계 예측을 사용하는 도구를 혁신하여 위키 작업을 더욱 효율적으로 만들 수 있습니다.

  • 목표 1: 문서 훼손 및 선의의 탐지 모델을 더 많은 위키로 확장(신흥 커뮤니티에 초점)
  • 목표 2: CE 및 커뮤니티 연락원과 협력하여 신흥 커뮤니티에 초점을 맞춘 새로운 위키 지원을 위한 더 나은 프로세스를 개발하고 구현합니다.
  • 목표 3: ORES 서비스, 관련 도구 및 기여 프로세스에 대한 문서화 개선
  • 목표 4: 전문 기술 작가와 협력하여 AI 시스템 문서의 일관성을 높입니다.

성과 2: 자원봉사자는 위키에서 예측 편향 및 기타 AI 실패의 추세를 추적할 수 있는 권한을 부여받습니다.

  • 목표 1: 예측을 개선/수정하기 위해 커뮤니티 의견을 사용하는 모범 사례 개발
  • 목표 2: 인간의 재판단을 사용하여 (1) 모델 재훈련, (2) 모델 적합성의 변화를 사용자에게 보고, (3) 사용자가 예측 모델을 이해하는 방법 학습을 실험합니다. 관련 보고서 및 프로세스 문서를 게시합니다.

프로그램 6. 간소화된 서비스 제공

: TechOps, 출신 엔지니어링, 서비스

전략적 우선순위: 커뮤니티

기간: 이 프로그램은 12개월 이상 소요됩니다. 아래 목표는 회계연도 17-18년 내에 완료될 것으로 예상되는 작업을 나타냅니다.

요약

우리는 애플리케이션의 통합 개발, 테스트, 배포 및 호스팅을 위한 새로운 생산 플랫폼을 구축하여 서비스 제공을 간소화하고 통합할 것입니다.

목표

우리는 애플리케이션의 통합 개발, 테스트, 배포 및 호스팅을 위한 새로운 생산 플랫폼을 구축할 것입니다. 이를 통해 서비스 제공 및 수명주기 전반에 걸쳐 서비스 유지 관리의 복잡성과 속도가 크게 줄어들고 팀 간의 종속성이 줄어들고 자동화 및 통합이 향상됩니다. 이 플랫폼은 자동 고가용성 및 확장 지원, 하드웨어 추상화, 개발부터 테스트, 배포까지의 간소화된 경로를 통해 더 많은 유연성을 제공합니다. 안정성과 보안을 높이기 위해 서비스는 서로 격리됩니다.

위키미디어 개발자와 제3자 사용자는 개발 또는 자신의 사용 사례를 위해 스택을 쉽게 복제할 수 있는 기능의 이점을 누릴 수 있습니다.

이 작품은 또한 미래에 대한 투자를 나타냅니다. 비록 이것이 회계연도 17-18년 내에 아직 크게 실현되지는 않겠지만, 이 프로젝트는 결국 자본 지출(하드웨어 용량 통합을 통해)과 직원 시간(개발, 테스트, 배포 및 유지 관리 간소화를 통해) 모두에서 상당한 비용 절감 효과를 가져올 것입니다.

성과, 목표 및 이정표

성과 1: (마이크로)서비스의 원활한 제품화 및 운영이 가능합니다.

  • 목표 1: 적절한 용량을 갖춘 프로덕션 준비 쿠버네티스 클러스터 설정
  • 목표 2: 쿠버네티스에서 애플리케이션을 실행하기 위한 표준화된 애플리케이션 환경 만들기

성과 2: 개발자는 프로덕션 배포를 위한 통합 파이프라인을 통해 애플리케이션을 개발하고 테스트할 수 있습니다.

  • 목표 1: 컨테이너에서 애플리케이션을 구축하고 테스트하기 위한 지침과 추상화 생성
  • 목표 2: 프로덕션을 안정적으로 재현하는 테스트 및 스테이징 환경을 통해 새로운 버전의 애플리케이션을 프로덕션에 게시하기 위한 지속적인 통합 및 배포 파이프라인을 설정합니다.
  • 목표 3: 개발자가 프로덕션 스택의 로컬 소형 사본에 대해 코드를 테스트할 수 있는 경량 통합 개발 환경을 제공합니다.

프로그램 7. 더 나은 데이터를 위한 스마트 도구

: 분석, 클라우드 서비스, 운영, 서비스 그리고 연구 및 자료

전략적 우선순위: 전략적 우선순위의 진행 상황을 측정할 수 있는 일부 도구와 데이터를 제공합니다. 또한 https://stats.wikimedia.org(위키미디어 프로젝트에 대한 커뮤니티의 주요 지표 소스) 업데이트 및 더 나은 데이터 액세스를 위한 클라우드 클라우드 서비스 환경의 인프라 개선과 같은 커뮤니티의 특정 데이터 요구 사항을 해결합니다.

기간: 12개월

요약

우리의 데이터는 재단과 커뮤니티 모두에서 검색 및 접근이 가능하지 않습니다. 이는 편집 생태계의 데이터에서 가장 두드러집니다. 이 프로그램은 더 높은 품질의 데이터를 만들고 데이터 액세스를 개선하는 것을 목표로 합니다. 데이터에 더 쉽게 접근할 수 있을수록 더 많은 영향을 미칠 수 있습니다. 이 프로그램의 초점은 대부분 더 나은 공공 데이터 접근을 위한 인프라와 도구에 있습니다. 그러나 비공개 데이터 세트에 대한 몇 가지 개선 사항도 포함되어 있습니다.

목표

편집자, 커뮤니티, 재단 직원에게 더 나은 도구, 인프라 및 데이터 액세스 권한을 제공하여 재단과 다양한 위키 커뮤니티 모두에서 위키미디어 데이터를 쉽게 사용할 수 있도록 하세요.

성과 및 목표

성과 1: 재단 직원과 커뮤니티는 데이터에 접근할 수 있는 더 나은 도구를 갖게 되었습니다.

  • 목표 1: Wikistats 2.0 재설계. Wikistats는 커뮤니티를 위한 위키미디어 프로젝트에 대한 사실상의 통계 소스입니다. 여기에는 기본 및 고급 프런트엔드와 API 기반 백엔드 개발이 포함됩니다.
  • 목표 2: EventLogging 데이터에 대한 시각적 접근 개선
  • 목표 3: 실시간 데이터 실험 및 사용 가능한 새로운 데이터 세트에 대한 커뮤니티 지원
  • 목표 4: Hadoop, Data Lake 및 기타 데이터 소스를 위한 Jupyter Notebook 설정에 투자합니다.

성과 2: 재단 직원과 커뮤니티는 확장 가능한 API를 통해 위키미디어 콘텐츠와 데이터에 접근할 수 있습니다.

  • 목표 1: 전체 위키 편집 기록을 구조화된 데이터로 노출하는 API를 지원하는 확장 가능하고 비용 효과적인 저장소 솔루션 개발
  • 목표 2: REST API를 확장하여 대용량 콘텐츠 액세스 요구 사항을 충족합니다.

성과 3: 위키미디어 클라우드 서비스 사용자는 공개 데이터에 쉽게 접근할 수 있습니다.

  • 목표 1: 사용된 하드웨어를 업그레이드하고 내부 팀, 클라우드 서비스 사용자, 외부 미러 및 HTTPS 다운로더의 액세스를 새로운 표준 위치에 통합하여 위키미디어 데이터베이스 덤프에 안정적이고 사용 가능한 액세스를 제공합니다.
  • 목표 2: 클라우드 서비스 고객을 위한 프로덕션 데이터베이스 복제본 액세스를 '행 기반' 복제 기술을 사용하여 프로덕션 데이터에 대한 보다 일관된 보기를 제공하는 새로운 고가용성 클러스터로 완전히 마이그레이션합니다.
  • 목표 3: 위키미디어 클라우드 서비스 고객과 협력하여 적용 가능한 새 데이터 세트를 게시합니다.
  • 목표 4: Quarry 백엔드로 사용할 수 있는 실험실에서 공개 Data Lake 액세스를 위한 클러스터를 프로비저닝합니다. 이 반복에서 데이터 레이크에는 처음부터 모든 위키미디어 프로젝트의 편집(개정, 페이지, 사용자)에 대한 기록 데이터가 포함됩니다. 데이터는 간단하고 빠른 쿼리가 가능한 분석 친화적인 방식으로 쿼리되도록 최적화되어 있습니다.
  • 목표 5: 실험실 커뮤니티를 위한 Data Lake용 시각적 탐색 도구 배포

성과 4: 사용자는 데이터 컴퓨팅 및 데이터 품질이 향상되는 것을 확인합니다.

  • 목표 1: 콘텐츠 소비를 측정하는 새로운 지표의 조사 및 출시
  • 목표 2: 페이지뷰 데이터에 대한 보다 효율적인 봇 필터링
  • 목표 3: 미디어위키 콘텐츠 처리를 위한 프로토타입을 구축합니다. 예를 들어 나중에 분석 스타일 계산에 사용할 수 있도록 모든 위키백과 페이지의 텍스트를 수집하고 처리합니다.
  • 목표 4: (작년과 이어짐) 비용이 많이 드는 일괄 계산을 피하기 위해 페이지뷰 데이터의 실시간 처리를 실험합니다.

성과 5: 재단 직원과 위키미디어 커뮤니티는 재단 제품 및 프로젝트의 영향에 대해 이야기할 수 있는 객관적인 척도를 가지고 있습니다.

  • 목표 1: 커뮤니티 작업 백로그를 측정하기 위한 1개의 Wiki에 대한 파일럿 연구
  • 목표 2: 이를 원하는 위키의 커뮤니티 백로그를 측정하는 시스템을 구현합니다.

프로그램 8. 멀티 데이터센터 지원

: TechOps, 미디어위키, 서비스, 성능

전략적 우선순위: 도달 범위, 커뮤니티

기간: 12개월

요약

위키미디어는 현재 핵심 사이트와 서비스를 독립적으로 제공할 수 있는 두 개의 데이터 센터를 운영하고 있지만 가장 중요한 핵심 플랫폼 구성 요소(미디어위키)를 포함한 많은 서비스는 특정 시점에 단일 데이터 센터에서만 활성화됩니다. 다른 데이터 센터가 대기 중입니다. 두 데이터 센터 간 전환은 현재 사용자를 위한 서비스 가용성에 심각한 영향을 미치고 상당한 장애 위험이 있는 매우 복잡한 수동 프로세스입니다. 여러 데이터 센터의 요청을 동시에 처리하기 위한 지원으로 기존 서비스(특히 미디어위키)를 확장함으로써 이러한 영향을 최소화할 수 있으며 현재 사용되지 않는 성능 이점을 활용할 수 있습니다.

목표

우리는 사용자의 가용성과 성능을 향상시키는 동시에 장애 조치 테스트 및 재해로 인한 영향을 최소화할 것입니다. 우리는 여러 데이터 센터의 요청을 동시에 처리하기 위해 멀티 데이터 센터 기능을 확장함으로써 이를 수행할 것입니다.

성과 및 목표

성과 1: 우리 청중은 향상된 미디어위키 및 REST API 가용성을 누리고 데이터 센터 장애로 인한 위키 읽기 전용 영향이 줄어듭니다.

  • 목표 1: 읽기 전용 "읽기" 요청(GET/HEAD)이 다른 데이터 센터로 라우팅되도록 미디어위키 지원
  • 목표 2: 미디어위키 응용 프로그램 플랫폼 및 REST API의 읽기 전용 요청에 대한 활성/활성 배포를 테스트합니다.
  • 목표 3: 한 데이터센터에서 다른 데이터센터로 마스터 전환하는 데 필요한 시간을 줄이기 위해 미디어위키를 동적 구성 또는 서비스 검색과 통합합니다.

성과 2: 백엔드 인프라는 데이터 센터 전체에서 안정적으로 작동합니다.

  • 목표 1: 강력한 다중 데이터 센터 이벤트 및 작업 처리 인프라를 설정하고 모든 작업 대기열 사용 사례를 마이그레이션합니다.
  • 목표 2: 두 핵심 데이터 센터의 REST API 요청을 동시에 처리하기 위한 전체 지원

프로그램 9: 추천을 통해 언어 전반에 걸쳐 위키백과 성장

: 연구, 편집, 읽기, 서비스, 안전

전략적 우선순위: 지식, 도달 범위, 커뮤니티

기간: 12개월. 일부 이니셔티브는 회계연도 2016-2017년에 시작된 작업의 연속이며 다음 회계연도 이후에도 계속될 수 있습니다.

요약

오늘날 위키백과에는 다양한 언어로 제공되는 문서와 기존 문서에서 제공되는 콘텐츠의 깊이 측면에서 상당한 지식 격차가 있습니다. 편집자가 위키백과 버전 전체에서 우선적으로 누락된 콘텐츠를 식별하고 격차를 줄이는 데 기여할 수 있는 추천 시스템은 문서 생성 속도를 가속화하는 데 중요합니다.

목표

위키백과 및 기타 위키미디어 프로젝트의 콘텐츠 격차를 줄이기 위해 기계 학습을 사용하여 편집자가 편집할 내용을 식별하는 데 도움이 되는 추천 알고리즘을 구축하세요.

성과 및 목표

성과 1: 관심 있는 편집자는 자신의 저장소에서 편집하고 싶은 기사에 대한 관련 정보를 즉시 얻을 수 있는 추천 서비스를 사용할 수 있습니다. 에디터톤 주최자는 신규 편집자나 경험이 부족한 편집자를 온보딩하는 데 도움이 될 수 있는 자동으로 생성된 템플릿과 권장 사항의 이점을 누릴 수 있습니다.

  • 목표 1: 문서를 확장하는 방법에 대해 편집자에게 보다 자세한 권장 사항을 제공할 수 있는 알고리즘을 구축, 개선 및 확장합니다. 이 단계에서는 자연적이거나 통제된 실험을 실행해야 하며 다양한 세분성 수준의 권장 사항이 포함됩니다(섹션 권장 사항부터 참조 및 이미지 권장 사항, 예를 들어 일반적인 섹션 기능에 대한 통계를 제공하여 섹션을 확장하는 방법에 대한 잠재적인 지침 제공까지).
  • 목표 2: 알고리즘 결과가 편집자에게 어떻게 공개되어야 하는지에 대한 설계 요구 사항을 개발하고 수집합니다. 이를 위해서는 회계연도 16-17년에 시작된 편집자 커뮤니티 및 편집톤 주최자와의 작업을 계속해야 합니다.
  • 목표 3: 일반적인 사용 시나리오에서 대상 사용자를 위한 문서 확장 권장사항의 유용성을 평가합니다.
  • 목표 4: 연구자와 개발자가 다른 제품 및 연구 이니셔티브에서 권장 사항을 사용하고 표면화하는 데 사용할 수 있는 빌드 실험실 API입니다. (관련된 경우 프로덕션화된 API 구축은 제품 팀과 협력하여 수행되며 이 목표에는 포함되지 않습니다.)

성과 2: 편집자는 추천 API, 콘텐츠 번역 및 편집기 대시보드 도구를 통해 노출되는 향상된 추천의 혜택을 누릴 수 있습니다.

  • 목표 1: 작성을 위한 문서 추천(콘텐츠 번역 도구의 GapFinder 및 제안 기능 뒤에 있는 서비스)에 대한 알고리즘 개선을 계속해서 실험(및 적용 가능한 경우 구현)합니다.
  • 목표 2: 편집 팀과 협력하여 편집자 대시보드 도구에 대한 (개인화된) 권장 사항을 개발합니다. 이 목표에는 새로운 유형의 권장 사항을 탐색하는 것이 포함될 수 있습니다.

프로그램 10. 퍼블릭 클라우드 서비스 및 지원

: 클라우드 서비스, 커뮤니티 참여

전략적 우선순위: 지식, 커뮤니티

기간: 영구

요약

위키미디어 클라우드 서비스 팀 이름의 '서비스'는 핵심 인프라 서비스(IaaS) 제품의 유틸리티를 기반으로 구축되어 자원봉사자에게 다재다능하고 유용한 플랫폼을 제공하는 제품 컬렉션을 포함합니다. 이는 위키미디어 운동의 기술적 문제를 해결하는 데 도움이 됩니다.

목표

한 개인에서 다른 개인으로 유지 관리 권한을 이전하기 위한 최소한의 시간 투자와 낮은 마찰로 위키 커뮤니티의 문제에 대한 기술 솔루션을 만들 수 있도록 자원봉사자의 역량을 강화합니다.

성과, 목표 및 이정표

성과 1: 위키미디어 운동의 구성원은 서비스형 위키미디어 클라우드 서비스 플랫폼(PaaS) 제품에 대한 합리적인 시간과 자원 투자로 기술 솔루션을 개발하고 배포할 수 있습니다.

  • 목표 1: 기존 그리드 엔진쿠버네테스 웹 서비스 인프라와 생태계를 유지합니다.
  • 목표 2: 도구 실험실 계정 작업 흐름을 위키테크에서 Striker로 마이그레이션하여 새로운 사용자 온보딩 작업 흐름과 통합하기 쉽고 유지 관리도 더 쉽습니다.
    • 일정표 1: 연례 개발자 설문 조사에서 측정한 바와 같이 도구 실험실 제품에 대해 전반적으로 높은 고객 만족도를 유지합니다.

결과 2: 'Labs, labs, labs' 브랜딩 혼란이 해소되었습니다. 브랜딩이 분리되어 있으므로 이 모든 것이 더 이상 'Labs'라고 지칭되지 않습니다. 서비스 제품으로서의 인프라, 서비스 제품으로서의 플랫폼, 해당 제품을 관리하는 팀, 그리고 이를 사용하여 기술 솔루션을 생산하는 커뮤니티입니다.

  • 목표 1: 2017년 12월 31일까지 초기 개괄적인 브랜드 변경 활동 및 발표 완료

성과 3: 위키미디어 커뮤니티 구성원, 재단 직원 및 잠재적 기여자는 클라우드 서비스 팀이 제공하는 제품과 서비스의 폭을 알고 있습니다.

  • 목표 1: 관련 컨퍼런스, 해커톤 및 위키미디어 커뮤니티 내에서 사용 가능한 서비스와 제품을 홍보합니다.

성과 4: 클라우드 서비스 사용자의 지원 요청은 다른 프로그램 목표를 향한 클라우드 서비스 팀의 핵심 운영 및 개발 작업을 방해하지 않고 최선의 노력 방식으로 처리됩니다.

  • 목표 1: 클라우드 서비스 관리 제품 지원 요청을 분류하고 대응할 수 있는 일선 기술 지원 리소스 제공
    • 이정표 1: 일선 기술 지원 계약자를 고용합니다.

프로그램 11: 위키미디어 프로젝트 전반에 걸쳐 인용 개선

: 연구

전략적 우선순위: 지식

기간: 12개월(회계연도 2017-2018년). 일부 이니셔티브는 회계연도 2016-2017년에 시작된 작업의 연속이며 다음 회계연도 이후에도 계속될 수 있습니다.

요약

위키미디어 프로젝트는 핵심 정책 중 하나로 검증 가능성에 의존합니다. 위키미디어 프로젝트 전반에 걸쳐 기여자가 소스를 표현, 저장 및 재사용하는 방법에 대한 강력한 기술 기반을 구축하는 데 대한 관심이 커지고 있습니다. 진술의 소싱은 위키데이터와 같은 프로젝트에서 최우선 순위이며 다양한 기술 및 프로그래밍 이니셔티브(예: Citoid, 위키백과 도서관, OABot)는 참조 생성을 용이하게 하도록 설계되었습니다. 위키백과에서 인용 관련 작업을 지원하는 더 나은 방법을 설계하려는 커뮤니티 중심의 노력이 10년 이상 이어졌음에도 불구하고 이러한 노력이 합쳐지기 시작한 것은 위키데이터의 출현이었습니다. 현재 프로그램의 목표는 위키미디어 기여자가 출처를 사용하는 방법에 대한 더 깊은 이해를 개발하고 출처 및 인용에 대한 더 나은 기술 지원을 위한 기반을 마련하는 것입니다.

목표

다음 회계연도에 우리는 다음을 목표로 연구를 수행할 것입니다. 출처 및 인용과 관련된 편집자와 독자의 사용자 경험을 향상합니다. 위키미디어 콘텐츠 전반에 걸쳐 인용 범위를 정량화하고, 인용 품질이 낮은 부분과 격차를 식별합니다. 인용 품질 격차가 해결되도록 기여자가 작업 소싱이 더 필요한 위키미디어 프로젝트의 주제 영역을 식별하도록 돕습니다. 우리는 네트워크를 활용하여 새로운 공식 협력을 구축하고 위키미디어 프로젝트 전반에 걸친 인용 범위, 품질 및 접근성과 관련된 연구 질문에 답할 것입니다. 또한 인용 데이터 및 인프라와 관련된 커뮤니티 및 기술 노력을 조정하는 데 도움을 주기 위해 2016년에 시작된 WikiCite 시리즈를 계속해서 주도할 것입니다.

성과 및 목표

성과 1: 위키백과 및 위키데이터 기여자가 소싱 노력에 집중하고 우선순위를 정하는 데 도움이 되는 정량적 조사가 가능합니다.

  • 목표 1: 위키백과 또는 위키데이터의 콘텐츠 중 출처가 없고 인용이 필요한 콘텐츠의 비율을 추정합니다. 위키미디어 프로젝트 전반에 걸쳐 인용된 기존 소스 중 일반 대중이 접근할 수 있는 비율이 어느 정도인지 추정해 보세요.
  • 목표 2: 독자가 각주와 외부 링크와 상호 작용하는 방식을 이해하기 위해 각주 및 외부 링크에 대한 클릭 데이터를 수집하고 분석합니다(개인 정보 보호 및 보안 영향을 논의하고 검토한 후).

성과 2: 인용에 대한 독자와 기여자의 요구 사항이 더 잘 이해됩니다.

  • 목표 1: 문헌 검토, 설문 조사 및 인터뷰를 통해 출처를 참조하고 평가하면서 독자와 기여자의 상호 작용, 경험 및 요구 사항에 대해 알아봅니다.

성과 3: 지원 활동은 인용의 구조와 품질을 개선하기 위한 커뮤니티 및 기술 노력을 지속적으로 보장합니다.

  • 목표 1: WikiCite 시리즈의 제3차 연례 회의를 위한 기금 모금 및 주최(2016년과 2017년의 이전 행사는 제한된 보조금을 통해 전액 자금 지원되었습니다)

프로그램 12: 기여자 다양성 키우기

팀 참가자: 커뮤니티 자원과 연계한 연구

전략적 우선순위: 지식, 커뮤니티 https://meta.wikimedia.org/wiki/Research:Voice_and_exit_in_a_voluntary_work_environment

기간: 12개월

요약

위키백과 편집자의 10~15%만이 여성으로 알려져 있습니다. 성별 다양성 부족 문제는 위키미디어 커뮤니티에서 오랫동안 인정되어 왔습니다. 우리는 학술 문헌에서 확인된 성별 다양성 부족의 특정 동인, 그러한 동인을 변경할 수 있는 프레임워크 설계, 위키백과의 기여자 다양성에 대한 그러한 변화의 영향을 측정하는 데 관심이 있습니다. (메타에 문서화된 프로그램에 대한 자세한 내용을 읽어보세요.)

목표

위키백과에서 기여자의 다양성을 높이는 데 도움이 될 수 있는 사회 기술적 솔루션을 설계하고 테스트합니다.

성과 및 목표

  • 성과 1: 우리는 잠재적인 개입을 설계하고 테스트한 후 위키백과의 기여자 다양성을 개선합니다.
    • 목표 1: 특정 인구통계의 대표성 기여가 부족한 근본적인(잠재적) 원인을 식별합니다.
    • 목표 2: 대표성 결여의 근본 원인 중 적어도 하나를 해결하기 위해 현재의 사회 기술 인프라를 변경하는 프레임워크를 설계합니다("신뢰 부족"은 그러한 근본 원인 중 하나로 간주됩니다). 이 단계는 이미 이 분야에 경험이 있고 이미 시작된 편집자 커뮤니티와 협력하여 진행될 것입니다.
    • 목표 3: 실험을 실행하여 권장 설계가 원하는 결과를 얻을 수 있는지 평가합니다.