סריקת PET
סריקת PET הוא כלי שאילתה רב עוצמה. שאילתה מוכנה בטופס הגשת PetScan. כמו כן, בדוק את [הרציונל של http://magnusmanske.de/wordpress/?p=385 מאחורי הכלי הזה].
מבוא
סריקת (PetScan )יכול ליצור רשימות של דפי ויקיפדיה (ופרויקטים קשורים) או פריטי ויקידאטה התואמים לקריטריונים מסוימים, כגון כל הדפים בקטגוריה מסוימת, או כל הפריטים בעלי מאפיין מסוים. סריקת (PetScan) יכול גם לשלב כמה רשימות זמניות (הנקראות כאן "מקורות") בדרכים שונות, כדי ליצור רשימות חדשות. המקורות כוללים:
דפים מ-ויקיפדיה (m/p)
אלה מוגדרים בכרטיסיות קטגוריות, מאפייני עמוד ותבניות וקישורים. אתה יכול לבקש דפים בעצי קטגוריה, עם תבניות ספציפיות, או קישורים מ/אל דפים ספציפיים; הגבל את התוצאות שלך למרחבי שמות מסוימים, עריכות בוטים/אנושיים, עריכות אחרונות/יצירת עמוד וכו'. שלוש הכרטיסיות הללו מייצגות את הפונקציונליות לשעבר של CatScan2. תוצאת השאילתה שלהם מותאמת לאחר מכן ל"מקור הקטגוריה".
מקורות אחרים
בלשונית זו, תוכל להוסיף מקורות נוספים, כגון שאילתות Wikidata SPARQL (WDQS), או רשימות PagePile. ניתן גם להגדיר כיצד לשלב מספר מקורות; כברירת מחדל, קבוצת המשנה (כלומר, רק דפים המופיעים בכל המקורות) מוחזרת בתוצאה הסופית. אתה יכול גם לציין לאיזה ויקי אתה רוצה שהרשימה שלך תצביע, למשל. אם תשלב את תוצאות ויקיפדיה וויקידאטה.
ויקיפדיה
בכרטיסייה זו, אתה יכול להוסיף הערות או סנן לתוצאות שלך, למשל, להחזיר רק פריטי Wikidata שאין להם הצהרות. שימוש בכל אחד מהמסננים הללו ימיר את הרשימה שלך ל-Wikidata.
פלט
כאן, אתה יכול לציין אפשרויות עבור הרשימה שלך, למשל. הפורמט (דף אינטרנט, ויקי, PagePile וכו'). אתה יכול גם לסנן עוד יותר את התוצאות שלך, למשל. עם ביטויים רגולריים על כותרות עמודים/תוויות פריטים. ניתן גם להחליף את רשימת התוצאות ברשימה מדורגת של נושאים חסרים ("קישורים אדומים").
הגדרת השאילתה שלך
השדות שניתן להגדיר בטופס השאילתה הם כדלקמן:
שדה | מַשְׁמָעוּת | ברירת מחדל | הערה |
---|---|---|---|
שפה | בחר קוד שפת הפרויקט, למשל. "en" עבור אנגלית או "de" עבור גרמנית. בחר "משותף" עבור Wikimedia Commons | "en" | |
פרויקט | פרויקט ויקימדיה לחיפוש (ויקיפדיה, ויקימילון, ויקירסיטי וכו') | "wikipedia" | NOTE: If you choose "Commons," be sure to go to the "Page properties" tab and check the "File" namespace to get useful results. |
עומק | עומק עצי הקטגוריה לחיפוש. 0 פירושו לא להשתמש בקטגוריות משנה. | "0" | |
קטגוריות | רשימת קטגוריות, אחת לכל שורה ללא החלק "קטגוריה:". | ריק | צירוף '|' ומספר יגדיר את העומק עבור עץ קטגוריות זה, ויעקוף את מה שנבחר בשדה עומק |
קטגוריות שליליות | רשימת הקטגוריות כנ"ל. רק מאמרים שאינם נכללים בקטגוריות אלה יתקבלו. | ריק | |
Combination | כיצד יש להשתמש בקטגוריות לעיל:
האפשרויות הזמינות כרגע הן "תת-קבוצה" או "איחוד". |
"תת-קבוצה" | |
מרחבי שמות | מרחבי השמות שישמשו כדפים פוטנציאליים | מאמרים | |
הפניות | Either | ||
תבניות | השתמש רק בעמודים ש
הזן תבנית אחת בכל שורה, ללא קידומת "תבנית:". כל תיבה עשויה להיות מוסמכת על ידי בחירה באפשרות "השתמש בדף שיחה במקום זאת" |
ריק | אפשרות זו תואמת רק לתבניות המוגדרות במרחב השמות "תבנית:". לא ניתן להשתמש בו עם תבניות המוגדרות במרחב השמות "משתמש:". לא ניתן להשתמש בו במרחבי השמות "Creator:" או "Institution:" הנמצאים בשימוש בוויקישיתוף |
מקושר מתוך: | |||
עריכה אחרונה | הצגת דפים שהעריכה האחרונה שלהם בוצעה או לא בוצעה על-ידי בוט, על-ידי משתמש אנונימי, או שהם מסומנים בדגל | גם לא אחד מהם | |
שינוי אחרון | Date or time period of the last change on the page in the format YYYYMMDDHHMMSS (shorter allowed) | "רק דפים שנוצרו בחלון הזמן הנ"ל" מאפשר לך לחפש "שינוי ראשון" במקום | |
גודל | גודל הקובץ או טווח הגדלים בבתים | ריק | מאפשר בחירה של מאמרים שהקבצים שלהם גדולים מחיתוך אחד ו/או קטנים מחיתוך אחר |
קישורים | Number or range of internal links on the page | Empty | Allows selection of articles with many or few links |
Redlinks | |||
Top categories | Feature which is not yet available. | ||
Sort | Feature which is not yet available, which would set sorting criteria for output. | ||
Manual list | Allows providing a list of (namespace prefixed) page names or Wikidata items from specified project | החלק המסובך הוא לציין פרויקטים שהקודים הנכונים הם:
| |
Wikidata | Get Wikidata, if available. | ||
Format | פורמט פלט של תוצאות החיפוש: HTML: webpages CSV: ערכים במרכאות, מופרדים באמצעות פסיקים TSV: ערכים מופרדים באמצעות טאבים WIKI: כ-Wikitable PHP: כקובץ PHP XML: כקובץ XML |
||
Do it! | Hit this to run the submission you have defined. |
Know-how
PetScan ID (PSID)
החל מ-2016/04/04, כל שאילתה שמופעלת ב-PetScan נרשמת (באופן אנונימי!) ומוקצה לה מזהה מספרי ייחודי, יציב בשם "PSID". באפשרותך להשתמש ב- "PSID" כדי:
- הפעל שאילתת PetScan זו כקלט בכלים התומכים ב-PSID (כגון WD-FIST)
- מלא "כתובת אתר קצרה":
https://petscan.wmflabs.org/?psid=PSID
יפעיל את השאילתה עם PSID, עם כל ההגדרות שלה - להרחיב באופן תכנותי על שאילתה קודמת, על ידי פרמטרים "החלפה":
https://petscan.wmflabs.org/?format=wiki&psid=PSID
ירוץ באותה שאילתה כמו קודם, אבל פורמט הפלט יהיה wiki (במקום ברירת המחדל HTML, או מה שנבחר במקור).
הערות:
- רק השאילתה תישמר ולא תוצאותיה!
- שאילתות גדולות (למשל עם פריטים ידניים רבים) לא יאוחסנו. במקרה כזה, לא יוצג "PSID".
- לתוצאות עם תיבת סימון ריקה יש התאמות אפשריות בתוך ערכת ויקינתונים.
- הקישור הבין-ויקי p etscan: יכול לשמש ליצירת קיצורי דרך לשאילתות קבועות, למשל. 3 $
- שאילתות שהוקלטו אינן משוכפלות, כך ש- PSID חדש ייווצר בכל פעם, אלא אם כן נקרא PSID קיים ללא שינוי.
Create Wikidata items for Wikipedia articles that don't have one yet (Creator functionality)
- הגדר שאילתה המחזירה רשימה של דפי ויקיפדיה (או אחרים, שאינם פרויקט ויקינתונים), או הדבק רשימה לתוך "מקורות אחרים/רשימה ידנית"
תחת הכרטיסייה "מאפייני דף", עליך לבחור "הפניות = לא"זה נעשה באופן אוטומטי עכשיו; אתה יכול לשנות את זה בחזרה אם אתה באמת רוצה הפניות ברשימה שלך!- תחת הכרטיסייה "ויקינתונים", בחר "רק דפים ללא פריט" עבור האפשרות "ויקינתונים"
- הפעל שאילתה
- התוצאות שלך יכללו רכיבים נוספים לצד כותרת "תוצאות" (אלא אם כן אינך מחובר ל- WiDaR, ובמקרה זה תראה קישור מתאים במקום זאת)
- כל הדפים שעבורם אין התאמה מדויקת בשום תווית או כינוי בוויקינתונים נבדקים כברירת מחדל.
- ניתן לסמן / לבטל סימון תיבות באופן ידני כעת, במידת הצורך.
- באפשרותך להוסיף הצהרות ברירת מחדל לתיבת ההצהרות, שיתווספו לכל הפריטים החדשים שלך. לכן, אם אתה יוצר פריטים רק עבור אנשים, הוסף
P31:Q5
. באפשרותך להוסיף הצהרות מרובות בדרך זו (משפט אחד בכל שורה). שימו לב שהמקרה של P/Q צריך להיות באותיות גדולות – אחרת הוא ייכשל בשקט. - לחץ על הלחצן הירוק "התחל QS". פעולה זו תפתח דף חדש.
- אתה יכול ללחוץ על "הפעלה" כדי להפעיל אצווה בדפדפן שלך, או "הפעל ברקע" כדי להפעיל אותם משרת ויקימדיה. ראה עזרה:QuickStatements לקבלת מידע נוסף.
החל מיולי 2020, "הפעלה ברקע" כוללת באגים שונים (לדוגמה, פריטים משוכפלים עשויים להיווצר). השתמש במצב frontend במידת האפשר! |
Add/remove statements for Wikidata items
ניתן להוסיף או להסיר הצהרות עבור פריטי ויקינתונים באמצעות PetScan. לשם כך חיוני לבחור "ויקינתונים" ב"מקורות אחרים > להשתמש בוויקי". לאחר מכן תראה את תיבת הפקודה לצד המספר ותוכל להמשיך כמתואר בסעיף הקודם.
Referrer
(גרסה 2 בלבד) אם תפתח את PetScan מכלי אחר כדי לאפשר למשתמש ליצור שאילתה, תוכל להעביר את הפרמטרים <קוד>referrer_url</קוד> ו- <קוד>referrer_name</קוד> (ברירת המחדל היא <קוד>referrer_url</קוד>). <קוד>referrer_url</קוד> צריכה להיות מחרוזת {PSID}
שתוחלף ב-PSID שהמשתמש רואה. לאחר הפעלת שאילתה, תיבה בראש הדף תבקש מהמשתמש לחזור לכלי המקורי, באמצעות <קוד>referrer_url</קוד> שהשתנה על-ידי PSID.
Examples
Articles in a WikiProject
בקשה בדף השיחה של מדריך זה: מצא את כל הערכים במרחב המרכזי בתוך "WikiProject UK geoography". החל מטופס ברירת המחדל לשליחת PetScan, פשוט הוסף את "גיאוגרפיה של WikiProject UK" לתיבה הראשונה בשורת התבניות, וממש מתחת, בחר "השתמש בדפי שיחה במקום זאת". הנה השאילתה שמולאה. לחץ על "עשה זאת!" בתחתית. כאשר השאילתה הופעלה ב-16 באוגוסט 2015, נדרשו 1.5 שניות להפעלתה, והיא הניבה רשימה של 21,408 ערכים. הרשימה מופיעה מתחת לטופס ההגשה (שנשאר על המסך), כך שעליך לגלול מטה כדי לראות את התוצאות.
Dablinks within a WikiProject
עורכים העובדים על פירושים מבקשים לגייס חברים באזור התוכן WikiProject, במיוחד WikiProject Canada, כדי לעזור. דוח PetScan נועד למצוא את כל הערכים בעלי קישורים מעורפלים הנמצאים בתוך מיזם ויקי נתון. הקריטריונים החלים:
- Articles שיש קישורים דו-משמעיים נמצאים בתוך "קטגוריה:כל המאמרים עם קישורים הזקוקים לפירוש", לכן הדבק את "כל המאמרים עם קישורים הזקוקים לפירוש" בשדה קטגוריות PetScan.
- Depth מוגדר באופן שרירותי ל-9, כלומר יימצאו ערכים עד 9 קטגוריות משנה למטה מקטגוריית האב "זקוק לפירוש". (חיפוש לעומק זה אינו הכרחי במקרה זה, אך אינו מזיק.)
- Articles בתוך WikiProject Canada יש "תבנית:WikiProject Canada" בדפי השיחה שלהם, אז הדבק "WikiProject Canada" בשדה "Has any these templates" של PetScan, וממש מתחת בחר "השתמש בדפי שיחה במקום" כמזהה.
- Only ערכים רגילים, לא דפי פירוש, רצויים, ודפי פירושים נבדלים בכך שיש להם תבנית:פירוש, לכן הדבק "פירוש" בשדה "אין אף אחת מהתבניות האלה" של PetScan, וודא ש"השתמש בדפי שיחה במקום" לא נבחר.
- קריטריונים אלה מיושמים על ידי טופס הגשת PetScan זה, מלא. כדי לשלוח את השאילתה, בחר "בצע זאת!" בחלק התחתון.
- כאשר הוגשה ב-16 באוגוסט 2015, השאילתה נמשכה 31 שניות, והתוצאות היו רשימה של 255 ערכים. התוצאות מוצגות מתחת לטופס שליחת PetScan, שנשאר במקומו, כך שייתכן שלא תראה שינוי על המסך. אתה צריך לדעת לגלול למטה כדי למצוא את התוצאות! בקשה זו הופעלה עם פורמט פלט ברירת מחדל "HTML".
- כדי להשיג את התוצאות בוויקיטבלה, על מנת לשתף אותן בדף משנה של מיזם ויקי, ניתן לשנות את הבקשה כך שתבחר פורמט "WIKI". הפעם התוצאות, בסימון ויקיפדיה, מחליפות את טופס ההגשה של PetScan על המסך שלך.
- כדי ליצור רשימה שימושית יותר עבור פירושים, הגדר כך ש- DabSolver ייפתח על כל פריט שנלחץ, ניתן לבצע תהליך בן מספר שלבים. כאן התוצאות נשמרו בפורמט Tab-Separated במקום זאת, ולאחר מכן הובאו ל- Excel, ואז חוברה עמודה אשר שרשרה מחרוזות טקסט פשוטות עם התוצאות, ולאחר מכן עמודה זו שנוצרה הועתקה והודבקה. התוצאות הודבקו בדף ויקיפדיה בשפה האנגלית w:Wikipedia:Canadian Wikipedians' notice board/ArticlesNeedingDisambiguation2015-08-17 ופורסמו גם בחלון גלילה בדיון בדף השיחה של WikiProject Canada. -- Doncram (talk) 19:50, 24 אוגוסט 2015 (UTC)<קטן> הקישור מותאם. DexDor (שיחה) 06:58, 29 מרץ 2016 (UTC)</קטן>
איתור דפים שיש בהם שילוב חריג של מרחב שמות וקטגוריה/ies
ניתן להשתמש ב-PetScan כדי למצוא דפים הנמצאים בקטגוריה (או שילוב של קטגוריות) שאינם מתאימים לדפים במרחב שמות מסוים - לדוגמה, דפי ניהול ויקיפדיה הנמצאים בקטגוריה שאמורה להכיל ערכים אנציקלופדיים בלבד. לאחר מכן ניתן לתקן זאת (לדוגמה, על-ידי העברת ערך למרחב השמות הנכון או על-ידי עריכת דיון כדי להוסיף ":" חסר במקום שבו מתבצעת הפניה לקטגוריה). השלב הראשון בתהליך זה הוא לזהות (באמצעות PetScan) קטגוריות הגורמות לסיווג שגוי (למשל קטגוריות ניהול ויקיפדיה שנמצאות בקטגוריות ערכים).
Find uncategorized photo contributions in Commons in a given language
(Based on Grants:Learning patterns/Treasures or landmines: detecting uncategorized, language-specific uploads in Commons. See the motivation and full explanation there! Thank you to wikimedia user User:Spiritia and other contributors/commenters there for contributing this! )
Run a query using PetScan with the following settings:
Language = commons Project = wikimedia Depth = 1 Categories = Uncategorized files Combination = ☑ Subset Namespaces = ☑ File Templates : Has all of these templates = <your language code> Format: ☑ Extended data for files ☑ File usage data
The English language code is "en"; the Romanian language code is "ro". To find uncategorized photos uploaded by users using Romanian language, a version of the query (with html output, and without autorun) is:
As of 15 March 2016, after hitting "run" the query requires about 105 seconds to finish, and yields 1748 uncategorized photos.
Notes:
- The "Language =" field is not used to select the desired language; the desired language code is set in the "Template" field instead.
- The language code is case-sensitive in the query! So for example use "ro" not "RO".
- To generate the results there, Format: ☑ Wiki was chosen, instead of the default output of Html.
Enjoy! Thanks again to User:Spiritia especially!
Items with no statements
The option "Has no statements" can be used to find:
- items without statements for a category at Wikipedia (sample: en:Category:United States geography stubs)
- items without statements for an entire Wikipedia language version (sample: "sowiki")
Steps to import the template, some with PetScan.
Get the sitelinks for a certain project from a SPARQL query
- Indicate the project on the 'Categories' tab. E.g.
de
for Language andwikipedia
in Project to use the German language edition of Wikipedia. - In Other sources enter your SPARQL query
- Make sure to select From categories from the Use wiki options
- Press Do it
This could be useful to get the pageviews of a specific set of pages, based on a SPARQL query. You can save this to a Pagepile (check the Output tab), then enter that Pagepile ID in Massviews Analysis (select 'Page Pile' from the Source dropdown).
Get a list of Wikidata items with exclusions based on a SPARQL query
Let's say you got a list of people with Wikidata ID's (QIDs) that you want to add an occupation (P106) of 'jewellery designer' (Q2519376) to, maybe with a tool like QuickStatements. However, you don't want to add this occupation to items that already have that occupation. Here's how to do that with PetScan:
- Have your list of QIDs in a text file, with each QID on a new line
- In the tab 'Other sources', paste this text into the field called 'Manual list'
- In the form 'Wiki' enter the string
wikidatawiki
- In the field 'SPARQL' enter your SPARQL query. In this example, this query will give all humans with an occupation of 'jewellery designer':
select ?item where { ?item wdt:P31 wd:Q5; wdt:P106 wd:Q2519376. }
- Finally, you want to make an exclusion, so in the field 'Combination' add the string
manual NOT sparql
to get all the QIDs from the 'manual list', but without the items from the SPARQL query. - Hit 'Do it!'
הוסף את הדוגמה שלך כאן...
Bug reports, feature requests, code base
ראו גם
External links
- Training video from EduWiki 2023
- Wiki World Heritage User Group: Capacity Building PetScan Training 2021