كومنز:بيانات مهيكلة/الوسم بمساعدة الحاسوب

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Commons:Structured data/Computer-aided tagging and the translation is 57% complete. Changes to the translation template, respectively the source language can be submitted through Commons:Structured data/Computer-aided tagging and have to be approved by a translation administrator.
Notice الوسم بمساعدة الحاسوب هي تقنية جديدة، في بعض الأحيان تكون الوسوم المقترحة خاطئة أو غير لائقة، هذا هو السلوك المتوقع.

أداة الوسم بمساعدة الحاسوب ميزة في التطوير بواسطة فريق البيانات الهيكلية على كومنز لمساعدة أفراد المجتمع في تحديد وتمييز البيانات التصوير لملفات كومنز ، هناك عشرات الملايين من الملفات المنسقة بعناية على كومنز، لكن أداة البيانات المنظمة جديدة، باستخدام هذه الميزة، يمكن أن تحتوي الملفات الموجودة على محتوياتها بسهولة وسرعة ووضوح، للمساهمة، لن يحتاج المحررون إلى معرفة كيفية عمل ويكي بيانات أو التحدث بلغة معينة، هذه الميزة الجديدة تطالب المستخدمين باقتراحات للعلامات، باستخدام نموذج رؤية الحاسوب، للمراجعة البشرية، سيتمكن مستخدمو كومنز من زيارة صفحة خاصة على كومنز ورؤية تصويرات الصور المقترحة، والتي يمكن اختيارها لتأكيدها أو تجاهلها، لن تتم إضافة العلامات تلقائيا دون تدخل بشري.

Computer-aided tagging helps populate files with structured data, in turn these files can be found using general search terms in Special:MediaSearch in a manner that was previously not possible. This helps users easily find media that otherwise isn't easy to come across using the old search, which often relies on specific information in file descriptions or category placement to find files. If specific information is lacking, it can be hard-to-impossible to find a lot of media on Commons through the standard search. For example, Peter_iredale_sunset_edited1.jpg shows up in a search for "beach" using Special:MediaSearch thanks to the "beach" depicts statement added by computer-aided tagging; it does not show up at all in a search for "beach" using regular search.

Computer-aided tagging is a stand-alone MediaWiki extension and is not a core part of Commons itself, and ties into Commons using Special:SuggestedTags. On the back-end, the tool will use Google Cloud Vision for depicts suggestions. Wikimedia already uses the Google Cloud Vision service in Wikisource OCR, and this will work similarly. This tool is opt-in for registered, auto-confirmed users. It is not on by default for any user group, and is unavailable to new and unregistered users.

To date (Updated on 14 February 2022):

  1. 5,809 total users have made edits via the Computer-Aided Tagging tool
    • 962 of these users did so via mobile web
  2. 341,957 total files have had edits made via Computer-Aided Tagging
    • 41,563 of those files have Computer-Aided Tagging edit on mobile web
  3. 72% of files with CAT edits had those edits done by the same user who uploaded the file
  4. Approximately 10,000 files edited by CAT so far were purely manual edits
  5. We’re averaging about 20 new users a week currently

Charts for this data are updated every Monday on the CAT usage report analytics page

CAT specificity

We’re working on possible techniques for improving the tool’s ability to accurately identify specific elements of photos, but it’s important to keep in mind that the Google Vision algorithm already does fairly well in many topic spaces.

Upcoming tweaks to the queue for general images

Although most usage of the Computer Aided Tagging system comes from users editing their own uploads (72%), there is a separate queue for “popular” images. Based on recent feedback from the Commons community, we’re exploring ways to prioritize this queue differently. Particularly, we’re considering a system that would focus more on files that do not have curated categories yet.

رؤية جوجل كلاود

ستكون جميع المعلومات التي تمر عبر رؤية جوجل كلاود عامة أيضا، ستتوفر مقالب البيانات المجهولة بالكامل التي تسرد ملف كومنز والوسوم المقترحة والوسوم المقبولة، رؤية جوجل كلاود معزولة تماما عن ويكيميديا كومنز، الميزة منفصلة عن تجربة كومنز الأساسية.

على الرغم من وجود منصات رؤية مفتوحة المصدر للحاسوب يمكن البدء منها، فإن أية حزمة من هذا القبيل تتطلب موارد أو خبرات متخصصة لتوفير تجربة قياسية مع رؤية الحاسوب التي لا تستطيع مؤسسة ويكيميديا توفيرها بنفسها في هذا الوقت، يدرك الفريق أن رؤية جوجل كلاود ليست برامج مفتوحة المصدر، لن يكون هناك أي كود غير حر أو خاص مكتوبا من قبل المؤسسة لهذا المشروع، وستظل جميع المساهمات مفتوحة المصدر، لن تتمكن جوجل من الوصول إلى أية معلومات شخصية خاصة وغير عامة، ولن يكون هناك اتصال مباشر بين المستخدمين وخدمة جوجل.

البنية وسير العمل

تصميم تدفق المعلومات في وسم الصور بمساعدة الحاسوب، يقوم مزود "رؤية الآلة" الموجود في أقصى اليمين بطلب وإرسال علامات محتملة للصور، لا توجد معلومات شخصية يتم تبادلها والمزود معزول عن بقية النظام وكومنز.

سيتمكن المستخدمون المسجلون والمؤكّدون تلقائيا من الاشتراك خلال تفضيلاتهم أو رفع الملفات، بعد مرور بعض الوقت، سيتم الاتصال بالمستخدم من خلال إشعاراته بأن مرفوعاته جاهزة للوسم في Special:SuggestedTags، يمكن للمستخدمين الذين قاموا بالاشتراك زيارة Special:SuggestedTags في أي وقت لعرض الملفات الجاهزة لمعالجة العلامات، لن يتمكن المستخدمون المجهولون والمستخدمون الجدد والمستخدمون الذين لم يشاركوا من الوصول إلى Special:SuggestedTags.

المفاهيم المتوفرة للترميز هي تلك التي تترجم من معرفات الرسم البياني للمعرفة في جوجل إلى معرفات ويكي بيانات، بـ2.1 مليون شفرة، تكون القائمة طويلة جدا بحيث لا يمكن فهرستها هنا، لكن يمكن تنزيلها كتعيينات قاعدة ويكي ويكي بيانات.

مرحلة التطوير

يتم تصميم الأداة، اتبعها بمهمة التتبع الرئيسية، تتوفر التصميمات الأولية للهاتف المحمول وسطح المكتب في التذكرة، مع إجراء استشارة مجتمعية قريبا.

ملاحظات التطبيق والاستخدام

  • لا يتم إرسال أية معلومات شخصية إلى موفر منصة رؤية الحاسوب، عند الإطلاق، ستستخدم هذه الميزة الجديدة فقط نظام رؤية جوجل كلاود، الذي سيتم الوصول إليه عبر طبقة برامج وسيطة تخفي جميع بيانات المستخدم، يتم إرسال صور كومنز إلى خوادم جوجل من خوادم مؤسسة ويكيميديا، لن يكون هناك اتصال مباشر بين المستخدم والخدمات الخارجية، لا يتم إرسال أية معلومات شخصية (الآيبي، واسم المستخدم، وما إلى ذلك) إلى خوادم جوجل. إن البرنامج الوسيط الذي يتصل بخوادم جوجل هو مشروع ويكيميديا وهو مفتوح المصدر، لن يكون أي جزء من خدمة أو كود جوجل جزءا من بنية ويكيميديا التحتية.
  • لن تتم إضافة : الاقتراحات من رؤية الحاسوب إلى البيانات المنظمة لملف صورة حتى يتحقق المستخدم منها: يتم توفير هذه الخدمة كوسيلة لزيادة النشاط البشري، وليس استبداله. جميع الاقتراحات من خدمة رؤية الحاسوب يتم تخزينها في قاعدة بيانات منفصلة ومتخصصة، لا يتم حفظ الاقتراحات كبيانات منظمة في ملف كومنز حتى يقوم مستخدم بشري بتأكيدها.
  • يمكن للمستخدمين الاشتراك في تلقي الإخطارات لتنبيههم إلى أن مرفوعاتهم الأخيرة قد اُقترِحت عليها علامات. في الخطوة الأخيرة من عملية رفع معالج الرفع، يتوفر للمستخدمين خيار لتمكين الإشعارات التي ستبلغهم عند مرور الملفات المرفوعة مؤخرا فترة الانتظار وبها علامات للتأكيد، يمكن العثور على هذا الخيار أيضا في تفضيلات المستخدم تحت الإشعارات.
  • مساهمات المستخدم التي تؤكد الصور المقترحة مرخصة كـCC0. تعادل هذه البيانات إضافة ويكي بيانات إلى صورة ما، وبالتالي تجب المساهمة بموجب ترخيص CC0 نفسه الذي يستخدمه يكي بيانات، ستعلم إشعارات الترخيص واضحة المستخدمين بأن جميع المساهمات المقدمة عبر أداة رؤية الحاسوبسيتم ترخيصها بموجب CC0.
  • تحليل الصور على كومنز: ستحلل هذه الميزة الصور فقط، وتوفر علامات "تصوير" مقترحة بناءً على محتوى تلك الصور.
  • سيتم استبعاد أنواع معينة من الصور: بعض أنواع الصور على كومنز ليست مناسبة تماما لهذا النوع من النظام.، لن يتم تضمين الصور الصغيرة (أقل من 100 بكسل) والأعمال الفنية (المحددة عبر قالب العمل الفني)، مسح صفحات الكتب، وملفات أخرى.
  • سيتم تحليل الملفات المرفوعة حديثا، ولكن ليس أثناء الرفع: يقوم مستخدمو كومنز بمراقبة الملفات الجديدة باستمرار للتخريب وانتهاك حقوق الطبع والنشر وأهميتها للمشروع، الملفات التي لا تستوفي المعايير معلمة للحذف، ستقوم ميزة رؤية الحاسوب الجديدة بتحليل الملفات الجديدة فقط بعد مرور فترة انتظار، ولن تقوم بتحليل الملفات المعلمة للحذف.
  • تظهر جميع تأكيدات العلامات كتحرير منتظم للبيانات مع وسم ملخص التحرير التي تحدد أصلها من أداة رؤية الحاسوب: يمكن ذلك جميع مهام سير العمل المعتادة والاعتدالية بحيث يمكن تحسين التغييرات أو تحريرها أو إرجاعها، كما أنه يساعدنا على قياس معدل الارتداد والتأكد من أن التعديلات التي تم إجراؤها باستخدام ومح لا يتم الرجوع إليها أكثر من التعديل المتوسط.
  • Problematic tags can be blocked from being suggested: There is a blocklist of tags that will not be suggested by the tagging tool. The official blocklist currently exists within the configuration file for Commons and cannot be edited directly by the community, but suggestions can be made on the blocklist talk page.

Userbox

You can use this userbox in your user page.

{{User Computer-aided tagging}}
links talk view

This user uses Computer-aided tagging tool for tagging images.

This was a failed project

As early as 13 February 2020, experienced Commons users were complaining that the bulk of tags added using this tool were, as one put it, "way too vague, irrelevant or even detrimental". After numerous such complaints over the next several years, on 16 June 2023 the Sr. Director in the WMF Product department acknowledged that "We understand that the accuracy and utility of the tags generated by this tool have been called into question." After some study, on 14 September 2023 they announced, "we will be deactivating the tool on September 20, 2023, after completing the necessary code changes."