Commons talk:Wiki Loves Monuments 2011 in Russia/Arxiv1

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search

Два вопроса учёной комиссии

[edit]
  1. Обратил внимание, что файлы в Category:Images from Wiki Loves Monuments 2011 in Russia (по крайне мере те несколько десятков, которые выборочно просмотрел), - не имеют никаких содержательных категорий. Вот, к примеру, лошадка есть, а ни к одной из номерных корзинок не приписана. Это специально, или "так уж вышло"? уже можно категории прописывать или пущай вылежатся?
    Категории прописывать, конечно же, можно. Вы только шаблон об участии в конкурсе не удаляйте :) Анастасия Львоваru (ru-n, en-2) 06:47, 19 September 2011 (UTC)[reply]
    Я этим занимаюсь, просто с отставанием (и даже надеюсь заказать инструмент, который мне поможет никого не забыть). Всё будет со временем ;) --Kaganer (talk) 08:55, 19 September 2011 (UTC)[reply]
    PS: Лошадок привязал. --Kaganer (talk) 09:13, 19 September 2011 (UTC)[reply]
  2. Обратил внимание, что сплошь и рядом {{Historic landmark}} ставится не на категорию памятника, а на файл, - а оно надо? Т.е. пока фото не включено в категории - без этого никуда, но, полагаю, далее при наличии категории конкретного памятника надо такие теги убирать, а в Category:Cultural multural ... включать именно категорию памятника. А то сколько тут одного Исаакия... NVO (talk) 04:32, 19 September 2011 (UTC)[reply]
    {{Historic landmark}} - да, как минимум на этом этапе надо. Для ряда монументов я не уверена, что будут созданы отдельные категории (например, решётка Летнего сада со стороны Мойки и со стороны Невы - это два разных номера монумента), при этом сейчас идёт работа над тем, чтобы видеть, фотографий каких монументов ещё вовсе нет. Анастасия Львоваru (ru-n, en-2) 06:47, 19 September 2011 (UTC)[reply]
    Абсолютно так (по кр. мере, на мой взгляд). Я планирую добавить в шаблон параметр "basecat", для ссылки на категорию памятника, если она есть. В этом случае файл не будет включаться в "общую" категорию. Заполняться будет ботом - если файл включён в категорию, у которой уже проставлен шаблон-маркер с тем же "id". --Kaganer (talk) 08:55, 19 September 2011 (UTC)[reply]
    См. также на эту тему Template talk:Cultural Heritage Russia. --Kaganer (talk) 08:55, 19 September 2011 (UTC)[reply]
    Есть ещё такая проблема: Часто в категории не один памятник (пример). Тут вообще надо что-то придумывать, делить на подкатегории, например, (это не всегда возможно, см. Category:Utkina Dacha).--Ymblanter (talk) 11:22, 2 October 2011 (UTC)[reply]

Состояние списков на wm.ru

[edit]

По Архангельской области, по Северодвинску на два памятника меньше, чем в базе (один из них дубль, второй нет). По Шенкурскому району. меньше половины. Остальные районы и субъекты РФ не смотрел.--Ymblanter (talk) 20:06, 5 October 2011 (UTC)[reply]

  • И годы все неверно проставлены, но это не критично, всё равно проверять--Ymblanter (talk) 21:14, 5 October 2011 (UTC)[reply]
    • Там записи перемешаны между субъектами: к примеру, объекты Калужской области оказываются приписанными к Красноярскому краю и Ульяновской области, и пр. и пр. Если выгружать в лоб по запросу "область Х", то в выгрузку гарантированно не попадает куча записей, доступная по запросу "город У" или "район Z" и т.п. Код региона при этом обычно правильный. NVO (talk) 02:27, 6 October 2011 (UTC)[reply]
      Спасибо, посмотрю по кодам, что там ещё перемешано.--Ymblanter (talk) 16:59, 6 October 2011 (UTC)[reply]
      • Архангельская область чем хороша - там все имена районов уникальные. А у кого, скажем, Кировский или Дзержинский район - гарантированная путаница. Усадьбу Салтыкова в Красноярский край записали. А оно ему, Салтыкову, надо было? NVO (talk) 22:29, 6 October 2011 (UTC)[reply]
        Нет, не все - Ленский и Приморский дублируются. --Ymblanter (talk) 05:16, 7 October 2011 (UTC)[reply]
        По Приморскому в списке дай Бог десятая часть, в базе вроде находится, что надо. В общем, надо всё руками перепроверять, боюсь.--Ymblanter (talk) 08:26, 8 October 2011 (UTC)[reply]
        Зато в базе, естественно, отображаются мосты через Фонтанку по Архангельской. Когда буду Приморский район обрабатывать, всё лишнее скину сюда.--Ymblanter (talk) 08:29, 8 October 2011 (UTC)[reply]
  • Годы в выгрузке вообще неверны везде, по всем субъектам федерации, то есть эту колонку можно просто игнорировать. В базе всё в порядке. по крайней мере, там, где я проверял. То есть памятник Ленини 19 века вполне может быть артефактом не базы, а её неправильной обработки.--Ymblanter (talk) 11:44, 8 October 2011 (UTC)[reply]
    Сейчас все регионы (кроме СПб, естественно) перевыгружены в расширенном формате. Это пока всё ещё промежуточные версии, и, понятное дело, путаница в отнесении к регионам так и осталась - но можно выборочно посмотреть, ушли ли ошибки, связанные именно с некорректностью обработки записей базы. --Kaganer (talk) 05:02, 12 October 2011 (UTC)[reply]
    По Краснодарскому краю такие ошибки ушли. Ю. Данилевский (talk) 05:55, 12 October 2011 (UTC)[reply]
    Я всё не проверял, но, сколько я посмотрел, ошибки исправлены. Проблемы с неполнотой пока остаются, видимо, их надо решать разбивкой выгрузки на районы или как-то ещё, то есть какой-то сменой алгоритма. Хорошо бы ещё число записей посчитать по районам - чтобы представлять объём работы - но это дело не срочное.--Ymblanter (talk) 06:11, 12 October 2011 (UTC)[reply]

Обзор выгрузки

[edit]

Итак, попробуем сделать обзор по выгрузке.--Ymblanter (talk) 19:58, 6 October 2011 (UTC)[reply]

Ярослав, спасибо за комплексный анализ списков. Однако замечу снова - этот набор списков - результат июньской черновой выгрузки. Повторная выгрузка с исправлением замеченных ошибок будет делаться в разбивке по АТО (городам, районам) чуть позже, по запросу региональных координаторов (или "модераторов базы", как вы с NVO) и после того, как мы решим вопросы с синхронизацией (чтобы можно было держать синхронные копии здесь и в ру-вики). --Kaganer (talk) 10:21, 10 October 2011 (UTC)[reply]
Я не в претензии, но мне кажется, эта тема - как раз и есть способ заметить ошибки, по крайней мере, некоторые. Года, кстати, о которых я писал выше, по всей видимости, вообще во многих случаях нельзя машинно считать - они записаны не в базе, а в находящихся в ней сосканированных паспортах памятников. Беды в этом особой нет - в любом случае понятно, что для доведения базы до ума нужно сделать много ручной работы, и к следующему году всё её сделать скорее всего не удастся - по части субъéктов будут невыверенные списки без координат. Ничего страшного.--Ymblanter (talk) 11:21, 10 October 2011 (UTC)[reply]

По Адыгее и Краснодарскому краю хотелось бы также памятники археологии - дольмены, например, довольно популярные фотообъекты. Ю. Данилевский (talk) 11:58, 11 October 2011 (UTC)[reply]

В базе дольмены, разумеется, есть.--Ymblanter (talk) 18:31, 11 October 2011 (UTC)[reply]
К слову сказать, ленин 19 века вполне реален, судя по моим наблюдениям. Есть памятник Ленину двадцатых годов, поставленный на прежнем пьедестале или окружённый прежней решёткой, столбиками, цепями. Из того, что было до ленина, следует 19 век; из самого же памятника следует 20 век.--PereslavlFoto (talk) 13:03, 12 October 2011 (UTC)[reply]
  • Сейчас взялся проверить пропущенные в выгрузке номера по Архангельской - в некоторых случаях объекты есть, а выгружены не были. Примеры: [1], [2]. Причину пока не понимаю.--Ymblanter (talk) 19:06, 25 October 2011 (UTC)[reply]

Оценка временных затрат по составлению списков

[edit]

Пока у меня получается следующее. Если взять типичный район одной из областей Европейской части (по которому база содержит 20-40 памятников), то лично мои временные затраты примерно такие:

  • На переработку формата (из стандартной выгрузки в то, как я обычно делаю) - вечер. В принципе, если сразу делать выгрузку ботом в моём формате, это время (для меня) уменьшается до нуля, но надо иметь в виду, что у всех форматы разные.
    Формат должен быть общий. --Kaganer (talk) 12:04, 20 October 2011 (UTC)[reply]
    Ну, в принципе, не должен, и по факту он уже сейчас разный, а на мои призывы унифицировать никто не откликается, но хорошо бы, конечно, чтобы был общим.--Ymblanter (talk) 13:30, 20 October 2011 (UTC)[reply]
  • Простая вычитка: проверить, что паспорта объектов в базе соответствуют выгрузке, пометить те, где нарушается свобода панорамы, объединить дубли - вечер напряжённой работы или два-три вечера обычной.
  • Более серьёзная выверка: сверка с другими списками и внешними источниками, простановка координат, указание состояния объекта - может легко занять неделю. Думаю, этот этап для большинства субъектов РФ к сентябрю завершить не удастся.
    Этот этап важен, но для конкурса он не требуется. --Kaganer (talk) 12:04, 20 October 2011 (UTC)[reply]
    Разумеется, я его в оценке и не учитываю.--Ymblanter (talk) 13:29, 20 October 2011 (UTC)[reply]

Итого - минимум вечер на район (без серьёзной выверки). Соответственно, в Европейской части РФ около 50 субъектов, в каждом по 20-30 районов. Если выгрузка будет в ноябре, и если заниматься этим будут несколько человек и они не будут халтурить - должны успеть, но на пределе.--Ymblanter (talk) 10:38, 20 October 2011 (UTC)[reply]

Альтернативная оценка

[edit]
  • Настоятельно рекомендую обрабатывать области целиком, а не район за районом. Так проще разбираться с ляпами и анахронизмами в указании районов. Ещё, так сразу видны возможные проблемы с одноимёнными сёлами, хотя бы в пределах одной области. Чтоб потом не перетаскивать из района в район викиредактором.
  • "20-40 памятников на район" - недооценка. Бывает и "200-400 в базе плюс 200-400 не в базе".
  • Объединение дублей - нетривиальная задача. Одни пары очевидны, другие расшить можно, только обращаясь к документам. Третьи и вовсе не очевидны, пока не сопоставишь фото или своими ногами не обойдёшь.
  • На мой кривой опыт, самое трудоёмкое - (а) состыковка федерального и местных списков, впрочем, таковые есть только по малой части районов (б) непосредственно перенос из своих таблиц на сайт.
  • Для элементарной обработки таблиц сил "нескольких человек" недостаточно. Нужно ещё десятка два добровольцев. NVO (talk) 11:52, 20 October 2011 (UTC)[reply]
    Ну почему, если просто посмотреть паспорта в базе данных и отметить серым несвободные с точко зрения FOP памятники, местные списки не подстыковывать, координаты не ставить, и реальное состояние памятников не проверять, то за год можно сделать. Другое дело, что хорошо бы сразу делать лучше, чтобы потом не пришлось этим заниматься второй раз.--Ymblanter (talk) 12:01, 20 October 2011 (UTC)[reply]
    Я имел в виду: не следует рассчитывать на то, что доброволец, взявшийся делать то, что ему интересно, с таким же рвением потратит полгода личной жизни на обработку других регионов. В лучшем случае будет поверхностная вычитка - взлёт-посадка. Повторюсь, идентификация сёл, выверка их районной принадлежности - ещё та задача (сколько там Орловок в Башкирии? А сколько других Орловок сгинуло и заросло лесом с 1960 года, когда Хрущёв с Фурцевой проредили тогдашний реестр?). FOP также времяёмкая задача (если речь идёт не об автоматической простановке запрета, а наоборот, о доказательстве свободы объектов). NVO (talk) 12:16, 20 October 2011 (UTC)[reply]
    С этим я, естественно, согласен. В идеале хорошо бы, чтобы доброволец был как раз из того самого региона, и знал бы его наизусть, но где столько таких найти, я не знаю. А фотографии будут, естественно, грузить из всех регионов.--Ymblanter (talk) 13:32, 20 October 2011 (UTC)[reply]
    отметить серым несвободные с точко зрения FOP памятники - уважаемые коллеги, прошу Вас оценивать сроки работы без учёта этого пункта; бесспорно, его выполнение занимает время, но нет никаких причин считать, что до нового года ГК не будет изменён. Анастасия Львоваru (ru-n, en-2) 13:00, 20 October 2011 (UTC)[reply]
    По моим сведениям, несвобода панорамы отменена не будет ни до НГ, ни после, что бы Вам оптимисты не говорили. Мне кажется, пары сотен загруженных несвободных изображений в этом году должно быть достаточно, чтобы в следующем такого не делать. --Ymblanter (talk) 13:28, 20 October 2011 (UTC)[reply]
    Дай бог, чтобы вы оказались правы. Воровать творческие произведения архитекторов и моделистов, галеристов и музейных работников, садовников и оформителей — очень опасно.--PereslavlFoto (talk) 15:50, 20 October 2011 (UTC)[reply]

Пришли сисопы и всех разогнали ;)

[edit]

Обсуждение перешло на Commons:Administrators'_noticeboard#Anyone fancy checking this out?. NVO (talk) 11:01, 17 October 2011 (UTC)[reply]

Честно говоря, не первый раз сталкиваюсь: такого безмозглого администрирования, как тут, я больше не видел ни в одном проекте. Недавно вынес полный дубликат файла на удаление - оставили как используемый. Теперь угрожают снести всё на фиг - а с фига кто потом будет восстанавливать, интересно. Снесут - буду действовать через организаторов WLM, там есть администраторы.--Ymblanter (talk) 11:09, 17 October 2011 (UTC)[reply]
Вечером напишу английскую шапку для списков - а то в следующий раз могут менее покладистые люди попасться.--Ymblanter (talk) 11:51, 17 October 2011 (UTC)[reply]
Спасибо за бдительность и убедительность ;) Да, увы - всё нужно сразу документировать на английском.--Kaganer (talk) 12:57, 17 October 2011 (UTC)[reply]
Помню, однажды я взялся искать правило о названиях категорий, и обнаружилось, что нет запрета на категории на любых языках. Поэтому предпочтение, которое имеют англоязычные категории, лишено оснований. Неужели уже принято правило, которое обязывает всё документировать на английском?--PereslavlFoto (talk) 11:15, 18 October 2011 (UTC)[reply]
Нет, конечно. Просто если бы NVO и меня не оказалось в сети вчера днём, и если бы страница обсуждения NVO совершенно случайно не стояла у меня в списке наблюдения, то всю нашу с ним работу за месяц бы снесли, а потом бы мы долго доказывали, что снесли её не по правилам. У меня, например, копий нет. Поэтому лучше не идти на принцип, а вставить в шапку короткое пояснение по-английски. Что касается конкретно категорий, мне кажется, что неудобно их иметь не по-английски, но это уже другой вопрос, который может потребовать какого-то обсуждения.--Ymblanter (talk) 13:36, 18 October 2011 (UTC)[reply]
Это что же получается, нет администратора с русским языком, который может после такого "снесли" всё восстановить обратно? Чудеса! Столько русских, а за власть не дерутся :-))).--PereslavlFoto (talk) 20:33, 18 October 2011 (UTC)[reply]
Есть, но всё равно разбираться придётся. Лично мне проще всё объяснить администратору без русского языка, который знает предмет.--Ymblanter (talk) 20:46, 18 October 2011 (UTC)[reply]
Commons:Categories ясно говорит: "Category names should generally be in English (see Commons:Language policy). However there are exceptions." В свою очередь, Commons:Языковая политика повторяет по-русски: "Категории должны называться преимущественно на английском языке". NVO (talk) 21:08, 3 November 2011 (UTC)[reply]

File:SPB 000039.jpg после объявления результатов конкурса пойдёт на удаление (Бугаева была жива ещё в 1949 году как минимум, про Васильева ничего найти не могу). Что, сложно было хотя бы при выборе десяти победителей несвободные отфильтровать?--Ymblanter (talk) 09:01, 4 November 2011 (UTC)[reply]

Это, кстати, очень интересный пример видения недостатков организации, потому что категория, описание, использование файла, а также официальные результаты на русском языке подсказывают, что Бугаева и Васильев не имеют никакого отношения к обсуждаемой "несвободной" фотографии. И лишь в одном месте можно, если не учитывать всё упомянутое, а также другие фотографии Ново-Калинкина моста, обнаружить проблему и обвинить в ней. Впрочем, спасибо; описание в этом единственном месте теперь тоже откорректировано. Анастасия Львоваru (ru-n, en-2) 09:41, 4 November 2011 (UTC)[reply]
Ну, что я могу сказать. Ищите номер памятника в базе данных.--Ymblanter (talk) 10:21, 4 November 2011 (UTC)[reply]
Всегда рада помочь. Анастасия Львоваru (ru-n, en-2) 10:25, 4 November 2011 (UTC)[reply]
(ec) Бугаева и Васильев - это ru:Ново-Калинкин мост. А на фото ru:Мало-Калинкин мост. Отставить панику. А вот File:ДК имени Кирова.jpg надо бы проверить - Троцкий умер в 1940, а двое других титульных соавторов - ? NVO (talk) 09:49, 4 November 2011 (UTC)[reply]
Я ничего не понял. Подписана фотография как Мало-Калинкин мост, ссылка ведёт на Ново-Калинкин. Как на самом деле?--Ymblanter (talk) 10:08, 4 November 2011 (UTC)[reply]
Нет, похоже, шаблон неверный, подпись верная. Сейчас попробую исправить.--Ymblanter (talk) 10:14, 4 November 2011 (UTC)[reply]
Мало-Калинкина моста в списке памятников нет.--Ymblanter (talk) 10:20, 4 November 2011 (UTC)[reply]
Есть. Анастасия Львоваru (ru-n, en-2) 10:25, 4 November 2011 (UTC)[reply]
Замечательно.--Ymblanter (talk) 10:29, 4 November 2011 (UTC)[reply]