Википедия:Форум/Архив/Предложения/2021/10

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Архив форума
Правки нежелательны

Эта страница — часть архива форума Википедии.

Пожалуйста, не редактируйте эту страницу!
Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.

Бебровый вандализм[править код]

В последнее время много вандализма со словом «бебра». Думаю, для анонимов и неавтоподтверждённых нужен фильтр, запрещающий правки, содержащие корень «бебр» или «bebr». А бота QBA-II-bot надо научить сообщать на ЗКАБ о регистрации учёток, содержащих этот корень. — 2A00:1370:8129:6878:A1C3:79DE:524B:60F8 01:55, 28 октября 2021 (UTC)

Использование ORES в баскской Википедии[править код]

Заметил, что в баскской Википедии используется OTRS ORES для определения качества (?) статьи. Может быть, нам тоже такое включить? 217.117.125.83 13:41, 27 октября 2021 (UTC)

  • С таким же успехом «назначить» определять качество статей можно любую группу участников. Например с никами на букву «А». Я плохо понимаю какое отношение волонтёры OTRS имеют к качеству полутора миллионов статей. Странное предложение. Там 5-10 участников — они занимаются подтверждением авторских прав на медиафайлы и вдруг им ещё надо «качество статей» расставлять… Вот им охота этим заниматься… Ну даже если охота, то их оценка ничем не будет отличаться от участников, с никами на букву «А». --NoFrost❄❄ 13:48, 27 октября 2021 (UTC)
  • «Земля наша велика и обильна, а порядка в ней нет. Приходите княжить и владеть нами». Что за ORES-то хоть? Беглое прочтение данной страницы внятного представления о сабже не дало.Полиционер (обс.) 14:37, 27 октября 2021 (UTC)
    • ORES — это нейронная сеть в Википедии, например используемая ботом Рейму Хакурей для отката вандализма. Теоретически, такая нейронная сеть может оценивать качество статей. Но лично я не думаю, что качество оценки будет приемлемо. -- Q-bit array (обс.) 14:48, 27 октября 2021 (UTC)
      • Помню, Макса затравили за такое определение, мол, ORES — это не нейронная сеть, и не самообучающаяся, ему пришлось менять описание Реймы. Лес (Lesson) 14:52, 27 октября 2021 (UTC)
        • Нейронная сеть - не обязательно самообучающаяся. ORES - не самообучающаяся, а обучаемая нейронная сеть. Есть даже интерфейс для её обучения - там можно вручную оценить 100500 случайных правок на предмет их вандальности. -- Q-bit array (обс.) 15:05, 27 октября 2021 (UTC)
          • [1]. Лес (Lesson) 15:19, 27 октября 2021 (UTC)
          • Оказывается, модель ORES для оценки качества статей в рувики уже обучена и работает. Я тоже поначалу думал, что её надо предварительно тренировать. Но нет. Это ведь правки никто раньше не оценивал, а статьям уже достаточно оценок проставлено, чтобы модель могла найти какие-то закономерности. — Vort (обс.) 18:11, 27 октября 2021 (UTC)
            • Осталось понять, зачем эта оценка нужна в принципе) Ткнуть в паршивую статью может каждый. Если почистить плашки проектов, то вариант, а так дублирование механизмов. 185.16.139.127 20:28, 27 октября 2021 (UTC)
              • Если в теме 90% стабов, то, может, и не нужен. Если же из сотни статей категории слабых статей несколько штук и стоит задача выбрать какую-то для улучшения, то такой механизм может быть полезен. — Vort (обс.) 06:16, 28 октября 2021 (UTC)
              • Ручная оценка нужна для тренировки механизма. — Vort (обс.) 06:16, 28 октября 2021 (UTC)
  • А что такое качество статьи в понимании сообщества? В понимании ORES? Участник не в теме прочитает, скажет «норм». Специалист прочтёт, придёт в ужас. 185.16.139.127 17:17, 27 октября 2021 (UTC)
    • Про ORES вот так написано: «The articlequality model bases its predictions on structural characteristics of the article. E.g. How many sections are there? Is there an infobox? How many references? And do the references use a {{citation}}: Пустой шаблон цитирования (справка) template? The articlequality model doesn't evaluate the quality of the writing or if there's a tone problem (e.g. a point of view being pushed). However, many of the structural characteristics of articles seem to correlate strongly with good writing and tone, so the models work very well in practice». То есть, смотрит на количество секций, есть ли карточка, сноски, оформлены ли источники шаблоном. — Vort (обс.) 17:26, 27 октября 2021 (UTC)
      • То есть не «качество» в общем понимании, а «качество оформления» и «наличие источников», верно? 185.16.139.127 17:56, 27 октября 2021 (UTC)
        • Конечно, понять смысл написанного инструмент не может. Но так как хорошо оформленные статьи обычно хороши и по другим критериям, то для грубой оценки инструмент вполне годится. — Vort (обс.) 18:05, 27 октября 2021 (UTC)
        • Не только. Автоматически можно оценить и качество текста (простейшие автокорректоры придуманы 30 лет назад, а современные обладают огромными словарями и могут распознавать даже сложные стилевые ошибки типа «слетевшей шляпы» на многих языках), и наличие артефактов машинного перевода, и многое другое. Так что оценивается всё нормально — и оформление, и источники, и качество текста. Фред-Продавец звёзд (обс.) 19:32, 27 октября 2021 (UTC)
          • Сомнительные аргументы. Если бы эти автокорректоры могли распознать машинные переводы, то эти самые переводы давно перестали бы выглядеть машинными. В общем без примеров не поверю. 185.16.139.127 20:26, 27 октября 2021 (UTC)
  • Потестировал модель — вроде, результаты неплохи. Сделал запрос по версиям Special:Permalink/117122786 и Special:Permalink/100370394. Статью «Земля» модель классифицировала как ИС с 75% вероятностью, статью «Альбас (Ло)» как IV уровень с 82%. — Vort (обс.) 17:47, 27 октября 2021 (UTC)