Википедия:Форум/Архив/Предложения/2021/10
Архив форума
Эта страница — часть архива форума Википедии.
Пожалуйста, не редактируйте эту страницу!- ← сентябрь 2021
- октябрь 2021
- ноябрь 2021 →
Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.
Бебровый вандализм[править код]
В последнее время много вандализма со словом «бебра». Думаю, для анонимов и неавтоподтверждённых нужен фильтр, запрещающий правки, содержащие корень «бебр» или «bebr». А бота QBA-II-bot надо научить сообщать на ЗКАБ о регистрации учёток, содержащих этот корень. — 2A00:1370:8129:6878:A1C3:79DE:524B:60F8 01:55, 28 октября 2021 (UTC)
- Меня с таким предложением проигнорировали. — Vort (обс.) 06:12, 28 октября 2021 (UTC)
- А такой фильтр правок же уже давно есть. И бот распознаёт подобные имена, просто не делает запросы на ЗКАБ, а «куда надо» ибо ВП:НУВ. -- Q-bit array (обс.) 09:22, 28 октября 2021 (UTC)
- Давно - это сколько времени? Мне такие правки ещё неделю назад в статьях в списке наблюдения попадались неотфильтрованными. --Deinocheirus (обс.) 11:05, 28 октября 2021 (UTC)
- Две недели назад. -- Q-bit array (обс.) 12:43, 28 октября 2021 (UTC)
- Q-bit array, при написании латиницей фильтр пропускает… — 2A00:1370:8129:6878:6B7D:C580:E39A:4F21 20:35, 10 ноября 2021 (UTC)
- Q-bit array, и кириллицей тоже пропускает. Непорядок… — 2A00:1370:8129:6878:6B7D:C580:E39A:4F21 19:22, 26 ноября 2021 (UTC)
- Давно - это сколько времени? Мне такие правки ещё неделю назад в статьях в списке наблюдения попадались неотфильтрованными. --Deinocheirus (обс.) 11:05, 28 октября 2021 (UTC)
- А сюда наверное нужно внести город?— Футболло (обс.) 09:42, 30 октября 2021 (UTC)
- А зачем приманивать к статье неадекватов? -- Q-bit array (обс.) 19:29, 30 октября 2021 (UTC)
Использование ORES в баскской Википедии[править код]
Заметил, что в баскской Википедии используется OTRS ORES для определения качества (?) статьи. Может быть, нам тоже такое включить? 217.117.125.83 13:41, 27 октября 2021 (UTC)
- С таким же успехом «назначить» определять качество статей можно любую группу участников. Например с никами на букву «А». Я плохо понимаю какое отношение волонтёры OTRS имеют к качеству полутора миллионов статей. Странное предложение. Там 5-10 участников — они занимаются подтверждением авторских прав на медиафайлы и вдруг им ещё надо «качество статей» расставлять… Вот им охота этим заниматься… Ну даже если охота, то их оценка ничем не будет отличаться от участников, с никами на букву «А». --NoFrost❄❄❄ 13:48, 27 октября 2021 (UTC)
- Прошу прощения, перепутал ORES с VRTS. 217.117.125.83 14:12, 27 октября 2021 (UTC)
- «Земля наша велика и обильна, а порядка в ней нет. Приходите княжить и владеть нами». Что за ORES-то хоть? Беглое прочтение данной страницы внятного представления о сабже не дало. — Полиционер (обс.) 14:37, 27 октября 2021 (UTC)
- ORES — это нейронная сеть в Википедии, например используемая ботом Рейму Хакурей для отката вандализма. Теоретически, такая нейронная сеть может оценивать качество статей. Но лично я не думаю, что качество оценки будет приемлемо. -- Q-bit array (обс.) 14:48, 27 октября 2021 (UTC)
- Помню, Макса затравили за такое определение, мол, ORES — это не нейронная сеть, и не самообучающаяся, ему пришлось менять описание Реймы. Лес (Lesson) 14:52, 27 октября 2021 (UTC)
- Нейронная сеть - не обязательно самообучающаяся. ORES - не самообучающаяся, а обучаемая нейронная сеть. Есть даже интерфейс для её обучения - там можно вручную оценить 100500 случайных правок на предмет их вандальности. -- Q-bit array (обс.) 15:05, 27 октября 2021 (UTC)
- [1]. Лес (Lesson) 15:19, 27 октября 2021 (UTC)
- Оказывается, модель ORES для оценки качества статей в рувики уже обучена и работает. Я тоже поначалу думал, что её надо предварительно тренировать. Но нет. Это ведь правки никто раньше не оценивал, а статьям уже достаточно оценок проставлено, чтобы модель могла найти какие-то закономерности. — Vort (обс.) 18:11, 27 октября 2021 (UTC)
- Осталось понять, зачем эта оценка нужна в принципе) Ткнуть в паршивую статью может каждый. Если почистить плашки проектов, то вариант, а так дублирование механизмов. 185.16.139.127 20:28, 27 октября 2021 (UTC)
- Если в теме 90% стабов, то, может, и не нужен. Если же из сотни статей категории слабых статей несколько штук и стоит задача выбрать какую-то для улучшения, то такой механизм может быть полезен. — Vort (обс.) 06:16, 28 октября 2021 (UTC)
- Ручная оценка нужна для тренировки механизма. — Vort (обс.) 06:16, 28 октября 2021 (UTC)
- Осталось понять, зачем эта оценка нужна в принципе) Ткнуть в паршивую статью может каждый. Если почистить плашки проектов, то вариант, а так дублирование механизмов. 185.16.139.127 20:28, 27 октября 2021 (UTC)
- Нейронная сеть - не обязательно самообучающаяся. ORES - не самообучающаяся, а обучаемая нейронная сеть. Есть даже интерфейс для её обучения - там можно вручную оценить 100500 случайных правок на предмет их вандальности. -- Q-bit array (обс.) 15:05, 27 октября 2021 (UTC)
- Помню, Макса затравили за такое определение, мол, ORES — это не нейронная сеть, и не самообучающаяся, ему пришлось менять описание Реймы. Лес (Lesson) 14:52, 27 октября 2021 (UTC)
- ORES — это нейронная сеть в Википедии, например используемая ботом Рейму Хакурей для отката вандализма. Теоретически, такая нейронная сеть может оценивать качество статей. Но лично я не думаю, что качество оценки будет приемлемо. -- Q-bit array (обс.) 14:48, 27 октября 2021 (UTC)
- А что такое качество статьи в понимании сообщества? В понимании ORES? Участник не в теме прочитает, скажет «норм». Специалист прочтёт, придёт в ужас. 185.16.139.127 17:17, 27 октября 2021 (UTC)
- Про ORES вот так написано: «The
articlequality
model bases its predictions on structural characteristics of the article. E.g. How many sections are there? Is there an infobox? How many references? And do the references use a{{citation}}
: Пустой шаблон цитирования (справка) template? The articlequality model doesn't evaluate the quality of the writing or if there's a tone problem (e.g. a point of view being pushed). However, many of the structural characteristics of articles seem to correlate strongly with good writing and tone, so the models work very well in practice». То есть, смотрит на количество секций, есть ли карточка, сноски, оформлены ли источники шаблоном. — Vort (обс.) 17:26, 27 октября 2021 (UTC)- То есть не «качество» в общем понимании, а «качество оформления» и «наличие источников», верно? 185.16.139.127 17:56, 27 октября 2021 (UTC)
- Конечно, понять смысл написанного инструмент не может. Но так как хорошо оформленные статьи обычно хороши и по другим критериям, то для грубой оценки инструмент вполне годится. — Vort (обс.) 18:05, 27 октября 2021 (UTC)
- Не только. Автоматически можно оценить и качество текста (простейшие автокорректоры придуманы 30 лет назад, а современные обладают огромными словарями и могут распознавать даже сложные стилевые ошибки типа «слетевшей шляпы» на многих языках), и наличие артефактов машинного перевода, и многое другое. Так что оценивается всё нормально — и оформление, и источники, и качество текста. Фред-Продавец звёзд (обс.) 19:32, 27 октября 2021 (UTC)
- Сомнительные аргументы. Если бы эти автокорректоры могли распознать машинные переводы, то эти самые переводы давно перестали бы выглядеть машинными. В общем без примеров не поверю. 185.16.139.127 20:26, 27 октября 2021 (UTC)
- То есть не «качество» в общем понимании, а «качество оформления» и «наличие источников», верно? 185.16.139.127 17:56, 27 октября 2021 (UTC)
- Про ORES вот так написано: «The
- Потестировал модель — вроде, результаты неплохи. Сделал запрос по версиям Special:Permalink/117122786 и Special:Permalink/100370394. Статью «Земля» модель классифицировала как ИС с 75% вероятностью, статью «Альбас (Ло)» как IV уровень с 82%. — Vort (обс.) 17:47, 27 октября 2021 (UTC)
- Надеюсь, она как-то специально игнорирует факт наличия/отсутствия звездочки у статьи?.. А то получится местами предсказание прошлого. Медведь Никита (обс.) 19:27, 27 октября 2021 (UTC)
- Подозреваю, что более всего на предсказание влияет попросту размер статьи, а не какие-то её действительно качественные характеристики. — Good Will Hunting (обс.) 14:24, 28 октября 2021 (UTC)