Обсуждение арбитража:Пересмотр ВП:БЕЛ/Рабочая группа

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Национальный корпус русского языка[править код]

Возможно, рабочей группе в её работе пригодится статистика Национального корпуса русского языка?

Использование вариантов именования белорусского государства в 1992—2021 годах,
разбивка по десятилетиям, точные формы
1992—2001
2002—2011
2012—2021
Основной корпус
Белоруссия 80 текстов, 116 примеров [1] 182 текста, 267 примеров [2] 25 текстов, 47 примеров [3]
Беларусь 40 текстов, 61 пример [4] 173 текста, 333 примера [5] 46 текстов, 82 примера [6]
Газетный корпус (центральные СМИ)
Белоруссия 626 текстов, 884 примера [7] 6 177 текстов, 9 370 примеров [8] 5 647 текстов, 7 493 примера [9]
Беларусь 256 текстов, 382 примера[10] 1 630 текстов, 2 606 примеров [11] 3 219 текстов, 4 213 примеров [12]
Газетный корпус (региональные СМИ)
Белоруссия 2 текста, 4 примера [13] 23 текста, 33 примера [14] 27 текстов, 33 примера [15]
Беларусь тексты и примеры отсутствуют [16] 211 текстов, 486 примеров [17] 1 458 текстов, 2 803 примера [18]

Даю для затравки, так сказать (см. таблицу). При этом должен предупредить, что в некоторой части текстов Беларусь обозначает не государство, а трактор. Но, по первому впечатлению, доля таких текстов не слишком велика. Чуть позже планирую дать таблички по другим корпусам, а не только по основному. С уважением, NN21 (обс.) 12:37, 16 января 2023 (UTC)[ответить]

Если убрать временно́е ограничение, то для Белоруссии получим 433 текста и 614 примеров [19] — против 311 текстов и 558 примеров для Беларуси [20]. Лично меня этот результат удивил: первая форма опережает вторую, но не слишком сильно. С уважением, NN21 (обс.) 13:29, 16 января 2023 (UTC)[ответить]

Доля формы «Белоруссия» в 1992—2021 годах, % от общего числа примеров,
разбивка по десятилетиям, точные формы
1992—2001
2002—2011
2012—2021
Основной корпус 65,5 44,5 36,4
Газетный корпус
(центральные СМИ)
69,8 78,2 64,0
Газетный корпус
(региональные СМИ)
100 6,4 1,2

Добавляю сведения по корпусу центральных СМИ. С уважением, NN21 (обс.) 14:40, 17 января 2023 (UTC)[ответить]

Комментарии: всего две таблицы, но сколько возникает вопросов! В первой из них мы наблюдаем устойчивое снижение популярности первого варианта именования, который, будучи первоначально в большинстве, утратил лидерство во втором и третьем десятилетии использованной разбивки. Во второй таблице динамика иная, а лидерство первой формы фиксируется во всех трёх десятилетиях. С уважением, NN21 (обс.) 15:14, 17 января 2023 (UTC)[ответить]

В ближайших планах — аналогичным образом рассмотреть корпус региональных СМИ. С уважением, NN21 (обс.) 15:18, 17 января 2023 (UTC)[ответить]

Данные по долям вынес в отдельную таблицу. Думаю, так будет лучше. С уважением, NN21 (обс.) 16:58, 17 января 2023 (UTC)[ответить]

Добавил данные по региональным СМИ, которые лично у меня вызывают крайнее недоумение: различия с основным корпусом (тем более, с корпусом центральных СМИ) огромные! Поневоле начинаешь подозревать глюк, а если глюка нет, то каково объяснение таких различий? У меня пока нет ответа. С уважением, NN21 (обс.) 16:57, 18 января 2023 (UTC)[ответить]

Крайне важное замечание: приведённая выше статистика касается именно точных форм — то есть форм «Белоруссия» и «Беларусь», а формы косвенных падежей в ней не учитываются. Однако Национальный корпус русского языка позволяет получить и другую статистику, в которой будут учтены все формы одного слова. В ближайшее время этим я и собираюсь заняться. С уважением, NN21 (обс.) 20:21, 19 января 2023 (UTC)[ответить]

  • Простите, я правильно понимаю, что проверялась частотность форм "Белоруссия" и "Беларусь"? Если да, то это некорректно, потому что форма "Беларусь" является и именительным, и винительным падежом ("вижу Беларусь"), а форма "Белоруссия" - только именительным (потому что в винительном будет "вижу Белоруссию"). Vcohen (обс.) 22:18, 19 января 2023 (UTC)[ответить]
    • Вы очень точно описали возможный источник проблем. Именно поэтому вскоре я планирую рассмотреть статистику, покрывающую все формы одного слова. Такая возможность предусмотрена, как я недавно для себя обнаружил. С уважением, NN21 (обс.) 12:55, 20 января 2023 (UTC)[ответить]

Поиск всех форм одного слова[править код]

Использование вариантов именования белорусского государства в 1992—2021 годах,
разбивка по десятилетиям, все формы слова
1992—2001
2002—2011
2012—2021
Основной корпус
Белоруссия 352 текста, 788 примеров [21] 762 текста, 1 533 примера [22] 135 текстов, 237 примеров [23]
Беларусь 64 текста, 119 примеров [24] 257 текстов, 657 примеров [25] 58 текстов, 150 примеров [26]
Газетный корпус (центральные СМИ)
Белоруссия 2 917 текстов, 7 225 примеров [27] 20 432 текста, 52 238 примеров [28] 24 745 текстов, 60 079 примеров [29]
Беларусь 426 текстов, 720 примеров [30] 2 762 текста, 5 496 примеров [31] 4 650 текстов, 7 431 пример [32]
Газетный корпус (региональные СМИ)
Белоруссия 4 текста, 8 примеров [33] 177 текстов, 243 примера [34] 337 текстов, 435 примеров [35]
Беларусь тексты и примеры отсутствуют [36] 466 текстов, 1 196 примеров [37] 1 631 текст, 3 550 примеров [38]
Доля формы «Белоруссия» в 1992—2021 годах, % от общего числа примеров,
разбивка по десятилетиям, все формы слова
1992—2001
2002—2011
2012—2021
Основной корпус 86,9 70,0 61,2
Газетный корпус
(центральные СМИ)
90,9 90,5 89,0
Газетный корпус
(региональные СМИ)
100 16,9 10,9

Публикую таблицу со статистикой по всем формам слова. С уважением, NN21 (обс.) 16:56, 20 января 2023 (UTC)[ответить]

Добавляю данные по распределению двух форм. С уважением, NN21 (обс.) 17:17, 20 января 2023 (UTC) (Иначе сказать, публикую доли той или иной формы в конкретном корпусе за конкретный период. С уважением, NN21 (обс.) 17:19, 20 января 2023 (UTC)[ответить]

Комментарии: Во-первых, перед нами вновь неоднозначная картина: корпуса́ ведут себя совершенно по-разному. С одной стороны, в основном корпусе и в региональном доля традиционной формы падает, доля формы «Беларусь» — соответственно, растёт, а с другой, корпус центральных СМИ после учёта косвенных падежей демонстрирует удивительное постоянство: доля традиционной формы держится вблизи 90 %. Во-вторых, новая форма добивается лидерства лишь в региональном корпусе — там, где, предположительно, велика доля белорусских СМИ. С уважением, NN21 (обс.) 17:27, 20 января 2023 (UTC)[ответить]

  • При разделении региональных СМИ по странам получается, что 90% примеров «Беларусь» — из белорусских СМИ [39]. В остальных региональных СМИ доля формы «Белоруссия» выше. В центральных СМИ очень значительная часть — упоминания не страны, а организаций (телеканал «Беларусь 1», «Газпром трансгаз Беларусь», санаторий «Беларусь» и т.д.), например только «Sputnik Беларусь» — 715 примеров из 7431 [40]. Возможно ли их исключить? С уважением, Sic melius erit (обс.) 18:35, 20 января 2023 (UTC)[ответить]

Дополнительное замечание: при поиске точных форм по запросу Белоруссия в корпусе центральных СМИ за 2012—2021 годы нашлось 5 647 текстов, 7 493 примера, а учёт всех форм даёт 24 745 текстов, 60 079 примеров. Тем самым число примеров растёт примерно в 8 раз. Напротив, при поиске точных форм по запросу Беларусь в корпусе центральных СМИ за 2012—2021 годы нашлось 3 219 текстов, 4 213 примеров, а учёт всех форм даёт 4 650 текстов, 7 431 пример. Таким образом, число примеров растёт менее, чем в 2 раза, что заставляет задуматься и удивиться. Моё объяснение — и по сей день «Беларусь» остаётся непривычным, неосвоенным словом, склонять которое авторы (сознательно или неосознанно) избегают. С уважением, NN21 (обс.) 17:41, 20 января 2023 (UTC)[ответить]

  • В словосочетании «Республика Беларусь» по падежам изменяется только первое слово. Если общее количество всех остальных падежных форм топонима «Беларусь» примерно равняется одному только именительному падежу, это скорее указывает на большое количество оборотов «Республика Беларусь» среди общего количества случаев использования топонима (то же самое верно для трактора, но в основном, вероятно, всё-таки статистику искажает именно официальное название государства). Deinocheirus (обс.) 01:02, 21 января 2023 (UTC)[ответить]
    • «В словосочетании „Республика Беларусь“ по падежам изменяется только первое слово». Согласен. С уважением, NN21 (обс.) 04:41, 21 января 2023 (UTC)[ответить]
    • Ещё стоит учесть то, что «Беларусь» не склоняется в винительном падеже, хоть это само по себе не способно радикально исказить статистику. Siradan (обс.) 11:31, 21 января 2023 (UTC)[ответить]
      • А, ну да. То есть соотношение для формы Беларусь и остальных должно быть изначально не 1:5, а 2:4. Но в данном случае оно примерно 1:1, то есть перекос в пользу именительного/винительного падежей всё равно есть. Deinocheirus (обс.) 12:34, 21 января 2023 (UTC)[ответить]
        • Скажем так: не факт, что частоты применения падежей равны, поэтому для окончательного вывода по данному пункту стоит определить частоту применения винительного падежа к «Белоруссии», и на основе этого соотношения можно будет анализировать статистику по «Беларуси». Siradan (обс.) 12:56, 21 января 2023 (UTC)[ответить]
      • «„Беларусь“ не склоняется в винительном падеже». Мысль понятна, но выражена неточно. Правильно было бы говорить о совпадении форм именительного и винительного падежей. С уважением, NN21 (обс.) 19:23, 21 января 2023 (UTC)[ответить]

Региональный корпус: рассмотрим поближе[править код]

Использование вариантов именования белорусского государства
в региональном корпусе, 1992—2021 годы,
разбивка по государствам и десятилетиям, все формы слова
1992—2001
2002—2011
2012—2021
Белорусские СМИ
Белоруссия [41] 16 текстов, 22 примера [42] 29 текстов, 44 примера [43]
Беларусь [44] 386 текстов, 1062 примера [45] 1402 текста, 3176 примеров [46]
Российские региональные СМИ
Белоруссия 4 текста, 8 примеров [47] 149 текстов, 204 примера [48] 308 текстов, 391 пример [49]
Беларусь [50] 65 текстов, 110 примеров [51] 229 текстов, 374 примера [52]

Публикую таблицу, которую давно собирался составить. Надеюсь, что нигде не перепутал ячейки и что всё стоит на своих местах. С уважением, NN21 (обс.) 21:43, 8 февраля 2023 (UTC)[ответить]

Первое, что очень хорошо видно: в белорусских СМИ используется почти исключительно форма «Беларусь». С уважением, NN21 (обс.) 21:48, 8 февраля 2023 (UTC)[ответить]

Второе, что следует отметить: доля формы «Беларусь» в российских региональных СМИ растёт, приближаясь к 50 %. И здесь мы видим их отличие от центральных СМИ, которые ведут себя существенно более консервативно. С уважением, NN21 (обс.) 21:53, 8 февраля 2023 (UTC)[ответить]

К этому надо добавить, что статистика, конечно, поменяется, если «вычесть» такие примеры, как автотрасса М-1 «Беларусь» и прочие собственные названия, включающие слова «Белоруссия» или «Беларусь», однако, по моим оценкам, радикальных изменений не произойдёт. (Впрочем, проверить не помешает.) С уважением, NN21 (обс.) 22:01, 8 февраля 2023 (UTC)[ответить]

Вне пределов Белоруссии и России[править код]

Также добавил небольшую табличку по СМИ ряда других стран бывшего СССР. Увы, примеров немного, и в таких условиях делить их по десятилетиям и пытаться выявить динамику, полагаю, не стоит. С уважением, NN21 (обс.) 22:20, 8 февраля 2023 (UTC)[ответить]

Использование вариантов именования белорусского государства в региональном корпусе, все формы слова (дополнение)
СМИ Киргизии, Латвии, Литвы, Молдовы и Эстонии, 1992—2021
Белоруссия 12 текстов, 17 примеров [53]
Беларусь 15 текстов, 24 примера [54]

Ещё несколько слов[править код]

Моё участие в рабочей группе оказалось под большим вопросом. Однако хочется верить, что независимо от того, как этот вопрос разрешится, приведённые мною новые данные будут хоть сколько-нибудь полезны. С уважением, NN21 (обс.) 22:26, 8 февраля 2023 (UTC)[ответить]

Предложение для рабочей группы[править код]

Арбитры сочли крайне желательным иметь в составе рабочей группы одного человека, постоянно живущего в РБ, "для оценки ситуации в белорусских СМИ и книжных изданиях, которую, возможно, не полностью покрывает выдача в Интернете". Поскольку таковых, насколько я понимаю, в составе группы не будет, я готов оказать посильную волонтёрскую помощь в реализации этого пожелания арбитров. Я регулярно бываю в Национальной библиотеке Беларуси и могу предоставлять фотокопии нужных печатных изданий для использования рабочей группой. Соответствующий опыт в промышленных масштабах у меня есть, а с тех пор качество выполняемых фотокопий значительно улучшилось. @Źmicier Dzikański, Ле Лой, NN21, Wikisaurus: обращайтесь при необходимости. — Homoatrox (обс.). 17:44, 3 февраля 2023 (UTC)[ответить]

Уж полночь близится[править код]

Думаю, что год - достаточный срок для рассмотрения вопроса любой сложности - или признания того, что работа группы закончилась ничем. Хотелось бы узнать результат. Hammunculs (обс.) 09:16, 17 апреля 2024 (UTC)[ответить]

  • Изначально плохой идеей было делать рабочую группу бессрочной. Но если бессрочная группа в ближайшее время не выдаст результат или вообще никак не ответит или не сформулирует конечные сроки своих выводов, то можно будет подавать новый иск. — Всезнайка (обс.) 12:51, 17 апреля 2024 (UTC)[ответить]