Обсуждение арбитража:Пересмотр ВП:БЕЛ/Рабочая группа
Национальный корпус русского языка[править код]
Возможно, рабочей группе в её работе пригодится статистика Национального корпуса русского языка?
Белоруссия
|
80 текстов, 116 примеров [1] | 182 текста, 267 примеров [2] | 25 текстов, 47 примеров [3] |
Беларусь
|
40 текстов, 61 пример [4] | 173 текста, 333 примера [5] | 46 текстов, 82 примера [6] |
Белоруссия
|
626 текстов, 884 примера [7] | 6 177 текстов, 9 370 примеров [8] | 5 647 текстов, 7 493 примера [9] |
Беларусь
|
256 текстов, 382 примера[10] | 1 630 текстов, 2 606 примеров [11] | 3 219 текстов, 4 213 примеров [12] |
Белоруссия
|
2 текста, 4 примера [13] | 23 текста, 33 примера [14] | 27 текстов, 33 примера [15] |
Беларусь
|
тексты и примеры отсутствуют [16] | 211 текстов, 486 примеров [17] | 1 458 текстов, 2 803 примера [18] |
Даю для затравки, так сказать (см. таблицу). При этом должен предупредить, что в некоторой части текстов Беларусь обозначает не государство, а трактор. Но, по первому впечатлению, доля таких текстов не слишком велика. Чуть позже планирую дать таблички по другим корпусам, а не только по основному. С уважением, NN21 (обс.) 12:37, 16 января 2023 (UTC)
Если убрать временно́е ограничение, то для Белоруссии получим 433 текста и 614 примеров [19] — против 311 текстов и 558 примеров для Беларуси [20]. Лично меня этот результат удивил: первая форма опережает вторую, но не слишком сильно. С уважением, NN21 (обс.) 13:29, 16 января 2023 (UTC)
Основной корпус | 65,5 | 44,5 | 36,4 |
Газетный корпус (центральные СМИ) |
69,8 | 78,2 | 64,0 |
Газетный корпус (региональные СМИ) |
100 | 6,4 | 1,2 |
Добавляю сведения по корпусу центральных СМИ. С уважением, NN21 (обс.) 14:40, 17 января 2023 (UTC)
Комментарии: всего две таблицы, но сколько возникает вопросов! В первой из них мы наблюдаем устойчивое снижение популярности первого варианта именования, который, будучи первоначально в большинстве, утратил лидерство во втором и третьем десятилетии использованной разбивки. Во второй таблице динамика иная, а лидерство первой формы фиксируется во всех трёх десятилетиях. С уважением, NN21 (обс.) 15:14, 17 января 2023 (UTC)
В ближайших планах — аналогичным образом рассмотреть корпус региональных СМИ. С уважением, NN21 (обс.) 15:18, 17 января 2023 (UTC)
Данные по долям вынес в отдельную таблицу. Думаю, так будет лучше. С уважением, NN21 (обс.) 16:58, 17 января 2023 (UTC)
Добавил данные по региональным СМИ, которые лично у меня вызывают крайнее недоумение: различия с основным корпусом (тем более, с корпусом центральных СМИ) огромные! Поневоле начинаешь подозревать глюк, а если глюка нет, то каково объяснение таких различий? У меня пока нет ответа. С уважением, NN21 (обс.) 16:57, 18 января 2023 (UTC)
- Возможно потому, что количество упоминаний страны в региональных белорусских СМИ на 2 порядка превышает упоминания в региональных СМИ других стран. Возможно ли разделить статистику по странам? С уважением, Sic melius erit (обс.) 13:46, 20 января 2023 (UTC)
- Вот цитата с описанием корпуса региональных СМИ : «География печатных изданий широка и охватывает все федеральные округа России, а также страны СНГ (Беларусь, Молдова, Кыргызстан) и Балтии». Не исключено, что Вы правы. С уважением, NN21 (обс.) 15:43, 20 января 2023 (UTC)
- С другой стороны, я просмотрел поисковую выдачу — ни на первой странице, ни на девяти последующих белорусских СМИ я не обнаружил. С уважением, NN21 (обс.) 15:57, 20 января 2023 (UTC)
- Изменил порядок сортировки — и белорусские СМИ сплошным потоком! С уважением, NN21 (обс.) 16:11, 20 января 2023 (UTC)
Крайне важное замечание: приведённая выше статистика касается именно точных форм — то есть форм «Белоруссия» и «Беларусь», а формы косвенных падежей в ней не учитываются. Однако Национальный корпус русского языка позволяет получить и другую статистику, в которой будут учтены все формы одного слова. В ближайшее время этим я и собираюсь заняться. С уважением, NN21 (обс.) 20:21, 19 января 2023 (UTC)
- Простите, я правильно понимаю, что проверялась частотность форм "Белоруссия" и "Беларусь"? Если да, то это некорректно, потому что форма "Беларусь" является и именительным, и винительным падежом ("вижу Беларусь"), а форма "Белоруссия" - только именительным (потому что в винительном будет "вижу Белоруссию"). Vcohen (обс.) 22:18, 19 января 2023 (UTC)
- Вы очень точно описали возможный источник проблем. Именно поэтому вскоре я планирую рассмотреть статистику, покрывающую все формы одного слова. Такая возможность предусмотрена, как я недавно для себя обнаружил. С уважением, NN21 (обс.) 12:55, 20 января 2023 (UTC)
Поиск всех форм одного слова[править код]
Белоруссия
|
352 текста, 788 примеров [21] | 762 текста, 1 533 примера [22] | 135 текстов, 237 примеров [23] |
Беларусь
|
64 текста, 119 примеров [24] | 257 текстов, 657 примеров [25] | 58 текстов, 150 примеров [26] |
Белоруссия
|
2 917 текстов, 7 225 примеров [27] | 20 432 текста, 52 238 примеров [28] | 24 745 текстов, 60 079 примеров [29] |
Беларусь
|
426 текстов, 720 примеров [30] | 2 762 текста, 5 496 примеров [31] | 4 650 текстов, 7 431 пример [32] |
Белоруссия
|
4 текста, 8 примеров [33] | 177 текстов, 243 примера [34] | 337 текстов, 435 примеров [35] |
Беларусь
|
тексты и примеры отсутствуют [36] | 466 текстов, 1 196 примеров [37] | 1 631 текст, 3 550 примеров [38] |
Основной корпус | 86,9 | 70,0 | 61,2 |
Газетный корпус (центральные СМИ) |
90,9 | 90,5 | 89,0 |
Газетный корпус (региональные СМИ) |
100 | 16,9 | 10,9 |
Публикую таблицу со статистикой по всем формам слова. С уважением, NN21 (обс.) 16:56, 20 января 2023 (UTC)
Добавляю данные по распределению двух форм. С уважением, NN21 (обс.) 17:17, 20 января 2023 (UTC) (Иначе сказать, публикую доли той или иной формы в конкретном корпусе за конкретный период. С уважением, NN21 (обс.) 17:19, 20 января 2023 (UTC)
Комментарии: Во-первых, перед нами вновь неоднозначная картина: корпуса́ ведут себя совершенно по-разному. С одной стороны, в основном корпусе и в региональном доля традиционной формы падает, доля формы «Беларусь» — соответственно, растёт, а с другой, корпус центральных СМИ после учёта косвенных падежей демонстрирует удивительное постоянство: доля традиционной формы держится вблизи 90 %. Во-вторых, новая форма добивается лидерства лишь в региональном корпусе — там, где, предположительно, велика доля белорусских СМИ. С уважением, NN21 (обс.) 17:27, 20 января 2023 (UTC)
- При разделении региональных СМИ по странам получается, что 90% примеров «Беларусь» — из белорусских СМИ [39]. В остальных региональных СМИ доля формы «Белоруссия» выше. В центральных СМИ очень значительная часть — упоминания не страны, а организаций (телеканал «Беларусь 1», «Газпром трансгаз Беларусь», санаторий «Беларусь» и т.д.), например только «Sputnik Беларусь» — 715 примеров из 7431 [40]. Возможно ли их исключить? С уважением, Sic melius erit (обс.) 18:35, 20 января 2023 (UTC)
- В «ручном» режиме — конечно, можно. Но это, понятно, не выход: слишком большой объём работы. С уважением, NN21 (обс.) 04:43, 21 января 2023 (UTC)
Дополнительное замечание: при поиске точных форм по запросу Белоруссия
в корпусе центральных СМИ за 2012—2021 годы нашлось 5 647 текстов, 7 493 примера, а учёт всех форм даёт 24 745 текстов, 60 079 примеров. Тем самым число примеров растёт примерно в 8 раз. Напротив, при поиске точных форм по запросу Беларусь
в корпусе центральных СМИ за 2012—2021 годы нашлось 3 219 текстов, 4 213 примеров, а учёт всех форм даёт 4 650 текстов, 7 431 пример. Таким образом, число примеров растёт менее, чем в 2 раза, что заставляет задуматься и удивиться. Моё объяснение — и по сей день «Беларусь» остаётся непривычным, неосвоенным словом, склонять которое авторы (сознательно или неосознанно) избегают. С уважением, NN21 (обс.) 17:41, 20 января 2023 (UTC)
- В словосочетании «Республика Беларусь» по падежам изменяется только первое слово. Если общее количество всех остальных падежных форм топонима «Беларусь» примерно равняется одному только именительному падежу, это скорее указывает на большое количество оборотов «Республика Беларусь» среди общего количества случаев использования топонима (то же самое верно для трактора, но в основном, вероятно, всё-таки статистику искажает именно официальное название государства). Deinocheirus (обс.) 01:02, 21 января 2023 (UTC)
- «В словосочетании „Республика Беларусь“ по падежам изменяется только первое слово». Согласен. С уважением, NN21 (обс.) 04:41, 21 января 2023 (UTC)
- Ещё стоит учесть то, что «Беларусь» не склоняется в винительном падеже, хоть это само по себе не способно радикально исказить статистику. Siradan (обс.) 11:31, 21 января 2023 (UTC)
- А, ну да. То есть соотношение для формы Беларусь и остальных должно быть изначально не 1:5, а 2:4. Но в данном случае оно примерно 1:1, то есть перекос в пользу именительного/винительного падежей всё равно есть. Deinocheirus (обс.) 12:34, 21 января 2023 (UTC)
- Скажем так: не факт, что частоты применения падежей равны, поэтому для окончательного вывода по данному пункту стоит определить частоту применения винительного падежа к «Белоруссии», и на основе этого соотношения можно будет анализировать статистику по «Беларуси». Siradan (обс.) 12:56, 21 января 2023 (UTC)
- «„Беларусь“ не склоняется в винительном падеже». Мысль понятна, но выражена неточно. Правильно было бы говорить о совпадении форм именительного и винительного падежей. С уважением, NN21 (обс.) 19:23, 21 января 2023 (UTC)
- Не забудьте исключить трактор «Беларусь». — Хедин (обс.) 07:22, 24 января 2023 (UTC)
- А, ну да. То есть соотношение для формы Беларусь и остальных должно быть изначально не 1:5, а 2:4. Но в данном случае оно примерно 1:1, то есть перекос в пользу именительного/винительного падежей всё равно есть. Deinocheirus (обс.) 12:34, 21 января 2023 (UTC)
Региональный корпус: рассмотрим поближе[править код]
Белоруссия
|
— [41] | 16 текстов, 22 примера [42] | 29 текстов, 44 примера [43] |
Беларусь
|
— [44] | 386 текстов, 1062 примера [45] | 1402 текста, 3176 примеров [46] |
Белоруссия
|
4 текста, 8 примеров [47] | 149 текстов, 204 примера [48] | 308 текстов, 391 пример [49] |
Беларусь
|
— [50] | 65 текстов, 110 примеров [51] | 229 текстов, 374 примера [52] |
Публикую таблицу, которую давно собирался составить. Надеюсь, что нигде не перепутал ячейки и что всё стоит на своих местах. С уважением, NN21 (обс.) 21:43, 8 февраля 2023 (UTC)
Первое, что очень хорошо видно: в белорусских СМИ используется почти исключительно форма «Беларусь». С уважением, NN21 (обс.) 21:48, 8 февраля 2023 (UTC)
Второе, что следует отметить: доля формы «Беларусь» в российских региональных СМИ растёт, приближаясь к 50 %. И здесь мы видим их отличие от центральных СМИ, которые ведут себя существенно более консервативно. С уважением, NN21 (обс.) 21:53, 8 февраля 2023 (UTC)
К этому надо добавить, что статистика, конечно, поменяется, если «вычесть» такие примеры, как автотрасса М-1 «Беларусь» и прочие собственные названия, включающие слова «Белоруссия» или «Беларусь», однако, по моим оценкам, радикальных изменений не произойдёт. (Впрочем, проверить не помешает.) С уважением, NN21 (обс.) 22:01, 8 февраля 2023 (UTC)
Вне пределов Белоруссии и России[править код]
Также добавил небольшую табличку по СМИ ряда других стран бывшего СССР. Увы, примеров немного, и в таких условиях делить их по десятилетиям и пытаться выявить динамику, полагаю, не стоит. С уважением, NN21 (обс.) 22:20, 8 февраля 2023 (UTC)
Белоруссия
|
12 текстов, 17 примеров [53] |
Беларусь
|
15 текстов, 24 примера [54] |
Ещё несколько слов[править код]
Моё участие в рабочей группе оказалось под большим вопросом. Однако хочется верить, что независимо от того, как этот вопрос разрешится, приведённые мною новые данные будут хоть сколько-нибудь полезны. С уважением, NN21 (обс.) 22:26, 8 февраля 2023 (UTC)
Предложение для рабочей группы[править код]
Арбитры сочли крайне желательным иметь в составе рабочей группы одного человека, постоянно живущего в РБ, "для оценки ситуации в белорусских СМИ и книжных изданиях, которую, возможно, не полностью покрывает выдача в Интернете". Поскольку таковых, насколько я понимаю, в составе группы не будет, я готов оказать посильную волонтёрскую помощь в реализации этого пожелания арбитров. Я регулярно бываю в Национальной библиотеке Беларуси и могу предоставлять фотокопии нужных печатных изданий для использования рабочей группой. Соответствующий опыт в промышленных масштабах у меня есть, а с тех пор качество выполняемых фотокопий значительно улучшилось. @Źmicier Dzikański, Ле Лой, NN21, Wikisaurus: обращайтесь при необходимости. — Homoatrox (обс.). 17:44, 3 февраля 2023 (UTC)
Уж полночь близится[править код]
Думаю, что год - достаточный срок для рассмотрения вопроса любой сложности - или признания того, что работа группы закончилась ничем. Хотелось бы узнать результат. Hammunculs (обс.) 09:16, 17 апреля 2024 (UTC)
- Изначально плохой идеей было делать рабочую группу бессрочной. Но если бессрочная группа в ближайшее время не выдаст результат или вообще никак не ответит или не сформулирует конечные сроки своих выводов, то можно будет подавать новый иск. — Всезнайка (обс.) 12:51, 17 апреля 2024 (UTC)