дециль в рейтинге по направлению 10 что это
Школа научных коммуникаций
Универcальные наукометрические показатели
Универсальные показатели, которые можно расcчитать для отдельной статьи, для журнала, для авторов и организаций
Количество публикаций [Np]
Описание: Количество публикаций — самый простой наукометрический параметр, определяет продуктивность ученого (коллектива, института, страны). Зависит только от базы данных, от количества проиндексированных в ней документов. Может рассчитываться за все время, либо за определенные сроки. Может вычисляться для отдельных типов публикаций (статьи, монографии, материалы конференций).
Формула: сумма всех публикаций данного автора (коллектива, журнала, организации, страны) за указанный период.
Недостатки: показывает только количество, но не качество публикаций, не позволяет определить важность результатов отдельной научной работы.
Суммарное цитирование [Citation, Статистика цитирования, CI]
Описание: наукометрический показатель, характеризующий востребованность публикаций. Зависит от базы данных, от количества проиндексированных в ней документов. Может рассчитываться за все время, либо за определенные сроки (определенные «временные окна»).
Формула: сумма цитирований всех работ автора (организации), либо отдельной выборки работ, либо для журнала за указанный период.
Недостатки: не учитывает количество статей и качество отдельных работ. Данный параметр может быть очень большим (десятки или даже сотни тысяч ссылок) за счет публикаций коллабораций (например, препринты о нахождении бозона Хигса на Большом адронном коллайдере цитируются десятки тысяч раз), что не может конкурировать с цитированием обычных статей. Некоторые рейтинги и аналитические инструменты начинают нормировать публикациями с большим количеством авторов или публикации коллабораций.
Суммарная цитируемость без учета самоцитирования
Описание: наукометрический показатель, характеризующий востребованность публикаций без учета ссылок с работ самого автора (организации). В остальном аналогично Суммарному цитированию.
Среднее число цитирований на 1 статью [Среднее число цитирований в расчете на одну публикацию, Citation Impact, Сitations per paper]
Описание: наукометрический показатель, характеризует востребованность статьи, позволяет сравнивать ученых разных возрастных групп, что сложно оценить суммарной цитируемостью.
Формула: CI/NP, сумма ссылок поделенная на количество статей. Для одной статьи — просто количество ссылок. Рассчитывается для автора, организации, группы статей, журналов, страны.
Недостатки: зависит от области знаний и возраста публикации.
Нормализованная цитируемость
[ Normalized Citation Impact, NCI, Mean normalized citation score, Normalized mean citation rate, Crown indicator ]
Описание: наукометрический показатель для сравнения качества публикации. Среднее число цитирований работы нормализуется по среднемировому значению в данной области знаний и в данном календарном году. Единица соответствует среднемировому уровню. При нормализации учитывается область знаний, тип публикации, год издания. Показывает, насколько уровень данной публикации выше или ниже среднего уровня Для публикаций текущего года показатель, как правило, не рассчитывается.
Формула: цитирование данной работы делится на норму, вычисленную как среднее цитирование в мире по данной тематике (области знаний) в год издания работы. Если рассматривается группа статей, то сначала находится нормализованное цитирование каждой отдельной работы, а затем усредняется по группе (среднее алгебраическое). Рассчитывается для автора, организации, группы статей, журналов.
Недостатки и преимущества: с помощью всего одной цифры можно оценить качество публикаций организации или автора, сравнить со среднемировым значением. Наиболее адекватный параметр определения качества публикаций. В некоторых случаях может быть очень сильно завышен. Пример: была обнаружена публикация материалов конференции, которую процитировали 3 раза, но при этом нормализованное цитирование было больше 10, так как сложилась ситуация, что сборники материалов данной научной тематики практически не цитировались. Поэтому резкие выпады, слишком большие/малые значения должны быть рассмотрены отдельно.
Цитируемость, нормализованная по журналу [Journal Normalized Citation Impact, JNCI]
Описание: наукометрический показатель для сравнения качества публикации. Определяется как отношение числа цитирований данной работы к среднему значению по журналу в соответствующем календарном году, с учетом типа публикации. Показывает качество статьи в сравнении со средним уровнем данного журнала.
Показатели сотрудничества [International Collaborations, % International Collaborations]
Описание: наукометрический показатель для определения международной интегрированности. Определяется работами (количеством или процентом от общего количества), написанными в соавторстве с международными партнерами в соответствии с указанным аффеляциями. Показывает вовлеченность в мировое сообщество, часто используют в международных рейтингах.
Процент работ в списке лучших 1 или 10 % работ [% Documents in Top 1/10 %, Highly Cited Papers, Hot Papers] — ранговый индикатор
Описание: наукометрический показатель для определения лучших публикаций, лучших организаций, авторов. Определяется как процент (или количество) публикаций, попавший в лучшие 1 (10) % работ по количеству цитирований, в соответствии со значением показателя «Нормализованное цитирование». Могут выделяться и другие ограничения: попадание в 0,1% или даже 0,01% лучших. В WoS статьи в 1 % называются “Highly Cited Papers”, в 0,1% — “Hot Papers”.
Недостатки: большинство работ больших коллабораций попадают в лучшие 1 % из-за огромного числа цитирований. Отдельным ученым или коллективам практически не возможно написать такие публикации, если в этой области наук действуют коллаборации.
Ранговый метод: данный параметр относиться к ранговым индикаторам. Для его определения делается разбиение упорядоченного списка-рейтинга по нескольким равным долям и соотнесения статьи к определенной доле.
Дециль [Average Percentile] — ранговый индикатор
Описание: наукометрический показатель для сравнения качества публикации. Определяется попаданием данной публикации (группы публикаций) в определенный диапазон показателя «Нормализованное цитирование». Первый дециль соответствует попаданию в 10 % лучших, второй — диапазон 11–20 % и т.д. Для публикаций текущего года показатель не рассчитывается.
Ранговый метод: данный параметр относиться к ранговым индикаторам. Для его определения делается разбиение упорядоченного списка-рейтинга по нескольким равным долям (в данном случае по десяткам процентов) и соотнесения статьи к определенной доле.
Показатели сотрудничества с производством [% Industry Collaborations]
Описание: Процент публикаций, в которых соавторы были с производства
Коэффициент нецитируемости
Описание: наукометрический показатель для определения “бесполезных”, “бесплодных” публикаций. Доля научных работ, которые ни разу не были процитированы, сильно зависит от рассматриваемой области науки. Обычно рассматривают в пятилетнем временном окне.
Все говорят про «высокий хирш», а ты не знаешь, что это? Сейчас всё объясним!
Тем, кто только делает первые шаги в науке, не всегда легко найти информацию об интересующих их понятиях, таких как импакт-фактор, ВКР, индекс цитирования. В новом проекте ITMO.NEWS с помощью коротких карточек объясняет, что к чему. В этот раз эксперт по наукометрии компании «Clarivate Analytics» (владеющей базой Web of Science) Павел Касьянов помог нашему изданию рассказать о том, что такое Индекс Хирша, кто его считает и почему сегодня только его недостаточно, чтобы оценить вклад того или иного исследователя в науку.
Иллюстрация: Дмитрий Лисовский, ITMO.NEWS
1. Что такое индекс Хирша?
2. Как его измеряют?
Индекс Хирша вычисляется по специальной формуле: он равен N, если N работ автора процитировали N и более раз. То есть если 10 работ автора процитировали 10 раз, то и индекс Хирша будет равен 10 (если работ будет 11, но каждую из них процитируют по 10 раз, то индекс все равно будет равен 10). Чтобы посчитать свой Хирш самостоятельно, достаточно отсортировать публикации по цитируемости и, двигаясь по порядку, дойти до последней публикации в списке, у которой цитируемость будет выше ее порядкового номера. Порядковый номер этой публикации и будет равняться индексу Хирша.
3. Кто считает индекс Хирша?
Считает Индекс Хирша практически любая база данных по научному цитированию. И разумеется, значения, выдаваемые различными базами данных, могут различаться, поскольку каждая база рассчитывает его на основании тех материалов, которые она индексирует. В Web of Science, например, вы можете построить отчет по цитированию для любого массива публикаций менее 10 000 документов, и вместе с остальными показателями система покажет вам индекс Хирша.
4. Есть ли защита от накруток показателя?
К сожалению, практически нет. «Накрутить» себе индекс Хирша можно, постоянно ссылаясь на самого себя или же сговорившись с двумя, тремя или более коллегами, которые все время будут цитировать вас, а вы их. Вместе с тем, проверить, не накручен ли таким образом ваш Хирш, сравнительно просто, и это может серьезно ударить по вашей научной репутации. Если вы когда-то активно занимались такой практикой то, даже если однажды вы отказались от нее, всегда можно будет найти ваши старые статьи и понять, что Хирш «накручен».
5. Так означает ли высокий индекс Хирша, что ученый находится на переднем крае науки?
Увы, совсем не обязательно. Помимо «накруток» есть еще ряд проблем.
Во-первых, ученый мог активно работать 20 лет назад, сделать много важных публикаций, которые активно цитировались, но сейчас он практически отошел от дел, однако Хирш у него будет выше, чем у более молодого коллеги, который сейчас совершает открытия.
Во-вторых, ученый, на которого чаще ссылаются, иногда может иметь меньший индекс Хирша, чем куда менее авторитетный исследователь. Дело в методике подсчета: если один автор сделал 12 статей, каждую из которых процитировали 12 раз, то индекс у него будет 12; если же другой автор написал 11 статей, каждую из которых процитировали по 1000 раз (а это, в общем, уже вполне Нобелевский уровень), то Хирш у него все равно будет 11.
6. Можно ли сравнить с помощью индекса Хирша вклад в науку инженера и филолога?
Однозначно нет. И это еще одна проблема Индекса Хирша как инструмента наукометрии. В одних предметных областях частота публикаций и плотность цитирований значительно больше, чем в других, поэтому у генетика Хирш, скорее всего, будет больше, чем у математика, а у химика — больше, чем у историка. По сути, эталон того, как должен расти ваш Хирш, есть только в физике (возможно, потому что Хорхе Хирш сам был физиком). Там считается, что каждый год вашей активной научной деятельности должен приносить +1 к индексу Хирша. Однако археологу, лингвисту или экономисту таких показателей достичь гораздо тяжелее, что вовсе не значит, что они хуже как специалисты.
Структурные характеристики вариационного ряда распределения
8.2. Медиана, квартили, децили
Значения изучаемого признака всех единиц статистической совокупности можно расположить в порядке возрастания (или убывания). В этом случае мы получим ранжированный ряд. Если число единиц совокупности нечетное, то значение признака, находящееся в середине ранжированного ряда, будет являться медианой. Если число единиц совокупности четное, то медианой будет средняя величина из двух значений признака, находящихся в середине ряда.
Пример 8.5. Имеются следующие данные о результатах сдачи экзамена по статистике в студенческой группе:
| Номер студента | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Оценка по статистике | 3 | 4 | 2 | 3 | 4 | 4 | 4 | 3 | 4 | 5 | 5 |
Представим их в виде ранжированного ряда:
| Номер студента | 3 | 1 | 4 | 8 | 2 | 5 | 6 | 7 | 9 | 10 | 11 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Оценка по статистике | 2 | 3 | 3 | 3 | 4 | 4 | 4 | 4 | 4 | 5 | 5 |
Пример 8.6. Имеются данные о цене антоновских яблок в шести магазинах города. Представим их сразу в виде ранжированного ряда:
| Название магазина | «Огонек» | «Маяк» | «Заря» | «Татьяна» | «Ночной» | «Любимый» |
|---|---|---|---|---|---|---|
| Цена яблок, руб. за кг | 40 | 41 | 42 | 44 | 44 | 45 |
В середине ранжированного ряда находятся цены двух магазинов, причем они разные. Медиана определяется как средняя величина из этих значений признака. Она равна 43 руб. [(42 + 44) : 2 = 43].
Способы расчета рассматриваемых структурных показателей зависят от вида вариационного ряда. Рассмотрим их подробнее.
8.2.1. Определение структурных средних в дискретных вариационных рядах
Для определения медианы в дискретных вариационных рядах:
Пример 8.7. Определим медианный стаж сотрудников страховой компании на основе следующих данных:
| Время работы, лет, xi | Число сотрудников, чел., fi | Накопленная частота, Si |
|---|---|---|
| 1 | 5 | 5 |
| 2 | 7 | 12 |
| 3 | 4 | 16 |
| 4 | 9 | 25 |
| 5 | 13 | 38 |
| 6 | 10 | 48 |
| 7 | 16 | 64 |
| 8 | 13 | 77 |
| Итого | 77 | — |
Номер медианы равен
Квартили и децили определяют аналогично медиане: сначала находят их номер, затем среди накопленных частот ищут такую, которая первая равна или превышает порядковый номер показателя, ей соответствует варианта, которая является искомым показателем. Номера квартилей рассчитываются по формулам:
Порядковые номера децилей исчисляются следующим образом:
Определим квартили по данным примера 8.7. Их номера равны:
Аналогично определяются децили. Например, восьмой дециль вычисляется следующим образом:
8.2.2. Определение структурных средних в интервальном вариационном ряду
В интервальных рядах сначала определяют медианный интервал. Для этого так же, как и в дискретных рядах, рассчитывают порядковый номер медианы
Накопленной частоте, которая равна номеру медианы или первая его превышает, в интервальном вариационном ряду соответствует медианный интервал. Обозначим эту накопленную частоту SМе. Непосредственно расчет медианы проводят по формуле:
Пример 8.8. По следующим данным определим медианное значение суммы выданных банками кредитов:
| Сумма выданных кредитов, млн ден. ед. | Количество банков, fi | Накопленная частота, Si. |
|---|---|---|
| 20-40 | 8 | 8 |
| 40-60 | 15 | 23 |
| 60-80 | 21 | 44 |
| 80-100 | 12 | 56 |
| 100-120 | 9 | 65 |
| 120-140 | 7 | 72 |
| 140-160 | 4 | 76 |
| Итого | 76 | — |
т.е. у 50% банков сумма выданных кредитов не превышает 74,286 млн ден. ед.
Далее произведем расчет квартилей и децилей в интервальном вариационном ряду.
Для приведенного интервального ряда необходимо определить:
тогда ей соответствует интервал «40-60», в котором находится первый квартиль;
тогда ей соответствует интервал «100-120», в котором находится третий квартиль;
т.е. у 25% банков сумма выданных кредитов не превышает 54,7 млн ден. ед.;
т.е. у 75% банков сумма выданных кредитов не превышает 102,2 млн ден. ед.
Аналогично квартилям определяем децили. Формулы, используемые в ходе расчетов, поместим в таблицу.



















следовательно SQ6 = 56, этой накопленной частоте соответствует интервал «80-100», в котором находится шестой дециль. Величина децильного значения равна:
(млн ден. ед.), т.д. у 60% банков сумма выданных кредитов не превышает 82,7 млн ден. ед.









