для чего логарифмируют данные

Для чего логарифмируют данные

Иногда данные нуждаются в преобразованиях. В частности, потребность в этом возникает, когда в ряду данных одно или несколько данных существенно превышают остальные. Если данные явно несимметричны, то заменяют каждое значение приведенного набора данных логарифмом этого значения с целью упростить статистический анализ. Логарифмирование преобразует «скошенные» (ассимметричные) данные в более симметричные, так как происходит «растягивание» шкалы возле нуля, малые значения, сгруппированные вместе, распределяются вдоль шкалы. В то же время логарифмирование собирает вместе большие значения на правом конце шкалы. Наиболее часто применяют десятичные и натуральные логарифмы. Равным расстояниям на логарифмической шкале соответствует на исходной шкале равные процентные увеличения, а не равные увеличения значений.

Пример. В таблице представлена численность населения (в тыс. чел.) в республиках бывшего СССР в 1976 г.

РоссияУкраинаБелоруссияУзбекистанКазахстан
1346504907593711407914337
ГрузияАзербайджанЛитваМолдавияЛатвия
49545689331538502497
КиргизияТаджикистанАрменияТуркменияЭстония
33683486283425811438

Заменим все значения их десятичными логарифмами. В нижеприведенной таблице вместо численности населения представлены их десятичные логарифмы.

РоссияУкраинаБелоруссияУзбекистанКазахстан
8,137,696,977,157,16
ГрузияАзербайджанЛитваМолдавияЛатвия
6,696,766,526,596,40
КиргизияТаджикистанАрменияТуркменияЭстония
6,536,546,456,416,16

Как мы видим, данные симметрично группируются вокруг среднего значения 6,81.

Источник

Введение в анализ сложности алгоритмов (часть 3)

От переводчика: данный текст даётся с незначительными сокращениями по причине местами излишней «разжёванности» материала. Автор абсолютно справедливо предупреждает, что отдельные темы могут показаться читателю чересчур простыми или общеизвестными. Тем не менее, лично мне этот текст помог упорядочить имеющиеся знания по анализу сложности алгоритмов. Надеюсь, что он окажется полезен и кому-то ещё.
Из-за большого объёма оригинальной статьи я разбила её на части, которых в общей сложности будет четыре.
Я (как всегда) буду крайне признательна за любые замечания в личку по улучшению качества перевода.

Логарифмы

Практическая рекомендация: на соревнованиях алгоритмы часто реализуются на С++. Как только вы проанализировали сложность вашего алгоритма, так сразу можете получить и грубую оценку того, как быстро он будет работать, приняв, что в секунду выполняется 1 000 000 команд. Их количество считается из полученной вами функции асимптотической оценки, описывающей алгоритм. Например, вычисление по алгоритму с Θ( n ) займёт около секунды при n = 1 000 000.

Рекурсивная сложность

Если вы всё же не уверены в этом, то вы всегда можете найти точную сложность путём подсчёта количества инструкций. Примените этот метод к данной функции, чтобы найти её f( n ), и убедитесь, что она линейная (напомню, что линейность означает Θ( n ) ).

Логарифмическая сложность

Одной из известнейших задач в информатике является поиск значения в массиве. Мы уже решали её ранее для общего случая. Задача становится интереснее, если у нас есть отсортированный массив, в котором мы хотим найти заданное значение. Одним из способов сделать это является бинарный поиск. Мы берём средний элемент из нашего массива: если он совпадает с тем, что мы искали, то задача решена. В противном случае, если заданное значение больше этого элемента, то мы знаем, что оно должно лежать в правой части массива. А если меньше — то в левой. Мы будем разбивать эти подмассивы до тех пор, пока не получим искомое.
для чего логарифмируют данные
Вот реализация такого метода в псевдокоде:

Если вы не уверены, что метод работает в принципе, то отвлекитесь и решите вручную какой-нибудь простой пример.

Если вы прочли раздел о логарифмах выше, то такое выражение будет для вас знакомым. Решив его, мы получим:

Практическая рекомендация: улучшение асимптотического времени выполнения программы часто чрезвычайно повышает её производительность. Намного сильнее, чем небольшая «техническая» оптимизация в виде использования более быстрого языка программирования.

Источник

Почему логарифмы так важны в машинном обучении

для чего логарифмируют данные

May 10, 2020 · 4 min read

для чего логарифмируют данные

Если бы вы жили на 10-м этаже, вы бы поднимались по лестнице или пользовались лифтом? Цель в обоих случаях одна: вы хотите вернуться домой после долгого рабочего дня.

Конечно, если вы занятой человек, у которого нет свободного времени для похода в спортзал, лучше воспользоваться лестницей, как упрощённой версией кардиотренировок. Но, если не учитывать это, вы скорее воспользуетесь лифтом.

Давайте возьмём другой пример.

Скажем, вам нужно добраться на работу. На машине это займёт 10 минут без пробок, а пешком — 50 минут.

Вы можете выбрать и л и поездку на машине, или прогулку пешком. Вы хотите попасть в тот же пункт назначения, но вы хотите сэкономить время. На работу вы ходите каждый рабочий день, а не один раз в жизни. В результате вам нужно регулярно принимать это решение.

Вы хотите иметь возможность добираться до работы быстрее, чтобы больше времени проводить с семьёй и друзьями, начать сторонний проект, почитать книгу, посмотреть лекции, которые давно хотели посмотреть.

Вместо того, чтобы тратить так много времени для попадания в одно и то же место, вы захотите использовать машину или автобус, чтобы туда добраться. Таким образом, у вас будет больше времени на другие вещи.

Примеры преимуществ использования логарифма

Использование логарифма — это то же самое: вам нужно найти параметры, минимизирующие функцию потерь, что является одной из основных проблем, которую вы пытаетесь решить в машинном обучении.

Скажем, ваша функция выглядит так:

для чего логарифмируют данные

Возьмём первую производную, получим следующее выражение:

Источник

Блог про HR-аналитику

Сделать репост в соц сети!

четверг, 12 февраля 2015 г.

Логарифмирование переменной: зачем это нужно и как интерпретировать

для чего логарифмируют данные

для чего логарифмируют данные

для чего логарифмируют данные

Это уже ближе к нормальному распределению.
И уравнение регрессии вы считаете для логарифмированной переменной.

Как интерпретировать

16 комментариев:

Эдуард, извините, я по своему примеру. Прологарифмировал стаж по натуральному основанию, распределение стало ближе к нормальному, коэф Колмогорова-Смирнова 0,308

я для вас и написал
и для Ивана
так теперь сделайте регрессионный анализ

пост для понимания ясно написан? или есть вопросы?

1) лог стаж
2) а какую информацию вы собираете при приеме на работу?

А что в лог-стаже вместо пропусков ставить. Или строим регрессию только по уволившимся?

сделайте по уволившимся. выбирайте только уволившихся и по ним делайте лог стажа
Максим, мне важно, чтобы вы сами делали, пробовали на вкус.
Появится опыт, уверенность

Эдуард, я имел ввиду закрывать переменную стаж на сегодняшнее число по тем, кто работает сейчас или оставлять пустой?

Максим, 1) попробуйте писать в одну ветку. 2) я не вижу ваших выводов

мне этого недостаточно

Источник

Продолжаем серию роликов из цикла «А на хрена нам ___?». В этот раз досталось логарифмам. Давайте разберемся зачем они нужны, и обойдемся без простых примеров, таких как загнутая ракушка улитки. Математик Георгий Вольфсон рассказывает о применении логарифмов в реальной жизни.

00:19 Применение в природе

00:44 Что такое логарифм и зачем

02:00 Перевод умножения в сложение

04:25 За какое количество вопросов можно угадать задуманное число?

06:06 Определение зараженных вирусом по методу логарифмов

08:00 Децибелы = логарифм

08:35 Сортировка массива в программировании

для чего логарифмируют данные

Наука | Научпоп

6.1K постов 68.9K подписчиков

Правила сообщества

ВНИМАНИЕ! В связи с новой волной пандемии и шумом вокруг вакцинации агрессивные антивакцинаторы банятся без предупреждения, а их особенно мракобесные комментарии — скрываются.

Основные условия публикации

— Посты должны иметь отношение к науке, актуальным открытиям или жизни научного сообщества и содержать ссылки на авторитетный источник.

— Посты должны по возможности избегать кликбейта и броских фраз, вводящих в заблуждение.

— Научные статьи должны сопровождаться описанием исследования, доступным на популярном уровне. Слишком профессиональный материал может быть отклонён.

— Видеоматериалы должны иметь описание.

— Названия должны отражать суть исследования.

— Если пост содержит материал, оригинал которого написан или снят на иностранном языке, русская версия должна содержать все основные положения.

Не принимаются к публикации

Точные или урезанные копии журнальных и газетных статей. Посты о последних достижениях науки должны содержать ваш разъясняющий комментарий или представлять обзоры нескольких статей.

— Юмористические посты, представляющие также точные и урезанные копии из популярных источников, цитаты сборников. Научный юмор приветствуется, но должен публиковаться большими порциями, а не набивать рейтинг единичными цитатами огромного сборника.

— Посты с вопросами околонаучного, но базового уровня, просьбы о помощи в решении задач и проведении исследований отправляются в общую ленту. По возможности модерация сообщества даст свой ответ.

— Оскорбления, выраженные лично пользователю или категории пользователей.

— Попытки использовать сообщество для рекламы.

— Многократные попытки публикации материалов, не удовлетворяющих правилам.

— Нарушение правил сайта в целом.

Окончательное решение по соответствию поста или комментария правилам принимается модерацией сообщества. Просьбы о разбане и жалобы на модерацию принимает администратор сообщества. Жалобы на администратора принимает @SupportComunity и общество пикабу.

Отвлекусь от логарифмов. Перешёл на Ваш канал, в нём в заглавном ролике узнал об интервью Дудя с Батыгиным, начал смотреть, увлёкся, забыл лечь спать. Офигенные темы: и про космос, и про будущее, и про общение между людьми, и про науку в целом, и про свободу личности. Офигенно. Спасибо Вам. Пойду детям покажу.

@moderator, исправьте, пожалуйста, ошибку в слове «Децибелы» в посте.

Граничные условия при определении давать надо. Как сказано — «логарифм это показатель степени» и вот вам выражение.

Решение этого выражения есть, но впрямую через логарифм его не решить ибо логарифмов отрицательных чисел и отрицательных оснований не существует. По определению логарифма.

Спасибо, это то, что нужно в пол второго ночи)

для чего логарифмируют данные

для чего логарифмируют данные

Проблема простых-близнецов – Алексей Савватеев | Научпоп

В чём заключается одна из самых древних проблем «школьной» математики? Почему она называется «простые-близнецы» и как формулируется? Что утверждает теорема о распределении простых чисел в натуральном ряду? Как продвинулась в этой области современная математика и на какие вопросы ещё предстоит найти ответы математикам будущего?

Рассказывает Алексей Савватеев, математик и матэкономист, доктор физико-математических наук, научный руководитель Кавказского Математического Центра АГУ, ректор Университета Дмитрия Пожарского, профессор МФТИ, научный руководитель ЦДПО РЭШ, ведущий научный сотрудник ЦЭМИ РАН, популяризатор математики среди детей и взрослых.

для чего логарифмируют данные

для чего логарифмируют данные

Молдавские учёные решили проблему, над которой 140 лет бились математики всего мира

Два математика из Молдовы первыми в мире решили алгебраическую проблему, над которой 140 лет размышляли великие ученые мира. Об этом на этой неделе сообщил Технический университет Молдовы (UTM).

«Доктор физико-математических наук Михаил Попа и доктор математических наук Виктор Прикоп первыми в мире нашли решение знаменитой проблемы центра и фокуса, поставленной выдающимся французским математиком Анри Пуанкаре, над которой великие математики мира размышляли более века», — говорится на сайте университета.

Этой проблеме посвятили тысячи работ математики из Франции, России, Беларуссии, Китая, Великобритании, Канады, США и других стран мира. Только в Молдове число работ, посвященных проблеме Пуанкаре, приближается к сотне, отметили в UTM.

Профессор университета Михаил Попа, основатель научной школы алгебры Ли и дифференциальных систем, предложил собственное решение проблемы центра и фокуса, которое привело его к результату, ставшему открытием.

Во время исследований к профессору присоединился его ученик Виктор Прикоп. Вместе они усовершенствовали первоначальную гипотезу в монографии «Проблема центра и фокуса. Алгебраические решения и гипотезы».

Работа была переведена на английский язык и представлена для издания в несколько зарубежных издательств. В итоге лучшие условия предложил издательский дом «Taylor & Francis Group», расположенный в Великобритании и специализирующийся на публикациях научной литературы и журналов.

Где-то всплакнул Гриша Перельман.

Панорама, да не та. И с такими лицами не шутят.

для чего логарифмируют данные

для чего логарифмируют данные

для чего логарифмируют данные

Что такое наука и какие задачи она должна решать? Существует ли музыкальная наука и какими могут быть результаты применения научного метода в этой сфере? Что такое микрохроматика и как она может изменить музыку будущего, расширить возможности её создания и восприятия?

для чего логарифмируют данные

Реставрирую шкаф

Работа не быстрая, поэтому фото до. Нашел в нем тайник, в тайнике фото.
Интересует, что за формула на доске?
Пока ответа не нашлось.
Шкаф в СПБ. Ещё была найдена карта Казани печать старая начало 20 века.

для чего логарифмируют данные

для чего логарифмируют данные

для чего логарифмируют данные

для чего логарифмируют данные

для чего логарифмируют данные

для чего логарифмируют данные

для чего логарифмируют данные

Что, если наш 4D мир станет пятимерным?

Краткая текстовая версия видео:

Мир, в котором мы живем, является четырехмерным. По крайней мере в макро масштабе. В нашем мире 3 пространственных измерения и одно временное. Трехмерность пространства значит, например, то, что мы можем в нем провести три взаимно перпендикулярных координатных осей расположенных под углом 90 градусов. В таком пространстве можно двигаться «влево-вправо», «вперед-назад» и «вверх-вниз».

для чего логарифмируют данные

В трехмерном пространстве мы можем завязать узел. В двумерном пространстве завязать узел невозможно. А еще в трехмерном пространстве стул может стоять только на трех ножках или больше, стул на двух ножках потеряет равновесие и упадет (Речь идет о ножках типа такого, как на фото).

для чего логарифмируют данные

А что будет, если мы добавим еще одно пространственное измерение? То есть представим себе пятимерный мир, 4 пространственных измерения и 1 временное?

В таком мире можно провести еще одну ось перпендикулярную к остальным трем осям под углом 90 градусов. В трехмерном пространстве сделать это невозможно и как-то точно визуализировать я это не могу, так что включайте фантазию.

В пятимерном мире так же добавятся новые направления движения, которые называют «ана-ката», получается: «влево-вправо», «вперед-назад», «вверх-вниз» и «ана»-«ката». Представить себе направление движения ана и ката мы не можем, так же как существо в двумерном мире не может представить себе направления вверх и вниз.

для чего логарифмируют данные

для чего логарифмируют данные

В таком мире можно завязать двумерную сферу на узел, в нашем мире сделать это невозможно, показать, соответственно, тоже нельзя. Ну и стул с тремя ножками не сможет стоять в мире с 4 пространственными измерениями, чтобы он был устойчив потребуется 4 или больше ножек.

Ну хорошо, я понимаю, вы вряд ли Вы читаете это, чтобы узнать о узлах и ножках стула, Вас интересует, что будет с нашим миром, если внезапно в него добавить еще одно измерение, вот так по щелчку пальца «тыц» и добавили еще одно пространственное измерение и вот ты уже в 5 измерении, что с тобой будет?

Если коротко то… умрешь конечно же. А еще Земля станет приплюснутой. Сейчас расскажу как именно умрешь и почему земля станет приплюснутой.

Есть такой закон – закон обратных квадратов, и он тесно связан с размерностью пространства. Возьмем для примера светящий фонарь, интенсивность света в таком случае убывает согласно закону обратных квадратов.

для чего логарифмируют данные

Объект, перемещенный на расстояние в 2 раза большее от источника, получает только четверть той мощности, которую он получал в первоначальном положении. На расстоянии в 3 раза большее от источника – в 9 раз меньше мощности, на расстоянии в 4 раза большее от источника – 16 раз и так далее.

В законе всемирного тяготения сила гравитационного притяжения убывает тоже с квадратом расстояния. В два раза увеличиваем расстояние, сила притяжения уменьшается в 4 раза и так далее. Тоже самое с законом Кулона – сила притяжения или отталкивания заряженных частиц убывает с квадратом расстояния. В 5D мире закон обратных квадратов превращается в закон обратных кубов. Теперь интенсивность света будет падать не с квадратом расстояния, а с кубом расстояния. r^2 в законе Кулона и Законе всемирного тяготения превращается в r^3.

для чего логарифмируют данные

Это все полностью изменит химические элементы из которых мы состоим, некоторые атомы станут нестабильными, радиоактивными, другие наоборот, станут стабильными.

Например, в 5D мире магний был бы благородным газом, а не металлом, то есть некоторые элементы станут менее реактивными, другие более реактивными. Ионизация атомов будет осуществляться при значительно меньших энергиях, да и вообще агрегатное состояние различных элементов будет меняться не так, как в нашем мире, некоторые хим. элементы станут газообразны при комнатной температуре, некоторые затвердеют и такие вот вещи. Думаю, практически бессмысленно вспоминать биологические процессы, благодаря которым мы можем жить, ведь это все поменяется кардинально, мы мгновенно потеряем сознание и умрем, синтез белков, транспортировка различных аминокислот, нейромедиаторов, нервные импульсы, это все либо прекратится, либо изменится до неузнаваемости. Ну и конечно же спектры атомов изменятся, а это значит, что все резко поменяет цвет, что-то станет прозрачным, что-то непрозрачным, да и вообще привычные для нас источники света выглядели бы более тускло из-за r^3, с запахами та же история, правда уже некому будет смотреть и нюхать все это, ведь все живые существа погибнут.

Короче будет происходить полная жесть, что-то будет плавится, что-то превратится в газ, что-то затвердеет, некоторые вещества станут радиоактивными, привычные нам вещи потеряют свои свойства и перестанут работать так, как в нашем мире. Я напомню, что это все в мире, в котором 4 пространственных измерения и одно временное и в котором можно двигаться в направлении ана и ката. Но кроме дополнительного направления появятся также дополнительные степени свободы во вращении. В нашем мире ориентацию тела можно задать тремя углами, в быту это называется «наклон, подъём и поворот», в 5D мире надо представить себе еще 3 дополнительных степени свободы вращения перпендикулярные к 3 вышеупомянутым. Но по идее, на вращение Земли это не должно повлиять, момент импульса сохранится, ведь нужно, чтобы какая-то сила передала момент импульса Земле, чтобы она могла вращаться в какой-то непривычный для нас способ. Конечно Земля изменит свой привычный облик, из-за того, что свойства химических элементов изменятся, но из-за гравитации все должно также удерживаться вокруг центра масс, правда земля довольно быстро вращается, а так как гравитация в 5D мире у нас ослабевает с кубом расстояния, то земля сплюснется и формой будет напоминать что-то типа такого, как на картинке.

для чего логарифмируют данные

Но вообще, появится дополнительное направление, в котором могут двигаться частицы из которых состоит земля, планета начнет превращаться в гиперсферу, представить себе этот процесс, эти метаморфозы которые будут происходить, очень сложно.

для чего логарифмируют данные

Будут ли происходить термоядерные реакции на солнце, тут под вопросом, но изменения явно произойдут. Но вот что забавно – в пятимерном мире нет стабильных орбит. Вот, посмотрите на график, это моделирование классической задачи двух тел, оказывается, что устойчивых орбит в 5D мире нет, тела либо падают друг на друга, либо улетают в бесконечность, поэтому солнечная система, как и все другие системы, разрушится, некоторые тела упадут на другие тела, а некоторые улетят бороздить просторы галактики.

для чего логарифмируют данные

для чего логарифмируют данные

Казалось бы, следуя логике как с законом обратных квадратов, все квадраты в других уравнениях тоже надо заменить на кубы и получается, что формула эквивалентности массы и энергии в пятимерном пространстве будет работать как Е=мс в кубе, но нет, эта формула, как и множество других, не изменятся в пятимерном пространстве, она, как и множество других формул, не зависит от размерности пространства.

для чего логарифмируют данные

Но даже и без этого всего, мир в 5 мерном пространстве изменится настолько, что в нем не сможет существовать жизнь в том виде, в котором существует в четырехмерном пространстве. Вообще, оказывается, четырехмерный мир – самый простой из возможных и одновременно самый оптимальный для существования в нем жизни, стабильных орбит и химии, какой мы ее знаем.

для чего логарифмируют данные

Книга Кипа Торна, «Интерстеллар. Наука за кадром»

Источник


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *