<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Кирилл Беляев: заметки с тегом рынок труда</title>
<link>https://kirillbelyaev.com/ru/blog/?go=tags/rynok-truda/</link>
<description>о подаче информации, айдентике, интерфейсах и жизненной среде</description>
<author>Кирилл Беляев</author>
<language>ru</language>
<generator>E2 (v3572; Aegea)</generator>

<itunes:owner>
<itunes:name>Кирилл Беляев</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>о подаче информации, айдентике, интерфейсах и жизненной среде</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Разбор визуализации о рынке труда и оцифровке профессий</title>
<guid isPermaLink="false">621</guid>
<link>https://kirillbelyaev.com/ru/blog/?go=all/job-market-digitalisation/</link>
<pubDate>Tue, 16 Oct 2018 23:19:16 +0300</pubDate>
<author>Кирилл Беляев</author>
<comments>https://kirillbelyaev.com/ru/blog/?go=all/job-market-digitalisation/</comments>
<description>
&lt;p&gt;Пока это самый большой мой разбор. Написать его получилось только по частям, публикуя &lt;a href="https://t.me/kirillbelyaev/437"&gt;в телеграм-канале&lt;/a&gt;. Соавтор пересланного решения — &lt;a href="http://revealthedata.com"&gt;Роман Бунин&lt;/a&gt;, без которого я провозился бы раз в 5 дольше, и не факт, что нашёл бы все удачные ходы.&lt;/p&gt;
&lt;h2&gt;Предмет разбора&lt;/h2&gt;
&lt;p&gt;Меня привлекла работа Стива Левина для Аксионс &lt;a href="https://www.axios.com/report-if-you-are-in-a-digitized-jobs-you-earn-more-2509765753.html"&gt;об оцифровке профессий, изменении зарплат и числа рабочих мест в США&lt;/a&gt;:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/axios@2x.png" width="877" height="828" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Привлекла внешней простотой, аккуратностью и тем, что в ней легко копаться. Закопавшись, понял, что она иллюстрирует только заголовок «People in highly digitized jobs earn more...» (Люди с высоко оцифрованный работой зарабатывают больше). Это видно из положения оранжевого и фиолетового облаков стрелок. Мне связь зарплаты с оцифровки очевидна, поэтому полез разбираться, что в визуализации ещё интересного.&lt;/p&gt;
&lt;p&gt;Визуализация построена на данных исследования Брукингского института. Вместе с отчётом &lt;a href="https://www.brookings.edu/research/digitalization-and-the-american-workforce/"&gt;институт опубликовал&lt;/a&gt; визуализации. Можно посмотреть на те же данные под другим углом. Тут акцент на степень оцифровки, но совсем не показаны зарплаты:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/brooking@2x.png" width="1507" height="819" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В формате разбора не успею закопаться в исследование и детали всех визуализаций. Ограничусь работой Стива, то есть срезами оцифровки, зарплат и числа рабочих мест за 2002 и 2016 года. А география, образование, цифровые навыки и прочее останется за скобками.&lt;/p&gt;
&lt;h2&gt;Устройство и ошибки&lt;/h2&gt;
&lt;p&gt;Сразу понять, в чём проблема, было сложно, поэтому формально описал устройство визуализации и перечислил ошибки, которые могу легко объяснить и решить.&lt;/p&gt;
&lt;p&gt;Сначала — &lt;a href="http://blog.infotanka.ru/all/datalab-algorithm-frame-and-axis/"&gt;каркас&lt;/a&gt;. Тут два измерения со степенными шкалами: икс — средняя годовая зарплата, и игрек — число рабочих мест. Каждая стрелка — профессия. Основание стрелки — зарплата и число мест в 2012-м, остриё — в 2016-м.&lt;/p&gt;
&lt;p&gt;Толщина штриха (и размер острия) кодирует число рабочих мест в 2016-м. Число рабочих мест закодировано дважды — положением по игреку и толщиной штриха. Двойное кодирование — рабочее решение, но тут оно выглядит случайностью. Возможно, если толщина штриха будет меняться вслед за изменением числа рабочих месть, падение и рост будут нагляднее.&lt;/p&gt;
&lt;p&gt;В таком каркасе может казаться, что видны изменения, а из-за стрелки — ещё и будущий вектор. Но на деле данные только за два года, что происходило между неизвестно, и тем более — что будет в будущем.&lt;/p&gt;
&lt;p&gt;Из-за того, что толщина стрелок показывает число рабочих мест, индустрии с больши́м числом рабочих привлекают больше внимания. Не проблема, что визуализация это показывает — это реальность, хирургов меньше, чем фасовщиков. Но в таком представлении искажается восприятие — маленькие стрелки не замечаются, даже при большой зарплате. Спорное решение.&lt;/p&gt;
&lt;p&gt;Цвет отвечает за оцифровку профессии на 2016-й, у него три дискретные шага: слабая оцифровка, средняя и сильная. Вижу две проблемы:&lt;/p&gt;
&lt;ol start="1"&gt;
&lt;li&gt;Цвета не ассоциативные и неравномерные по насыщенности — бежевый выглядит менее заметным на фоне ярко-оранжевого, кажется, что тут низшая степень оцифровки. В своей версии возьму оранжевый для высоких значений и голубой для низких. Теплота цвета будет отвечать за «температуру» оцифровки.&lt;/li&gt;
&lt;li&gt;К дискретности тоже вопросы. Она бывает свойством данных из-за низкой точности оборудования, например. Но &lt;a href="https://www.brookings.edu/wp-content/uploads/2017/11/mpp_2017nov15_digitalization_full_report.pdf"&gt;в отчёте&lt;/a&gt;, на который ссылается визуализация, виден разброс:&lt;/li&gt;
&lt;/ol&gt;
&lt;blockquote&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/digital-score@2x.png" width="526" height="350" alt="" /&gt;
&lt;/div&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;В таком случае лучше брать градиент с промежуточными значениями. А если красить вершины стрелки разными цветами, будет видно растёт оцифровка или падает.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Описывая недочёты, я думал, что их исправление улучшит визуализацию. Так сделаны некоторые &lt;a href="http://kirillbelyaev.com/tags/breakdown/"&gt;прошлые разборы&lt;/a&gt;. Умозрительно понимал, что исправления не изменит общую картину, поэтому переделал полностью.&lt;/p&gt;
&lt;h2&gt;Cвой подход&lt;/h2&gt;
&lt;p&gt;Вспомнил работу Нью-Йорк Таймс &lt;a href="www.nytimes.com/interactive/2015/02/23/business/economy/the-changing-nature-of-middle-class-jobs.html"&gt;о профессиях и соотношении полов на рынке труда среднего класса США в 1980 и 2012&lt;/a&gt;. C визуализацией данных тоже помогает насмотрелось, мозг сам вспоминает похожие форматы и структуры данных.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/middle-class-jobs@2x.jpg" width="1452" height="900" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Иду за помощью к Роме, с которым работали в Лаборатории данных. Чтобы пробовать, нужны данные. Нашёл их &lt;a href="https://c24215cec6c97b637db6-9c0895f07c3474f6636f95b6bf3db172.ssl.cf1.rackcdn.com/interactives/2017/metro-digitalization/assets/occs.json"&gt;на странице исследования&lt;/a&gt; на сайте Брукингского института:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/occs-json@2x.jpg" width="635" height="520" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Дальше устраиваем скайп-сессии и обсуждаем идеи вместе, примеряя в табло. Выделяем две основные гипотезы.&lt;/p&gt;
&lt;p&gt;Гипотеза &lt;b&gt;1.0.&lt;/b&gt; Показывать зарплаты &lt;a href="http://datavizproject.com/data-type/slope-chart/"&gt;графиком наклонов (slope chart)&lt;/a&gt; — так называют графики из примера выше. Разбить профессии на группы по одной оси, чтобы упорядочить кашу.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart@2x.png" width="1300" height="602" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Гипотеза &lt;b&gt;2.0.&lt;/b&gt; Смотрю, какие ещё классифицированные графики работают с похожими «вводными» (блок «Input» справа). Показывать зарплаты горизонтальными гантелями (dumbbell plot).&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/same-input@2x.png" width="1270" height="270" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Гантели не работают. По иксу — зарплата. Вершины гантели — зарплаты за 2002 и 2016 года. Но понять, где какой год не получится, потому что зарплата могла как расти, так падать:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/dumbbell@2x.png" width="792" height="525" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;А графики наклонов выглядят перспективно. Тут 2002 всегда слева. Сразу видно, что реальное падение зарплат только у двух профессий — в колонках с номерами 29 и 27:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-10@2x.png" width="1207" height="710" alt="" /&gt;
&lt;/div&gt;
&lt;h2&gt;Проработка&lt;/h2&gt;
&lt;p&gt;Пробуем для оцифровки градиент насыщенности, но с ним ничего не видно. Поэтому вернёмся к комплементарным цветам.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-10-blue@2x.png" width="1280" height="771" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Оказалось, что в данных группы профессий заданы только цифрами (они и видны в колонках сверху). Нахожу соответствие на сайте Аксионс. Переворачиваем всё на 90°, чтобы нормально читать названия групп. Экспериментируем с цветом.&lt;/p&gt;
&lt;p&gt;По иксу — зарплаты, шкала — равномерная. На такой шкале удобно смотреть, насколько быстрее растут ставки высокооплачиваемых специалистов.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-10-green-yellow-red@2x.png" width="1265" height="710" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;А чтобы сравнивать рост ставок удобнее смотреть с логарифмической шкалой. Она показывает процентные изменения:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-10-orange-blue@2x.png" width="1077" height="604" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Логарифмическая шкала нагляднее показыват, что относительно самих себя зарплаты растут более-менее одинаково. Например, одним платят 1000 $, а другим — 5000 $. С инфляцией в США с 2002 по 2016 происходит вот что:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/usa-inflation@2x.png" width="299" height="471" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Чтобы труд не дешевел и не дорожал из-за инфляции, зарплаты должны меняться вслед за инфляцией. В 2002-м зарплат в 1000 должна превратиться в 1023,8 (1000×(100+2,38)/100), в 2003-м 1023,8 — в 1043. И так до 1366,4 $ в 2016-м. А зарплата в 5000 за это время превратится в 6832,1 $. В долях это одно и то же, а в долларах 366,4 $ против 1832,1 $.&lt;/p&gt;
&lt;p&gt;С логшкалой видно, что зарплаты реагируют на изменения в экономике более-менее одинаково — углы наклонов полосок почти одинаковы. А те случаи, где они отличаются, справедливо привлекают внимание — это профессии, к которым «действительно» стали платить больше или меньше.&lt;/p&gt;
&lt;p&gt;Ещё плюс логарифмической шкалы для этой визуализации — данные занимают меньше места по горизонтали.&lt;/p&gt;
&lt;p&gt;Подробнее &lt;a href="revealthedata.com/blog/all/sravnenie-ravnomernoy-logarifmicheskoy-i-stepennoy-shkal"&gt;о шкалах&lt;/a&gt; читайте у Ромы.&lt;/p&gt;
&lt;p&gt;Гипотеза &lt;b&gt;1.1.0.&lt;/b&gt; Агрегировать зарплаты по группам. Идея плохая — теряется куча данных и сглаживаются все аномалии:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-110@2x.png" width="1260" height="653" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Гипотеза &lt;b&gt;1.2.0.&lt;/b&gt; Показывать количество рабочих мест кругами на концах линий. Сначала смотрим на уровне групп. Картина непоказательная:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-120@2x.png" width="1077" height="654" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Гипотеза &lt;b&gt;1.2.1.&lt;/b&gt; Показывать только разницу и оставлять один кружок на том конце линии, который отвечает за год с больши́м числом рабочих мест. Опять не наглядно:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-121@2x.png" width="1076" height="712" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Гипотеза &lt;b&gt;1.2.2.&lt;/b&gt; Может, вместо кружков горизонтальные столбики?&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-122@2x.png" width="405" height="50" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В Табло так не получится. Откладываем идею, но смотрим, что вообще выходит из столбиков. Направление кажется перспективным.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="1280" data-ratio="1.8550724637681"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-122-bars@2x.png" width="1280" height="690" alt="" /&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-122-bars-left@2x.png" width="1280" height="690" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Совмещаем их с заголовками и пробуем красить в зависимости от степени оцифровки. Разноцветные столбики плохо группируются в пары:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-122-bars-cross-strip@2x.png" width="806" height="551" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Убираем цвет. Сортируем по количеству рабочих мест:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="1613" data-ratio="1.5509615384615"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-122-bars-wo-sort@2x.png" width="1613" height="1040" alt="" /&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-122-bars-sort@2x.png" width="1066" height="698" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Теперь столбики сливаются в одну массу. Придумываем красить их попарно цветом, который соответствует среднему между оцифровкой 2002-го и 2016-го. Это нечестные данные, потому что в промежуточные года данные были другими. Такие средние в целом не корректно считать, их нет в природе. Но тут оно помогает показать пары. К тому же у нас и так столбики — агрегация до групп, что тоже не очень корректно. В целом столбики показывают как дела на макроуровне, поэтому оставляем. Добавляем точные значения и подкручиваем цвета:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="1052" data-ratio="1.4235453315291"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-122-bars-color@2x.png" width="1052" height="739" alt="" /&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-122-bars-data@2x.png" width="1052" height="726" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;h2&gt;Чистовая вёрстка&lt;/h2&gt;
&lt;p&gt;Объясняю как устроена строка на примере первой группы. Рисую переключатель сортировки и поиск, который на деле был бы выпадающим списком с фильтром по введённым буквам:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-122-layout@2x.jpg" width="605" height="385" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Переворачиваю таблицу в подсказке, которую видно при наведении на линию. В оригинале значения для разных лет стоят в строке, а сравнивать цифры удобнее в столбиках:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/axios-hover-table@2x.jpg" width="327" height="219" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Гипотеза &lt;b&gt;1.2.1.1.&lt;/b&gt; Возвращаемся к идее показывать на одном из концов линии кружок, который покажет разницу в числе рабочих мест и год, когда было больше. Добавляю кружки и легенду к ним. Кружки выглядят неубедительно, а легенду сложно читать.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/slope-chart-1221@2x.jpg" width="614" height="332" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Снова разбираемся с данными. Оказалось, что неправильно посчитали разницу. А спустя 2-3 попытки понимаем, что показывать разницу в процентах — плохая идея. Проценты считаются от исходного значения. Было 1000 мест, стало — 1100, это +10%. Если было 1100, а стало — 1000, это −9,1%. Количество мест одинаковое, а процентное изменение разное. Сравнивать такое некорректно. Вместо процентов, берём разы. Исхожу из того, что интересуют профессии, в которых были значительные изменения, поэтому предлагаю показывать кружок, только если изменение больше, чем в 1,5 раза.&lt;/p&gt;
&lt;p&gt;Финальный макет, к которому мы пришли через последовательные ответы на четыре основных вопроса и проверкой минимум по два варианта для каждого вопроса.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/job-market-digitalisation@2x.png" width="1360" height="1230" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Рома выложил &lt;a href="http://revealthedata.com/examples/job-digitalisation/"&gt;прототип в Табло&lt;/a&gt;. Помимо описанного, там есть разбивка по образованию:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://kirillbelyaev.com/ru/blog/pictures/job-market-digitalisation-edu@2x.jpg" width="1172" height="575" alt="" /&gt;
&lt;/div&gt;
</description>
</item>


</channel>
</rss>