Все буде big data. Як Київстар навчає аналітиків світовому тренду

Все буде big data. Як Київстар навчає аналітиків світовому тренду

15 Вересня 2017
Огляди ринку
icon
557

Світ великих даних настає. А оброблювати їх нема кому. Де потрібні data scientists та як це пов’язано з Вig Data School від Київстар?

Наприкінці липня американська компанія Economic Modeling Specialists International (EMSI) опублікувала дослідження щодо ТОП-10 найзатребуваніших професій майбутнього. Згідно з ним у найближчі 10 років в США найбільше будуть потрібними працівники медицини та сфери інформаційних технологій.

Дві професії в їхньому рейтингу майбутнього посідають аналітики – комп’ютерних систем і ринкових досліджень.

Зважаючи на те, як швидко людство генерує і накопичує дані, потреба цілком виправдана. Згідно з даними IDC, до 2025 року обсяг даних у світі сягне 163 зеттабайт (163 тисячі мільярдів гігабайт), причому більша частина зберігатиметься в корпоративних системах.

Без грамотних методів обробки big data тут не обійтися.

Поняття big data інтерпретується в різних системах відліку у різний спосіб. Проте по суті завдання в тому, щоб навчити машину обробляти такі масиви даних, які безглуздо перебирати руками. Потреби можуть бути різними. Структурувати мільйони записів або обробити їх зі швидкістю в мілісекунди. Або з купи різних параметрів вивудити необхідні та видати прогноз. Або все разом.

Хто пробує працювати з big data в Україні

Хоча в Україні, на відміну від американських прогнозів, офіційні верхні рядки посідають  робочі спеціальності (так стверджує Державна служба зайнятості), поволі тренди аналітики приходять і до нас. Є сфери, в яких вже сформувався попит на big data. Лідери – рітейл, телеком, фінанси та держава. Причина проста: вони мають, що обробляти.

Рітейлери – ті, хто здружився з он-лайном та/або створив для покупців мобільний додаток – працюють над точковим маркетингом. Серед варіантів: сегментувати клієнтів за поведінковим фактором, спрямувати спецпропозицію тим, хто на неї ймовірніше відреагує, сформувати індивідуальну систему бонусів.

Фінансові установи вже понад десять років автоматизують систему оцінки платоспроможності позичальників. «Люди-рентгени» минають – на місці кредитних консультантів сидять милі співробітники, які розважають клієнта, поки система рахує так званий скоринговий бал і дає рекомендацію щодо суми кредиту.

У розпорядженні телеком-операторів – вся активність клієнта, включаючи пересування. На цьому підґрунті вони можуть підібрати для користувача оптимальний персоналізований тариф, надсилати йому інформацію про найближчий центр обслуговування та безліч іншого. Звісно, записи для десятків мільйонів абонентів неможливо обробляти вручну.

Держава долучилася до естафети, створивши єдиний державний портал відкритих даних data.gov.ua. Наприклад, нещодавно на ньому стала доступною інформація щодо бенефіціарів всіх українських компаній. У великих містах намагаються впроваджувати елементи Smart City: аналізують пасажиропотоки для введення нових маршрутів або перепланування старих, експериментують з електронними чергами для розуміння попиту, відкривають бюджети.

З поступовим проникненням он-лайну до інших сфер економіки попит на фахівців data science зростає. Пропозиція ж відстає.

Тому великі компанії йдуть іншим шляхом – самостійно організовують навчання мотивованих аналітиків, відбираючи серед них майбутніх співробітників. Так, компанія Київстар оголосила про початок прийому заявок на другий набір Big Data School.

Навіщо і для кого Київстар організовує школу

За словами керівника відділу аналітичних продуктів Big Data Олега Волошка, для Київстар – це проект «все в одному»:

«В нашій компанії інтенсивно розвивається напрям data science. Проте в Україні фахівців високого рівня поки небагато. Тому, з одного боку, з допомогою школи ми шукаємо найкращих молодих людей до команди. З іншого боку, це є соціальним проектом – хочемо надати талановитим аналітикам шанс на хорошу кар’єру, допомогти їм сформувати спільноту».

Він зазначає, що основною відмінністю школи від інших курсів є спрямованість саме на big data. Масиви, що доводиться обробляти телеком-оператору, вимагають спеціальних навичок окрім основ машинного навчання та програмування мовами R або Python.

«Першою категорією охочих навчатися є студенти. Для них data science – верхівка інтересу, – каже Волошко. – Пробують себе в ній програмісти, які хочуть писати код заради конкретних прогнозів і відчутних результатів. Звісно, математики теж. Загалом, до нас ідуть аналітики, які працюють з масивами даних і хочуть правильно їх інтерпретувати та робити прогнози».

Про відбір

Школа має дві особливості. Перша – навчання безкоштовне. Друга – подати заявку можуть усі охочі. Але місць в кінцевій групі всього двадцять.

«Це побажання наших викладачів, – коментує Олег Волошко. – Вони хочуть віддати час та увагу кожному студентові, щоб навчання дало максимальний результат. Тому ми змушені робити відбір».

Відбір відбувається двома етапами.

Спочатку кандидату приходить тестове завдання, яке потрібно виконати протягом 24 годин. Якщо він впорається із завданням, значить, необхідний мінімум для старту навчання у нього є. Але, за словами Олега, потрібно ще зрозуміти, наскільки людина хоче заглиблюватися в тему, чи готовий віддавати час, чи бачить він себе у сфері. Тому другим етапом кандидат проходить співбесіду.

Так, минулого року заявки подали майже 1000 людей, а на курс пройшли 27.

До та після

За словами керівників школи, майже для всіх студентів навчання стало квитком до нової професії.

Андрію Кручку повідомлення про набір в Big Data School трапилося в Facebook. «Я працював із звітністю та аналітикою, але зовсім на іншому рівні, – говорить він. – Після закінчення школи був впевнений, що можу подавати резюме на посади, пов’язані з машинним навчанням. Так, це були junior-позиції, але я йшов на них підготовленим».

Андрій працює в сервісі он-лайн-кредитування – будує модель скорингу, яка точніше визначає сумлінних клієнтів. Компанія звертається до кредитних бюро, аналізує свою історію роботи з кожним позичальником. На основі методів машинного навчання формується певний скоринговий бал. Після цього ухвалюється рішення видавати чи не видавати людині кредит.

«Часом крім історії спираємося на параметр кількості звернень. Наприклад, людина брала мало кредитів, а запити до кредитного бюро щодо нього надсилалися часто. Це може свідчити про часті відмови, ненадійність людини. Або хтось, використовуючи його дані, подає заявки на кредит», – розповідає Кручко.

За словами Андрія, він не уявляє, що робив би на такій посаді без підготовки школи.

Над завданням скорингу, але з іншого боку, працює інший випускник – Віталій Петренко.

Віталій родом з Вінницької області. Працював в банку, цікавився машинним навчанням. Якось вихідними, читаючи статті із big data, побачив рекламу Big Data School і пройшов відбір. «Рівень завдань був дуже різним, – згадує Віталій. – Іноді в умові було стільки незнайомих слів, що важко було зрозуміти, про що взагалі йдеться. Але в групі всі один одному допомагали. Атмосфера була дружньою, хоч і змагальною».

За підсумками Віталій отримав один з найвищих результатів. А ще – запрошення на роботу в Київстар.

Зараз він – data scientist, встиг попрацювати із десятком проектів. Один з них – скорингові карти для банків і фінансових установ.

«У фінустанов є свої експертні системи із оцінки платоспроможності позичальників. А ми допомагаємо їх поліпшити. Ґрунтуючись на непрямих ознаках, ми можемо визначити, наскільки абонент є сумлінним щодо майбутніх виплат за кредитами. Даємо тільки агрегировану оцінку ризику – абстрактний бал, без персональних даних. Фінустанови враховують це в своїх системах і за допомогою цього ухвалюють остаточне рішення», – пояснює Петренко.

Цього року школа – це 10-денний інтенсив. Він складається з 6 модулів лекцій з домашніми завданнями, а також іспиту та курсового проекту з реальним бізнес-кейсом.

Прийом заявок на навчання в Big Data School від Київстар завершується 5 жовтня.

Теги
icon
557