У сирих і неструктурованих даних заховані корисні для бізнесу знання. Але витягти їх і правильно застосовувати — непросте і важке завдання. Розбираємося, що це дає компаніям і як роботу зробити легше
Що вивчає Data Science
День у день людство генерує приблизно 2,5 квінтильйона байт різних даних. Вони створюються буквально при кожному кліці і гортанні сторінки, вже не кажучи про відео перегляді і фотографій в онлайн-сервісах і соціальних мережах.
Наука про дані з’явилася перш, як їх обсяги перевищили всі мислимі прогнози. Відлік прийнято вести з 1966 року, коли в світі з’явився Комітет з даних для науки і техніки — CODATA. Його створили в рамках Міжнародної ради з науки, який ставив власною метою збір, оцінку, зберігання і пошук дуже важливих даних для вирішення наукових і технічних завдань. У складі Комітету працюють вчені, професори великих університетів і представники академій наук з декількох країн, включаючи Росію.
Сам термін Data Science увійшов в ужиток в середині 1970-х з подачі данського вченого-Інформатика Петера Наура. Згідно з його визначенням, ця дисципліна вивчає цикл життя цифрових даних від виникнення до застосування в інших областях знань. Але протягом певного часу це визначення стало дуже широким і гнучким, тому якщо бажаете записатись на навчання, переходбте за посиланням https://mainacademy.ua/ua/kursi/data-science-foundation/.
Data Science — DS) — міждисциплінарна область на стику статистики, математики, системного аналізу і машинного навчання, яка охоплює всі робочі етапи з даними. Вона має на увазі дослідження і аналіз дуже великих масивів інформації і спрямована перш за все на отримання практичних результатів.
У 2010-х роках обсяги даних стали зростати по експоненті. Власну роль зіграв великий ряд факторів — від загального поширення мобільного інтернету і популярності соціальних мереж до загальної оцифровки сервісів і процесів. Зрештою спеціальність дата-саєнтиста швидко перетворилася в одну з найбільш затребуваних і популярних. Ще в 2012 році позицію дата-саєнтиста журналісти назвали найсимпатичнішою роботою XXI століття (The Sexiest Job of the XXI Century).
Розвиток Data Science йшло поряд з впровадженням технологій Big Data і аналізу даних. І хоча ці області часто пересічені, їх не слід плутати між собою. Вони всі припускають розуміння великих масивів інформації. Однак якщо аналітика даних відповідає на питання про минуле (наприклад, про зміни в поведінці клієнтів якого-небудь інтернет-сервісу останнім часом), то Data Science в прямому сенсі дивиться в майбутнє. Фахівці з ds на основі великих даних можуть створювати моделі, які віщують, що трапиться на наступний день. У тому числі і віщувати інтерес на ті або інші послуги і товари.
Для чого Data Science бізнесу
Компанії застосовують Data Science не залежно від розмірів бізнесу, показує статистика Kaggle (професійна соціальна мережа фахівців по роботі з даними). А за підрахунками IDC і Hitachi, 78% підприємств підтверджують той факт, що кількість аналізованої і застосовуваної інформації зараз істотно збільшилася. Бізнес розуміє, що неструктурована інформація містить найважливіші для компанії знання, які здатні вплинути на результати бізнесу, відзначають автори дослідження.
Причому це стосується дуже різних сфер економіки. Ось лише пару прикладів галузей, які користуються Data Science для вирішення власних завдань:
- онлайн-торгівля та розважальні сервіси: рекомендаційні системи для користувачів;
- охорона здоров’я: моделювання хвороб та рекомендації щодо збереження здоров’я;
- логістика: планування та оптимізація маршрутів доставки;
- digital-реклама: автоматизоване розміщення контенту та таргетування;
- фінанси: скоринг, виявлення та запобігання шахрайству;
- промисловість: предиктивна аналітика для планування ремонтів і виробництва;
- нерухомість: пошук і пропозиція найбільш підходящих покупцеві об’єктів;
- держуправління: моделювання зайнятості та економічної ситуації, боротьба зі злочинністю;
- спорт: відбір перспективних гравців і розробка стратегій гри.
І це лише найкоротший і поверхневий список застосування Data Science. Кількість різних кейсів із застосуванням «науки про дані» щорічно збільшується в геометричній прогресії.
Кожен інтернет-користувач і просто покупець щодня десятки разів стикається з продуктами і рішеннями, в яких використовуються інструменти Data Science. Наприклад, аудіо-сервіс Spotify застосовує їх, щоб краще підбирати треки для користувачів відповідно до їх смаками. Те ж саме можна сказати про пропозицію фільмів і серіалів на відео-стрімінгах, наприклад як Netflix. А в Uber науку про дані розглядають як інструмент для предиктивної аналітики, прогнозування попиту, поліпшення і автоматизації всіх продуктів і клієнтського досвіду.
Зрозуміло, дата-саєнтисти не можуть точно передбачити майбутнє компанії і взяти до уваги абсолютно всі можливі небезпеки. «Всі моделі неправильні, проте деякі з них корисні», — іронізував з цього приводу Англійський статистик Джордж Бокс. Все таки, інструменти Data Science служать сильною підтримкою для компаній, які хочуть приймати більш поінформовані і правильні рішення про власне майбутнє.