Big Data — это структурированные или неструктурированные массивы данных большого объема. Их обрабатывают при помощи специальных софтов, чтобы создать статистику, делать анализ данных, прогнозы и принимать решения. По классической классификации создателя термина Клиффорда Линча к Big Data относят любые данные, объемом от 150 Гб, но единой классификации до сих пор нет.
Данные Биг Дата хранятся в облачных хранилищах, data lake и специальных фреймворках. Получить к ним доступ напрямую могут только крупные компании, а обычный бизнес может арендовать доступ на определенный срок у компаний-посредников и использовать сервисы на их базе. Например,
сервисы на базе ИИ используют Big Data для обработки ваших запросов и обучения.
До начала 2010-х годов Big Data применяли только для научных исследований, но сегодня методику используют любой бизнес, например, для:
- аналитики поведения покупателей,
- прогноза покупок на квартал и больший период,
- поиска низких конверсий в воронке продаж.
Какими могут быть источники данных для Big Data?
- интернет,
- соцсети,
- медиа,
- показания приборов,
- телефонные операторы,
- данные статистики и социологических исследований,
- медицинские данные.