62  /  97

Сбор данных

Просмотров: 21521
Дата последнего изменения: 23.09.2021
Сложность урока:
1 уровень - интуитивно все понятно из интерфейса, но почитать стоит.
1
2
3
4
5

  Сбор данных

Изначально сложно сказать какая информация будет вам нужна, какая нет. Поэтому рекомендуем собирать всё.

Где собирать информацию? Хиты на сайте - логи, события, привязанные к cookie (человеку) через "счетчик". Использовать логи работы, мультиканальность, если надо понять как люди движутся между вашими системами.

Допустим, собираем данные о покупателе магазина, всё что есть: пол, возраст, статус, пути на сайте, обращения в техподдержку, счетчики (клики, звонки, обращения), средние данные по счётчикам за квартал, месяц, день. То есть нужно собрать информацию о том, что в динамике делает пользователь.

В контексте системного администрирования, эксплуатации, нужно собирать метрики системы, падение которой будет предсказываться:

  • Загрузка процессора user/system (top).
  • Скорость позиционирования диска, % утилизации (iostat –xm 5).
  • Расход ОЗУ, кэш, своп.
  • Время загрузки тестовой страницы API.
  • Входящий, исходящий трафик.
  • LA, число переключений контекстов (vmstat).
  • Другие технические параметры.

Какие метрики критически необходимы? Гарантированной ответ дать крайне сложно, если вообще возможно. Как правило собирается всё, чтобы потом из имеющегося набора получить что-то нужное. Однако последние исследования в области нейронных сетей позволяют решить эту проблему - нейронная сеть сама выделит необходимые метрики для анализа автоматически.

  Пример: что собирает Битрикс в магазине

  • Cookie пользователя,
  • Хэш лицензии,
  • Домен,
  • ID товара,
  • Название товара,
  • Категории товара,
  • ID рекомендации,
  • ряд других.

1
Курсы разработаны в компании «1С-Битрикс»

Если вы нашли неточность в тексте, непонятное объяснение, пожалуйста, сообщите нам об этом в комментариях.
Развернуть комментарии