Перейти к основному содержанию
ИТарктика
УДК 004.4
Кораблев Анатолий Юрьевич
руководитель бизнес-инкубатора,
Сыктывкарский государственный университет имени Питирима Сорокина
Разработка системы анализа спортивной статистики
Аннотация:

В статье рассматривается возможность использования больших данных для обработки спортивной статистики. Данная статистика формируется в результате сбора информации при проведении спортивных соревнований с использованием информационной системы.

Ключевые слова: информационная система, большие данные, статистика, спорт..

Современный уровень развития вычислительной техники и основные тренды в области программного обеспечения предполагают обширное использование больших данных. Накопление и статистическая обработка больших данных позволяет оптимизировать бизнес-процессы в различных сферах.

При организации и проведении спортивных соревнований по различным видам спорта накапливается значительный объём статистических данных. На уровне подготовки профессиональных спортсменов такая статистическая информация применяется в качестве информационной базы для построения тренировочного процесса. В то же время в любительском спорте статистика чаще всего остаётся незадействованной.

Автором предлагается разработка автоматизированной системы управления спортивными соревнованиями по виду спорта «Теннис», позволяющей не только оптимизировать бизнес-процессы организации соревнований, но и собирать и анализировать игровую статистику. По результатам анализа статистической информации информационная система предполагает механизм формирования рекомендаций спортсменам для улучшения их игровых качеств.

Формализация статистики

На основании вариантов счёта теннисного матча наиболее удобным выглядит формализация каждого гейма. Для этого построим граф GV,E возможных состояний при розыгрыше каждого очка (Рисунок 1). Множество вершин графа V содержит в себе все возможные варианты счёта одного гейма. Целесообразным является включение в граф V также двух возможных итоговых исходов гейма – «выигрыш подающего» и «выигрыш принимающего». В качестве множества рёбер выбираем все возможные переходы между вариантами счёта.

lkj

Отметим, что полученный граф не в полной мере отражает возможные варианты счёта в теннисном гейме. Известно, что при счёте ровно для победы в гейме нужно выиграть два очка подряд. При этом, вариации счёта с «больше» и «меньше» могут повторяться бесконечное количество раз, поэтому данный факт следует учитывать в дальнейшем анализе.

Рассмотрим вероятности перехода от одного состояния гейма к другому. В случае правил розыгрыша геймов по виду спорта «теннис», из каждого состояния возможно только два варианта перехода. Исключение составляют состояния «выигрыш подающего» и «выигрыш принимающего», которые означают завершение текущего гейма.

Удобной формой представления таких вероятностей будет матрица перехода, где в каждой ячейке будет отображаться вероятность перехода из одного состояния в другое[1]. Обозначим через pv1→v2 вероятность перехода из состояния v1 в состояние v2. В условиях, когда информация о конкретных игроках отсутствует будем считать переходы между состояниями равновероятными, значит pvi→vj=0,5 для всех ненулевых вероятностей.

В каждой строке матрицы содержится по два ненулевых значения, что подтверждает факт того, что из каждого текущего состояния возможен переход только в два последующих состояния.

Таким образом каждый разыгрываемый гейм в матче формализуется при помощи графа возможных состояний и соответствующей ему матрице вероятностей перехода.

Полученная формализация геймов теннисного матча имеет смысл только при анализе достаточно количества статистических данных. В ходе сбора статистики матрица вероятностей перехода будет изменяться.

Выберем некоторое состояние vt. Из данного состояния, согласно графу состояний, возможен переход только в два состояния, обозначим их vi и vj.

При первоначальном построении матрицы перехода все переходы являются равновероятными, то есть pvt→vi=pvt→vj=0,5. Если в некотором матче по ходу гейма состояние vi наступало чаще, чем состояние vj, будем пересчитывать значения вероятностей в матрице вероятностей перехода следующим образом:

df

где pvt→vi и pvt→vj – предыдущие значения вероятностей, pvt→vi' и pvt→vj'  – новые изменившиеся значения вероятностей, ε  – изменение вероятностей.

Приведённый способ формализации теннисного матча в виде построения графа состояний для гейма и формирование матриц вероятностей перехода для конкретных игроков и совместных матриц вероятностей перехода для пар игроков – удобный способ для статистической обработки результатов теннисных матчей.

Однако дальнейшее использование данного аппарата для выработки рекомендаций ограничивается анализом «числовых» значений при полном отсутствии анализа техники конкретного игрока.

Каждое конкретное разыгрываемое очко, выигранное или проигранное теннисистом, можно классифицировать с точки зрения техники исполнения ударов по нескольким параметрам.

  1. Вид выигранного очка
    1. Собственные действия
    2. Ошибка соперника
  2. Вид удара
    1. Удар справа (форхенд)
    2. Удар слева (бекхенд)
  3. Место удара
    1. Удар с отскока
    2. Удар слёта
  4. Конкретизация технического исполнения удара
    1. Плоский
    2. Кручёный (топспин)
    3. Резаный
  5. Направление удара
    1. Диагональ (кросс)
    2. Обратная диагональ (обратный кросс)
    3. Линия
    4. Обратная линия

Данная классификация технических элементов по виду спорта «теннис» не является полной в силу разнообразия татико-технических приёмов современного теннисиста. В зависимости от комбинации указанных и других технических элементов получаются различные удары.

Для первоначального статистического анализа будем использовать только некоторые, наиболее значимые, критерии из приведённого списка: вид выигранного очка, вид удара, направление удара.


dsf

Таким образом, исходя из представленной схемы (Рисунок 2), будем рассматривать 16 возможных вариантов выигрыша очка.

Алгоритм обработки статистических данных

Сформулированная математическая модель розыгрыша каждого очка теннисного матча позволяет на основании статистических данных каждого игрока иметь информацию о выигрыше очка при том или ином счёте тем или иным способом.

После обработки такой информации возможно получение следующих сведений:

  • наиболее успешные варианты розыгрыша гейма с точки зрения счёта;
  • наиболее проблемный счёт для игрока, при котором вероятность выигрыша очка наименьшая;
  • наиболее благоприятный счёт для игрока, при котором вероятность выигрыша очка наибольшая;
  • самое проблемное техническое действие, при котором игрок проигрывает наибольшее количество очков;
  • самое удачное техническое действие, при котором игрок выигрывает наибольшее количество очков.

Фактически, собранная статистика позволяет произвести всестороннюю оценку игровых качеств спортсмена и сделать выводы о необходимости улучшения тех или иных игровых качеств.

В ходе работы алгоритма просматривается статистика и для каждого технического действия при каждом счёте проверяются следующие условия:

  1. Если текущее очко проигрывается с вероятностью более 70% – внести данный счёт в «критический список счёта».
  2. Если данное техническое действие приводит к проигрышу очка с вероятностью более 70% – внести данное действие в «критический список действий».
  3. Если текущее очко выигрывается с вероятностью более 70% – внести данный счёт в «приоритетный список счёта».
  4. Если текущее действие привело к выигрышу очка с вероятностью более 70%  – внести текущее действие в «приоритетный список действий».

В результате после анализа статистики формируется четыре списка: критические списки счёта и действий и приоритетные списки счёта и действий.

Далее списки сортируются и на их основании формируются рекомендации по следующим правилам:

  1. Если счёт попал в «критический список счёта», формируется рекомендация «Быть внимательным при счёте <название счёта>, лучше использовать <действие 1>». При этом <действие 1> выбирается из «Приоритетного списка действий», чтобы по количеству вхождений данное действие было максимальным.
  2. Если техническое действие попало в «критический список действий», формируется рекомендация «Быть внимательным при выполнении действия, лучше использовать <действие 2>». При этом <действие 2> выбирается из «Приоритетного списка действий», чтобы по количеству вхождений данное действие было максимальным.

В результате для каждого счёта и каждого технического действия может быть сформирован перечень рекомендаций. В зависимости от вероятности реализации каждого из действий, указанные рекомендации ранжируются в порядке убывания от наиболее к наименее вероятному.

Проектирование информационной системы

Сформулированный алгоритм обработки статистических данных может быть положен в основу создания информационной системы для управления теннисными турнирами.

При проектировании информационной системы ставятся две группы задач. Первая группа связана с процессом управления теннисными турнирами и включает в себя следующие пункты:

  1. Регистрация и подтверждение участников.
  2. Публикация информации о соревнованиях.
  3. Наполнение турнирных таблиц.
  4. Фиксация результатов матчей.
  5. Формирование отчётов.

Вторая группа задач связана с анализом игровой статистики спортсменов и механизмы формирования рекомендаций и включает в себя:

  1. Формирование статистического профиля каждого игрока.
  2. Применение алгоритма формирования рекомендаций.

Исходя из поставленных задач целесообразно создание модульной клиент-серверной информационной системы, включающей следующие компоненты:

  • модуль обслуживания турниров;
  • модуль обработки статистики и формирования рекомендаций;
  • база данных;
  • web-интерфейс.

Процесс разработки информационной системы проводился с использованием методологии Scrum [2].

Учитывая разработанную архитектуру информационной системы для разработки выбраны Java-технологии:

  • технология Hibernate для взаимодействия с базами данных.

Данная технология позволяет организовать отображение объектной модели Java-приложений в реляционные и объектно-реляционные базы данных. Благодаря использованию технологии Hibernate клиент-серверное приложение может быть развёрнуто на сервере с любыми популярными системами управления базами данных без внесения существенных изменений в исходных код.

  • Фреймворк JAX-RS для создания web-сервисов.

Данный фреймворк позволяет создавать RESTfull web-сервисы на Java.

REST – архитектурный подход, применяющийся при проектировании распределённых приложений. Архитектура REST строится на базе протокола HTTP и преследует следующие цели: расширяемость, унифицированный интерфейс доступа, независимое развертывание компонент[3].

Использование JAX-RS позволяет достигнуть максимальной гибкости и расширяемости проектируемой системы.

  • Технология JSP для формирования интерфейса.

Технология JSP (Java Server Pages) предназначена для формирования статических и динамических web-страниц во взаимодействии с серверной частью системы. К основным преимуществам JSP можно отнести платформонезависимость и расширяемость написаных с применением данной технологии.

Таким образом, в результате спроектирована информационная система, позволяющая не только осуществлять управление теннисными турнирами, но и использовать накопленную игровую статистику в тренировочном процессе с целью улучшения игровых качеств спортсменов.

Список литературы

  1. Подколзин, А. С.  Компьютерное моделирование логических процессов. Архитектура и языки решателя задач [Текст] / А. С. Подколзин. – Москва : Физматлит, 2008. – 1024 с.
  2. Кораблев, А. Ю. Методология Scrum при подготовке инновационных студенческих проектов [Текст] / А. Ю. Кораблев // Инноцентр. – 2016. – №4(13). – С. 1-6.
  3. Webber, J. REST in Practice: Hypermedia and Systems Architectur [Electronic resource] / J. Webber, S. Parastatidis, I. Robinson. –
    Sebastopol : O'Reilly Media, 2010. – 448 p.

References

  1. Podkolzin, A. S. Computer modeling of logical processes. Architecture and language of the task solver [Text] / A. S. Podkolzin. – Moscow : Fizmatlit, 2008. – 1024 p.
  2. Korablev, A. Yu Scrum Methodology in the preparation of innovative student projects [Text] / A. Yu. Korablev // Innocenter. – 2016. – №4(13). – Р. 1-6.
  3. Webber, J. REST in Practice: Hypermedia and Systems Architectur [Electronic resource] / J. Webber, S. Parastatidis, I. Robinson. –
    Sebastopol : O'Reilly Media, 2010. – 448 p.