Реалізації методів редукції і динамічної візуалізації багатовимірних даних з використання web-технологій

Автори
Відомості

Васильєва Людмила Володимирівна

к. т. н., доцент

vasileva.dgma@gmail.com

Сташкевич Ігор Ігорович

к. е. н., доцент

Донбаська державна машинобудівна академія

stashkevich_dgma@ukr.net

Розглядаються практичні аспекти використання WEB-технологій для динамічної візуалізації багатовимірних даних. Візуалізація даних – це ефективна форма подання інформації, що використовує сучасні комп’ютерні інформаційних технології. Вона дозволяє значно підвищувати ефективність сприйняття інформації. Обґрунтовується необхідність використання методів візуалізації в аналітиці великих даних та WEB технологій для їх реалізації.

Основною ідеєю методів редукції є відображення багатовимірних даних у простір малої вимірності шляхом розв’язання задачі візуалізації багатовимірних даних, яке зберігає їх структуру. Це дозволяє виявити велику кількість нових закономірностей та визначити в подальшому методи аналізу цих даних. Термін редукція даних зазвичай відноситься до методів, які можуть пояснити мінливість вихідних багатовимірних даних. Деякі дані просто занадто великі для відображення, а деякі мають занадто короткий термін служби, щоб їх можна було обробляти за допомогою класичних методів візуалізації або аналізу. Аналітика великих даних (Big Data) відіграє ключову роль, зменшуючи обсяг і складність даних в додатках великих даних. Візуалізація – це важливий підхід, що допомагає Big Data отримати повне уявлення про дані і виявити значення даних. Важливим є також можливість взаємодії з ними для користувача [1, 2].

Саме тому аналіз і підвищення ефективності роботи з алгоритмами редукції даних є актуальною темою. Метод головних компонент є одним з найбільш популярних і зручних засобів факторного аналізу і візуалізації багатовимірних даних. Саме тому його було обрано для реалізації у програмному засобі. Використовуючи технологію Web Workers API всі операції завантаження і розрахунків виконуються у фоновому процесі паралельно з роботою браузера. Таким чином можливо підвищити швидкість і уникнути «замороження» сторінки веб-браузеру у момент виконання складних операцій. Графічну частину розроблено за допомогою бібліотеки D3.js і React.js. Приклад основного графіку методу головних компонент – графік власних значень –представлено на Рис. 1.

Рис. 1: Приклад побудованного графіку

Алгоритм карт Кохонена також працює з розробленим раніше методом головних компонент, використовуючи власні вектори з найбільшим значенням для визначення напряму навчання, що дозволяє значно прискорити даний процес. Набір даних не потрібно стандартизувати, це буде зроблено автоматично алгоритмом класу карти Кохонена шляхом масштабування кожної функції до діапазону [0,1]. Використані алгоритми редукції даних показали себе ефективними і мають достатню інформативність в обох випадках і добре підходять для вирішення багатьох проблем розмірності. Подальші наукові пошуки можуть бути спрямовані на удосконалення якості вихідних даних, модифікації візуалізації та оптимізації швидкості і зручності роботи методів редукції багатовимірних даних.

Література

  1. Wang L., Wang G., Alexander C. A. Big data and visualization: methods, challenges and technology progress //Digital Technologies. – 2015. – Т. 1. – №. 1. – С. 33-38.
  2. Hurter C. Image-based visualization: Interactive multidimensional data exploration //Synthesis Lectures on Visualization. – 2015. – Т. 3. – №. 2. – С. 1–127.