
Необроблені дані не мають ніякої цінності. Для перетворення й аналізу BigData необхідні інструменти, які надають обсягу інформації корисну структуру.
Зібрані компанією дані є фундаментальним джерелом інформації для будь-якого бізнесу. Витягти те, що шукали своїми силами з величезного масиву не так-то просто і тут на допомогу приходить спеціальний софт.
ЗМІСТ
☑ Apache Hadoop
Найпопулярніший інструмент для BigData. Дозволяє обробляти величезні обсяги даних фреймворк з відкритим вихідним кодом (безкоштовний за ліцензією Apache) працює на потужному обладнанні в дата-центрі.
ОСНОВНІ МОЖЛИВОСТІ
- хмарна інфраструктура;
- підтримують інші моделі роботи фреймворка бібліотеки;
- універсальна модель для обробки – MapReduce;
- розподілена ФС – HDFC, що дозволяє зберігати будь-які типи даних;
- висока масштабованість.
☑ Apache Storm
Розподілений фреймворк реального часу, що підтримує будь-яку МП. Він написаний на Java і Clojure і є повністю безкоштовним. Apache Storm може обробляти та перетворювати потоки даних з різних джерел.
ОСНОВНІ МОЖЛИВОСТІ
- відмовостійкий і масштабований;
- може обробляти один мільйон стобайтових повідомлень в секунду на кожному вузлі;
- інтегрується з будь-якої МП;
- забезпечую обробку кожної одиниці даних (мінімум один раз точно).
☑ RapidMiner
Це крос-платформенний інструмент для обробки BigData з відкритим вихідним кодом. Він об’єднує data science, прогнозну аналітику і технологію машинного навчання, а також пропонує широкий спектр продуктів, що дозволяють створювати нові процеси інтелектуального аналізу даних.
Платформа доступна під різними ліцензіями: безкоштовна дозволяє користувачам використовувати 1 логічний процесор і до 10 000 рядків даних; вартість комерційної версії Rapidminer починається з $2.500 на рік
ОСНОВНІ МОЖЛИВОСТІ
- добре розвинена хмарна інтеграція;
- інтерактивні інформаційні панелі, які легко розшарити;
- інтеграція з клієнтськими базами даних;
- створення та валідація прогнозних моделей;
- різноманітність методів управління даними;
- прогнозна аналітика на основі BigData;
- підтримка клієнт-серверної моделі.
Qubole
ОСНОВНІ МОЖЛИВОСТІ
- хмарна оптимізація;
- гнучкість і простота у використанні;
- движок з відкритим вихідним кодом;
- автоматичне використання процедур для мінімізації повторення ручних дій;
- вбудовані оповіщення та рекомендації, що оптимізують надійність, продуктивність і витрати на обслуговування.
☑ Tableau
Проєкт простий у використанні, може обробляти всі розміри даних, а також вміє візуалізувати дані в реальному часі через web-коннектор.
Tableau пропонує безкоштовну пробну версію. Підписка починається від $ 35 в місяць, в залежності від видання (desktop / server / online).
ОСНОВНІ МОЖЛИВОСТІ
- спільна робота онлайн;
- створення будь-яких типів візуалізації;
- no-code запити;
- просте розшарювання даних для мобільних пристроїв;
- зручне налаштування.
☑ Cassandra
ОСНОВНІ МОЖЛИВОСТІ
- швидка обробка величезних обсягів даних;
- лінійна масштабованість;
- доступ з хмари;
- відсутність єдиної точки відмови;
- автоматична реплікація;
- розподіл даних між дата-центрами.
☑ Apache Spark
ОСНОВНІ МОЖЛИВОСТІ
- продуктивна потокова обробка;
- інтелектуальна система обробки графів;
- автономний кластерний режим;
- стек доступних тематичних бібліотек;
- DataFrame API;
- розгортання в хмарі.
☑ Flink
ОСНОВНІ МОЖЛИВОСТІ
- точні результати;
- відмовостійкість і авто-відновлення після збою;
- підтримка різних адаптерів для зв’язку зі сторонніми системами і джерелами даних;
- гнучкість “віконного” управління.