Published May 22, 2024 | Version v1
Journal article Open

ОБЗОР МЕТОДОВ ОБРАБОТКИ БОЛЬШИХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ APACHE SPARK, БИБЛИОТЕКИ PANDAS И SQL

Description

В данной статье проводится сравнительный анализ трех ключевых технологий в области обработки данных – Apache Spark, Pandas и SQL – с точки зрения их производительности, масштабируемости, гибкости использования и подходящих сценариев применения. Обсуждаются основные качества каждого инструмента, а также оптимальные области их применения, чтобы помочь специалистам по данным и организациям сделать информированный выбор в зависимости от своих уникальных требований. В результате были выявлены ключевые сильные и слабые стороны каждого из рассмотренных методов.

Files

9.pdf

Files (444.8 kB)

Name Size Download all
md5:a7a058e7bbaa1b73c6a95b18bb12110f
444.8 kB Preview Download