apache-spark tutorials and guides

How to extract number from string column?

Dec 13, 2019

scala apache-spark apache-spark-sql

In pyspark, is it possible to fillna with another column?

Nov 16, 2022

apache-spark pyspark

filter only not empty arrays dataframe spark [duplicate]

Oct 30, 2022

scala apache-spark apache-spark-sql

How to set up mesos for running spark on standalone OS/X

Nov 18, 2022

macos scala apache-spark mesos

Ungrouping a (key, list(values)) pair in Spark/Scala

Apr 25, 2022

list scala key apache-spark

Filter out rows with NaN values for certain column

Oct 29, 2022

scala apache-spark apache-spark-sql

How to connect to Amazon Redshift or other DB's in Apache Spark?

Aug 23, 2018

amazon-web-services amazon-s3 apache-spark amazon-redshift

Spark Shell stuck in YARN Accepted state

Feb 24, 2022

hadoop apache-spark hadoop-yarn emr

Calculate a grouped median in pyspark

Nov 14, 2022

apache-spark pyspark apache-spark-sql

spark scala : Convert Array of Struct column to String column

Oct 04, 2020

arrays json scala apache-spark

spark select and add columns with alias

May 30, 2022

scala apache-spark hadoop bigdata

What does withReplacement do, if specified for sample against a Spark Dataframe

Nov 06, 2022

apache-spark

Apache Spark: dealing with Option/Some/None in RDDs

Aug 06, 2022

scala exception apache-spark scala-option

How to access local files in Spark on Windows?

Aug 28, 2022

windows scala apache-spark

GenericRowWithSchema exception in casting ArrayBuffer to HashSet in DataFrame to RDD from Hive table

Jul 04, 2019

scala apache-spark hive apache-spark-sql apache-spark-1.3

Concatenate Sparse Vectors in Spark?

Oct 19, 2022

scala apache-spark

JSON file parsing in Pyspark

Sep 08, 2022

apache-spark dataframe pyspark apache-spark-sql pyspark-sql

How to check if array column is inside another column array in PySpark dataframe

Jun 26, 2022

apache-spark dataframe pyspark apache-spark-sql pyspark-sql

Count number of columns in pyspark Dataframe?

Nov 09, 2022

apache-spark machine-learning pyspark pyspark-sql

How to concatenate/append multiple Spark dataframes column wise in Pyspark?

Jul 02, 2022

python apache-spark pyspark apache-spark-sql pyspark-sql

New posts in apache-spark